จะถอดรหัสไฟล์ข้อความที่มีสัญลักษณ์อย่าง \ uXXXX ได้อย่างไร?


1

ฉันมีไฟล์ 10 MB ที่มี\uXXXXตัวอักษร ฉันจะถอดรหัสสิ่งนี้ด้วย Sublime Text ได้อย่างไร

ตัวอย่าง:
ป้อนคำอธิบายรูปภาพที่นี่


คุณควรเชื่อมโยงไปยังไฟล์หรือรูปแบบย่อของมันวางไว้บนge.ttเพราะมันไม่ชัดเจนว่าคุณกำลังพูดถึงอะไร
barlop

@barlop นี่คือตัวอย่าง - pastebin.com/GT6Wtx6z
LA_

คำตอบ:


1

มีสองสิ่งที่แตกต่างที่คุณสามารถลองได้ ก่อนอื่นคุณต้องใช้แบบอักษร Unicode ที่รองรับอักขระที่คุณต้องการแสดง ไซต์ใน unicode.org นี้เป็นแหล่งข้อมูลที่ดีและ Google ก็ค่อนข้างมีประโยชน์เช่นเคย หากคุณไม่สนใจการใช้แบบอักษรที่ไม่ใช่แบบ monospace Arial Unicode MS มาพร้อมกับ Windows และมีการครอบคลุมที่ดีพอสมควร ฉันเชื่อว่า Consolas ตัวอักษร monospace ทำเช่นกัน

ประการที่สองระบบปฏิบัติการของคุณต้องได้รับการตั้งค่าให้แสดงตัวอักษรเหล่านั้นซึ่งเป็นระบบที่ทันสมัยที่สุด แต่คุณอาจพบปัญหากับบางรุ่นและการตั้งค่าของ Windows

ใน Sublime ตรวจสอบให้แน่ใจว่าคุณกำลังดูไฟล์ในโหมดที่ถูกต้อง - ลองFile -> Reopen with Encoding -> UTF-8หรือ... -> UTF-16LE(หรือBEคุณสามารถลองทั้งสองอย่าง)

ดังนั้นโดยไม่ทราบว่าเนื้อหาของไฟล์ของคุณถูกสร้างขึ้นมาอย่างไรและรายละเอียดเพิ่มเติมเกี่ยวกับระบบของคุณนั่นเป็นสิ่งที่ดีที่สุดที่ฉันสามารถทำได้ โชคดี!


แก้ไข

จากไฟล์ที่คุณเชื่อมโยงดูเหมือนว่านี่เป็นผลลัพธ์ของโปรแกรม Python 2 เนื่องจากข้อมูลดูเหมือนว่ามีบางรายการที่มีสตริงยูนิโค้ด (ฉันเป็นโปรแกรมเมอร์ Python เนื่องจากมันเกิดขึ้น) ฉันค้นหาโคเดอพ้อยท์สองคู่ที่กล่าวถึงและพวกมันคือไซริลลิกทั้งหมดดังนั้นแบบอักษรสมัยใหม่ใด ๆ ควรจัดการกับมัน ปัญหาคือคุณจะต้องมีโปรแกรมให้อ่านในไฟล์และแปลแต่ละไบต์ ในกรณีที่คุณสนใจสตริงแรกเต็ม (จาก'ถึง') คือ:

Любимаяакциявернулась! ВресторанахЕвразия "" 3 роллапоцене 1 ""! С 9 по 12 сентября! Толькоэти 4 дня! Подробностина evrasia.spb.ru, 88005050145 และ 008

โดยไม่ต้องมีไฟล์ทั้งหมดฉันไม่สามารถแยกสิ่งทั้งหมดให้คุณ แต่ถ้าคุณเป็นโปรแกรมเมอร์ Python คุณควรรู้ว่าต้องทำอย่างไร (ฉันแนะนำให้ใช้ Python 3 การสนับสนุน Unicode นั้นดีกว่า 2.x มาก ) หากไม่พบผู้ที่สร้างไฟล์และขอให้พวกเขาถอดรหัสไบต์สำหรับคุณ


ขอบคุณสำหรับคำตอบ. ฉันใช้ OSX เวอร์ชันล่าสุดและไม่มีปัญหากับการแสดงอักขระ Unicode ฉันได้เพิ่มตัวอย่างของไฟล์ลงในความคิดเห็นของคำถามของฉัน
LA_

@LA_ ขอบคุณสำหรับลิงค์ที่แก้ไขปัญหา ดูการแก้ไขด้านบนของฉันสำหรับสิ่งที่ต้องทำ
MattDMo

ขอบคุณ ฉันเป็นคนที่สร้างไฟล์ (= มันเป็นจำนวนมากที่ดาวน์โหลดจาก Google App Engine) ฉันได้ค้นพบวิธีการถอดรหัสด้วย Python แต่ฉันก็ยังสนใจถ้าฉันสามารถทำเช่นเดียวกันกับ Sublime (หรือด้วยคอนโซล Python ในตัว)
LA_

@LA_ Sublime Text 3 สร้างขึ้นบน Python 3.3 ดังนั้นสิ่งที่คุณต้องทำคือวางแต่ละสตริงลงในคอนโซลและมันจะแสดงการเข้ารหัสที่ถูกต้อง อย่างไรก็ตามนี่เป็นไปไม่ได้สำหรับไฟล์ 10MB ดังนั้นปลั๊กอินจะทำงานได้ดีขึ้น
MattDMo

ฉันไม่สามารถเข้าถึงข้อความของไฟล์ที่เปิดจากคอนโซลได้หรือไม่
LA_
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.