ฉันมีไฟล์ 10 MB ที่มี\uXXXX
ตัวอักษร ฉันจะถอดรหัสสิ่งนี้ด้วย Sublime Text ได้อย่างไร
ตัวอย่าง:
ฉันมีไฟล์ 10 MB ที่มี\uXXXX
ตัวอักษร ฉันจะถอดรหัสสิ่งนี้ด้วย Sublime Text ได้อย่างไร
ตัวอย่าง:
คำตอบ:
มีสองสิ่งที่แตกต่างที่คุณสามารถลองได้ ก่อนอื่นคุณต้องใช้แบบอักษร Unicode ที่รองรับอักขระที่คุณต้องการแสดง ไซต์ใน unicode.org นี้เป็นแหล่งข้อมูลที่ดีและ Google ก็ค่อนข้างมีประโยชน์เช่นเคย หากคุณไม่สนใจการใช้แบบอักษรที่ไม่ใช่แบบ monospace Arial Unicode MS มาพร้อมกับ Windows และมีการครอบคลุมที่ดีพอสมควร ฉันเชื่อว่า Consolas ตัวอักษร monospace ทำเช่นกัน
ประการที่สองระบบปฏิบัติการของคุณต้องได้รับการตั้งค่าให้แสดงตัวอักษรเหล่านั้นซึ่งเป็นระบบที่ทันสมัยที่สุด แต่คุณอาจพบปัญหากับบางรุ่นและการตั้งค่าของ Windows
ใน Sublime ตรวจสอบให้แน่ใจว่าคุณกำลังดูไฟล์ในโหมดที่ถูกต้อง - ลองFile -> Reopen with Encoding -> UTF-8
หรือ... -> UTF-16LE
(หรือBE
คุณสามารถลองทั้งสองอย่าง)
ดังนั้นโดยไม่ทราบว่าเนื้อหาของไฟล์ของคุณถูกสร้างขึ้นมาอย่างไรและรายละเอียดเพิ่มเติมเกี่ยวกับระบบของคุณนั่นเป็นสิ่งที่ดีที่สุดที่ฉันสามารถทำได้ โชคดี!
แก้ไข
จากไฟล์ที่คุณเชื่อมโยงดูเหมือนว่านี่เป็นผลลัพธ์ของโปรแกรม Python 2 เนื่องจากข้อมูลดูเหมือนว่ามีบางรายการที่มีสตริงยูนิโค้ด (ฉันเป็นโปรแกรมเมอร์ Python เนื่องจากมันเกิดขึ้น) ฉันค้นหาโคเดอพ้อยท์สองคู่ที่กล่าวถึงและพวกมันคือไซริลลิกทั้งหมดดังนั้นแบบอักษรสมัยใหม่ใด ๆ ควรจัดการกับมัน ปัญหาคือคุณจะต้องมีโปรแกรมให้อ่านในไฟล์และแปลแต่ละไบต์ ในกรณีที่คุณสนใจสตริงแรกเต็ม (จาก'
ถึง'
) คือ:
Любимаяакциявернулась! ВресторанахЕвразия "" 3 роллапоцене 1 ""! С 9 по 12 сентября! Толькоэти 4 дня! Подробностина evrasia.spb.ru, 88005050145 และ 008
โดยไม่ต้องมีไฟล์ทั้งหมดฉันไม่สามารถแยกสิ่งทั้งหมดให้คุณ แต่ถ้าคุณเป็นโปรแกรมเมอร์ Python คุณควรรู้ว่าต้องทำอย่างไร (ฉันแนะนำให้ใช้ Python 3 การสนับสนุน Unicode นั้นดีกว่า 2.x มาก ) หากไม่พบผู้ที่สร้างไฟล์และขอให้พวกเขาถอดรหัสไบต์สำหรับคุณ