UTF-8 ไม่ใช่ชุดอักขระเพียงการเข้ารหัสสำหรับ Unicode อักขระ 128 ตัวแรกนั้นเหมือนกับ ASCII แต่ต่างกันใน 128 ไบต์ที่สูง ไบต์ที่มีชุดบิตสูง (หรือ> = 0x80) เป็นอักขระส่วนขยายใน ASCII ในขณะที่ใน UTF-8 จะเป็นการระบุไบต์เริ่มต้นของลำดับหลายไบต์ นั่นเป็นกรณีของ 0x93 หรือ 0x94 ด้านบน อย่างไรก็ตามฉันไม่เห็นอะไรแปลก ๆ ในไฟล์ สิ่งเหล่านี้เป็นคำพูดอัจฉริยะหรือคำพูดที่มีรูปแบบที่แตกต่างกันสำหรับการเปิดและปิดคำพูดซึ่งคุณมักจะเห็นเมื่อใช้โปรแกรมแก้ไขข้อความที่หลากหลายเช่น MS Word
แก้ไข
คำถามได้ถูกแก้ไขแล้ว ฉันคิดว่าเป็นเพราะคุณเลือกเครื่องมือที่ไม่ถูกต้อง encode
รายการเมนูมีการเปลี่ยนแปลงการเข้ารหัสถ้าคุณมีการแสดงตัวอักษรที่ไม่ถูกต้อง มันแค่ปฏิบัติตามลำดับไบต์เดียวกันที่อ่านจากดิสก์เป็นการเข้ารหัสอื่น เนื่องจาก ASCII และ UTF-8 มีความแตกต่างกันคุณจะมีลำดับ UTF-8 ที่ไม่ถูกต้องและดูผลลัพธ์ด้านบน คุณต้องเลือกconvert to UTF-8
เพื่อเปลี่ยนไบต์อินพุตทั้งหมด
คุณสับสน ANSI และ ASCII ด้วย ANSI มักจะอ้างถึง Windows-1252 ซึ่งเป็นชุดอักขระที่ใช้ใน Windows ภาษาอังกฤษและภาษายุโรปตะวันตกบางภาษา มันเป็นชุดของ ISO 8859-1 แม้ว่า ISO 8859-1 อาจถูกอ้างถึงว่าเป็น ANSI ISO 8859-1 ยังเป็นรหัส 256 ตัวแรกของ Unicode ดังนั้นจึงเป็นชุดย่อยของ Unicode แต่ไม่เข้ากันได้กับการเข้ารหัส UTF-8 ASCII เป็นชุดอักขระ 7 บิตและเป็นชุดย่อยของ ANSI ซึ่งถูกเข้ารหัสด้วย 8 บิต แต่บางครั้งก็อ้างถึงเป็น ANSI แม้ว่าจะไม่ถูกต้องมาก
https://en.wikipedia.org/wiki/ANSI_character_set
โดยทั่วไปความสัมพันธ์ระหว่างชุดอักขระมีดังนี้
ASCII < ISO 8859-1 < Windows-1252
^
Unicode