ฉันมีชุดของไฟล์ข้อความที่มีการเข้ารหัสที่ไม่แน่นอนซึ่งฉันต้องล้างอักขระที่ผิดปกติ ฉันใช้ห้องสมุด chadetของไพธ อนเพื่อพิสูจน์ว่า 87% สอดคล้องกับ ISO-8859-2 แต่พวกเขายังคงมีอักขระที่ไม่สอดคล้องซึ่งป้องกันไม่ให้พวกเขาอ่านเป็น R - อธิบายไว้ในโพสต์ SOนี้ ฉันสงสัยว่ามีวิธีหรือไม่ควรใช้วิธีสั่งแบบบรรทัดคำสั่งเพื่อล้างข้อมูลชุดเหล่านี้และแปลงเป็น UTF-8 โดยที่อักขระที่ไม่ยืนยันใด ๆ จะถูกเปลี่ยนเป็น '~' ขอบคุณมากสำหรับความช่วยเหลือ
iconv: SMKA121212 copy:13:121: cannot convert