ฉันมีไฟล์ซิปหลายไฟล์ที่มีข้อผิดพลาดในการเข้ารหัสสำหรับ umlauts ภาษาเยอรมัน (äüöÄÜÖß) พวกเขาจะปรากฏใน filename.zip เช่นเดียวกับในไดเรกทอรีและไฟล์รวมดังนี้:
- Fünf = Fu╠ênf
- Räuber = Ra╠êuber
- Überfall = U╠êberfall
และอื่น ๆ ปกติฉันจะใช้ Linux แต่เนื่องจากปัญหานี้ฉันจึงลองใช้ Windows7 VM แต่จะส่งผลให้เกิดการเข้ารหัสแบบเดียวกัน บน Linux ฉันเล่นรอบ ๆ ด้วย convmv และ detox แต่ไม่ประสบความสำเร็จ
เมื่อฉันใช้
- convmv -f iso-8859-1 -t utf8 --replace --notest -r *
ฉันได้รับ "ข้ามไปแล้ว UTF-8"
มีความคิดเห็นเกี่ยวกับเรื่องนี้ไหม?
find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest
นี่ค้นหาไฟล์จาก dir ปัจจุบันไปข้างหน้าและรัน convmv แยกกันในแต่ละไฟล์ ชื่อไฟล์ถูก encoed เป็นรายการ nullterminated