ฉันมีไดเรกทอรีที่มีไฟล์รูปภาพประมาณ 10,000 ไฟล์จากแหล่งภายนอก
ชื่อไฟล์จำนวนมากมีช่องว่างและเครื่องหมายวรรคตอนที่ไม่เป็นมิตรกับ DB หรือเป็นมิตรกับเว็บ ฉันต้องการเพิ่มหมายเลข SKU ต่อท้ายชื่อไฟล์ทุกชื่อ (เพื่อวัตถุประสงค์ด้านการบัญชี) ส่วนมากถ้าไม่ใช่ชื่อไฟล์ส่วนใหญ่จะมีตัวอักษรละตินแบบขยายซึ่งฉันต้องการเก็บไว้เพื่อการทำ SEO (โดยเฉพาะดังนั้นชื่อไฟล์จะแสดงเนื้อหาไฟล์ใน Google Images อย่างถูกต้อง)
ฉันสร้างสคริปต์ทุบตีซึ่งเปลี่ยนชื่อ (คัดลอก) ไฟล์ทั้งหมดเป็นผลลัพธ์ที่ต้องการ สคริปต์ทุบตีจะถูกบันทึกใน UTF-8 หลังจากเรียกใช้แล้วจะมีไฟล์ประมาณ 500 ไฟล์ (ไม่สามารถแปลงไฟล์ ... )
ฉันเรียกใช้convmv -f UTF-8 -t UTF-8ในไดเรกทอรีและพบว่าชื่อไฟล์ 500 ชื่อเหล่านี้ไม่ได้เข้ารหัสใน UTF-8 (Convmv สามารถตรวจจับและละเว้นชื่อไฟล์ที่มีอยู่แล้วใน UTF-8)
มีวิธีที่ง่ายที่ฉันสามารถหาที่เข้ารหัสภาษาที่พวกเขากำลังใช้?
วิธีเดียวที่ฉันสามารถคิดออกเองได้คือการตั้งค่าการเข้ารหัสเทอร์มินัลเป็น UTF-8 จากนั้นวนซ้ำการเข้ารหัสผู้สมัครที่มีโอกาสทั้งหมดด้วย convmv จนกว่าจะแสดงชื่อที่แปลงแล้วว่า 'ถูกต้อง' ฉันไม่มีวิธีที่จะมั่นใจได้ว่าไฟล์ 500 ไฟล์เหล่านี้ทั้งหมดใช้การเข้ารหัสเดียวกันดังนั้นฉันจะต้องทำซ้ำขั้นตอนนี้ 500 ครั้ง ฉันต้องการวิธีการอัตโนมัติมากกว่า 'ดูสิ'