มีวิธีง่ายๆในการพิมพ์ทั้งหมดอักขระที่ไม่ใช่ ASCII และหมายเลขบรรทัดที่พวกเขาเกิดขึ้นในไฟล์โดยใช้อรรถประโยชน์บรรทัดคำสั่งเช่นgrep
, awk
, perl
etc?
ฉันต้องการเปลี่ยนการเข้ารหัสของไฟล์ข้อความจาก UTF-8 เป็น ASCII แต่ก่อนที่จะทำเช่นนั้นต้องการแทนที่อักขระทั้งหมดที่ไม่ใช่ ASCII ด้วยตนเองเพื่อหลีกเลี่ยงการเปลี่ยนแปลงอักขระที่ไม่คาดคิดซึ่งเกิดขึ้นจากรูทีนการแปลงไฟล์
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
ที่บิตแรกปิดการเปรียบเทียบ