ฉันใช้คำสั่งต่อไปนี้เพื่อตั้งค่าช่วงอักขระ grep สำหรับรหัสเลขฐานสิบหก 0900 (แทนअ) ถึง 097F (แทนव) ฉันจะใช้รหัสเลขฐานสิบหกแทนअและवได้อย่างไร
bzcat archive.bz2 | grep -v '<[अ-व]*\s' | tr '[:punct:][:blank:][:digit:]' '\n' | uniq | grep -o '^[अ-व]*$' | sort -f | uniq -c | sort -nr | head -50000 | awk '{print "<w f=\""$1"\">"$2"</w>"}' > hindi.xml
ฉันได้รับผลลัพธ์ต่อไปนี้:
<w f="399651">और</w>
<w f="264423">एक</w>
<w f="213707">पर</w>
<w f="74728">कर</w>
<w f="44281">तक</w>
<w f="35125">कई</w>
<w f="26628">द</w>
<w f="23981">इन</w>
<w f="22861">जब</w>
...
ฉันแค่ต้องการใช้รหัสเลขฐานสิบหกแทนअและवในคำสั่งด้านบน
หากไม่สามารถใช้รหัสเลขฐานสิบหกได้ฉันสามารถใช้ unicode แทนรหัสเลขฐานสิบหกสำหรับชุดอักขระ ('अ-व') ได้หรือไม่
ฉันใช้ Ubuntu 10.04
-v
ตีความการแข่งขันจากข้อความคำถามของคุณมันก็ดูเหมือนว่าไม่ใช่สิ่งที่คุณต้องการ