2
coreutils ที่ utf ทราบหรือไม่?
เมื่อฉันใช้cutวันนี้ฉันพบว่ามันไม่ได้ใช้อักขระ UTF-8 เป็นตัวละคร แต่เป็น 3 ตัวเพราะความยาว 3 ไบต์ เรื่องนี้ดูเหมือนจะเป็นจริงสำหรับเครื่องมือต่าง ๆ มีรุ่นของcoreutilsUTF-8 ที่ทราบหรือไม่ localeผลลัพธ์ของฉัน: LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8" LC_NUMERIC="en_US.UTF-8" LC_TIME="en_US.UTF-8" LC_COLLATE="en_US.UTF-8" LC_MONETARY="en_US.UTF-8" LC_MESSAGES="en_US.UTF-8" LC_PAPER="en_US.UTF-8" LC_NAME="en_US.UTF-8" LC_ADDRESS="en_US.UTF-8" LC_TELEPHONE="en_US.UTF-8" LC_MEASUREMENT="en_US.UTF-8" LC_IDENTIFICATION="en_US.UTF-8" LC_ALL= นี่คือเมื่อcutไม่ทำงาน echo 哈哈 | cut -c 2- ��哈 ผลลัพธ์ที่ถูกต้องควรเป็น 哈 หากcut -cทำงานกับอักขระหลายไบต์