ในฐานะโปรแกรมเมอร์ C ฉันรู้สึกประหลาดใจที่เห็นว่าwc -c
(ซึ่งนับจำนวนไบต์) และwc -m
(ซึ่งนับจำนวนอักขระ) ผลลัพธ์ผลลัพธ์ที่แตกต่างกันมากสำหรับไฟล์ข้อความขนาดยาวของฉัน ฉันได้รับการบอกเสมอว่าsizeof(char)
มี 1 ไบต์
qdii@nomada ~/Documents $ wc -c sentences.csv
102990983 sentences.csv
qdii@nomada ~/Documents $ wc -m sentences.csv
89023123 sentences.csv
คำอธิบายใด ๆ
ดูคำตอบของ @ rici ด้านล่าง ... คุณมีแฟล็ก -m และ -c ของคุณย้อนกลับในคำถามของคุณ (c = bytes, m = ตัวอักษร) ... ผลลัพธ์ตัวอย่างของคุณถูกต้องแล้ว
—
ด่าน