TLDR
คำถามเดิมไม่ชัดเจนและอ่านว่า OP ต้องการเนื้อหาเนื้อหาของไฟล์ที่ไม่ซ้ำใคร ที่แสดงด้านล่าง ในรูปแบบคำถามที่อัปเดตตั้งแต่ตอนนี้ OP กำลังระบุว่าเขา / เธอต้องการทราบว่าเนื้อหาของไฟล์นั้นไม่เหมือนใครหรือไม่
ทดสอบว่าเนื้อหาของไฟล์ไม่ซ้ำกันหรือไม่
คุณสามารถใช้sort
เพื่อยืนยันว่าไฟล์นั้นมีลักษณะเฉพาะหรือมีสิ่งที่ซ้ำซ้อนดังนี้
$ sort -uC input.txt && echo "unique" || echo "duplicates"
ตัวอย่าง
ว่าฉันมีสองไฟล์เหล่านี้:
ไฟล์ตัวอย่างที่ซ้ำกัน
$ cat dup_input.txt
This is a thread 139737522087680
This is a thread 139737513694976
This is a thread 139737505302272
This is a thread 139737312270080
This is a thread 139737203164928
This is a thread 139737194772224
This is a thread 139737186379520
ไฟล์ตัวอย่างที่ไม่ซ้ำกัน
$ cat uniq_input.txt
A
B
C
D
ตอนนี้เมื่อเราวิเคราะห์ไฟล์เหล่านี้เราสามารถบอกได้ว่ามันมีลักษณะเฉพาะหรือมีสิ่งที่ซ้ำกัน:
ทดสอบไฟล์ที่ซ้ำกัน
$ sort -uC dup_input.txt && echo "unique" || echo "duplicates"
duplicates
ทดสอบไฟล์ที่ไม่ซ้ำ
$ sort -uC uniq_input.txt && echo "unique" || echo "duplicates"
unique
คำถามเดิม (เนื้อหาที่ไม่ซ้ำกันของไฟล์)
สามารถทำได้ด้วยเพียงแค่sort
:
$ sort -u input.txt
This is a thread 139737186379520
This is a thread 139737194772224
This is a thread 139737203164928
This is a thread 139737312270080
This is a thread 139737505302272
This is a thread 139737513694976
This is a thread 139737522087680