ฉันมีการอ้างอิงของฉันเป็นไฟล์ข้อความที่มีรายการที่มีความยาวและแต่ละคนมีสองฟิลด์ (หรือมากกว่า)
คอลัมน์แรกคือ URL ของการอ้างอิง คอลัมน์ที่สองคือชื่อซึ่งอาจแตกต่างกันเล็กน้อยขึ้นอยู่กับวิธีการทำรายการ เหมือนกันสำหรับฟิลด์ที่สามซึ่งอาจจะมีหรือไม่มีก็ได้
ฉันต้องการระบุ แต่ไม่ลบรายการที่มีเขตข้อมูลแรก (URL อ้างอิง) เหมือนกัน ฉันรู้sort -k1,1 -u
แต่จะลบออกทั้งหมดโดยอัตโนมัติ (ไม่ใช่แบบโต้ตอบ) แต่เป็น Hit แรก มีวิธีแจ้งให้ฉันทราบหรือไม่เพื่อให้ฉันสามารถเลือกได้ว่าจะเก็บรักษาไว้หรือไม่
ในสารสกัดด้านล่างของสามบรรทัดที่มีเขตข้อมูลแรกเหมือนกัน ( http://unix.stackexchange.com/questions/49569/
) ฉันต้องการเก็บบรรทัด 2 ไว้เนื่องจากมีแท็กเพิ่มเติม (เรียงลำดับ CLI) และลบบรรทัด # 1 และ # 3:
http://unix.stackexchange.com/questions/49569/ unique-lines-based-on-the-first-field
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field sort, CLI
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field
มีโปรแกรมที่ช่วยระบุ "รายการที่ซ้ำกัน" ดังกล่าวหรือไม่? จากนั้นฉันสามารถล้างข้อมูลด้วยตนเองโดยการลบบรรทัด # 1 และ # 3 เป็นการส่วนตัวหรือไม่