มีวิธีการค้นหาไฟล์ที่คล้ายกัน (ไม่ซ้ำกัน)?


12

เป้าหมายสุดท้ายของฉันคือการเปลี่ยนรหัสการเขียนใหม่โดยผู้ร่วมงานของฉัน ดังนั้นมีเครื่องมือที่สามารถค้นหาไฟล์ที่แตกต่างกันเพียงไม่กี่คำ?

(แก้ไข: สำหรับ Mac แต่คนอื่น ๆ อาจชอบคำตอบที่ไม่ใช่ Mac ด้วย)


@ แฮร์รี่จากประวัติการแก้ไขฉันคิดว่าคุณโพสต์คำตอบของ Windows ซึ่งถูกลดระดับลงเพราะความต้องการของ Mac เท่านั้นที่ปรากฏ ฉันอยากได้ความต้องการของ Mac ลดลงและดูคำตอบของคุณ (ถ้าเป็นคำตอบที่ไม่ใช่ Mac ที่ดี) เช่นกัน!
Arjan

@Arjan: เสร็จแล้ว
harrymc

สำหรับ Mac ฉันสงสัยว่าสามารถใช้ Spotlight ได้หรือไม่ ฉันสงสัยมัน แต่ถ้าคุณรู้วิธีทำสิ่งต่าง ๆ ใน Spotlight mdfindคำสั่งอาจช่วยเขียนสคริปต์เพื่อทำให้สิ่งต่าง ๆ เป็นไปโดยอัตโนมัติ อย่างไรก็ตามฉันคิดว่ามันจะใช้เมตาดาต้าเสมอ ดังนั้นการค้นหาไฟล์ที่คล้ายกันอาจ จำกัด ประเภทไฟล์ แต่ไม่สามารถค้นหาเนื้อหาไฟล์ได้ ไม่มีซิการ์
Arjan

คำตอบ:


5

Simianทำสิ่งนี้เพื่อซอร์สโค้ดของบางภาษา เป็นการดีที่สุดในการค้นหาการเข้ารหัส copy-n-paste ที่เห็นได้ชัด ดูเหมือนว่าการพัฒนาของมันจะหยุดชะงัก แต่ก็ใช้งานได้ดีพอ


ไม่ได้ช่วยอะไรมาก - ในแอพพลิเคชั่นทางรถไฟที่มีชิ้นส่วนที่คล้ายกันมากบอกเพียงว่าฉันมีสายการพัฒนาที่คล้ายกันเข้าสู่ระบบ
บล็อก

คุณให้ไฟล์ที่ถูกต้องในการวิเคราะห์หรือไม่ development.logคุณอาจจะสนใจเกี่ยวกับแหล่งที่มาของคุณไม่ได้ สำหรับทางรถไฟดูflay rubyforge.org/frs/…
Benjamin Bannier

ใช่ฉันให้ไฟล์ทั้งหมดในแอพทางรถไฟ dir
tig

2

(สำหรับ Windows)

ผลิตภัณฑ์Anti-Twin (ฟรีสำหรับใช้ส่วนตัว) อ้างว่าสามารถทำได้:

หากคุณต้องการให้ Anti-Twin ไม่เพียง แต่ค้นหาไฟล์ที่ซ้ำกันทั้งหมด แต่ยังรวมถึงไฟล์ที่คล้ายกันคุณสามารถลดการจับคู่ขั้นต่ำที่ต้องการจากค่าเริ่มต้น 100% เป็นสูงสุด 60% ฟังก์ชั่นนี้ได้รับการออกแบบมาโดยเฉพาะสำหรับการค้นหาไฟล์ที่เกือบเหมือนกันซึ่งมีการเปลี่ยนแปลงรายละเอียดเพียงเล็กน้อยเท่านั้น Anti-Twin ใช้การค้นหาความคล้ายคลึงกันทันทีที่คุณป้อนค่าต่ำกว่า 100% การเปรียบเทียบความเหมือนจะใช้เวลานานกว่าการค้นหาที่ซ้ำกัน 100% เต็มมาก!

น่าเสียดายที่การค้นหาความคล้ายคลึงกันเป็นส่วนหนึ่งของการเปรียบเทียบแบบไบต์ต่อไบต์เท่านั้นที่เหมาะสมสำหรับไฟล์บางประเภทเนื่องจากความคล้ายคลึงกันสามารถตรวจพบได้เฉพาะเมื่อไฟล์นั้นไม่มีการบีบอัดและไม่เข้ารหัส ไฟล์ที่ไม่บีบอัดเช่นข้อความที่ไม่ฟอร์แมต (.TXT) และ HTML


ฉันบน Mac และทำงานบางสิ่งบางอย่างผ่านไวน์คล้ายคลึงกันหรือสิ่งที่ต้องการที่จะไม่ทำให้ refactoring ง่ายเพียงยาก :)
TIG

@tig: คุณควรระบุสิ่งนี้ในโพสต์ของคุณ ฉันเพิ่มแท็ก mac แล้ว
harrymc

@Arjan: ฉันได้ลบคำตอบนี้ตามที่คุณร้องขอ
harrymc

ถูกต้องแล้ว! ลบ[mac]แท็กออกอีกครั้ง น่าจะเป็น[osx]อย่างไรก็ตาม ;-)
Arjan
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.