ฉันมีรูปภาพมากกว่า 10,000 ภาพซึ่งมีประมาณ 2000 ซ้ำในรูปแบบอื่น (เช่นใน JPEG, PNG, GIF) ตัวเลขทั้งสองนี้เพิ่มขึ้นทุกวัน ฉันต้องการลบรายการที่ซ้ำกันเหล่านั้นและเพื่อที่ฉันจะต้องรู้วิธีค้นหาพวกเขาก่อน
ความคิดแรกของฉันคือการตรวจสอบพิกเซลภาพและค้นหารูปภาพอื่นที่มีพิกเซลสีเดียวกันในพิกัดเดียวกัน แต่ตัวเลือกนี้ไม่ได้ผลเสมอไป สมมติว่าฉันค้นหาซ้ำ สำหรับวัตถุที่ค้นหาได้ฉันเลือกไฟล์ PNG 8 บิต มันจะค้นหาภาพที่ซ้ำกันทั้งหมด แต่มีเพียง PNG 8 บิตบางครั้ง 8 บิต GIF และ JPEG น้อยมาก (เพราะอัลกอริทึมภาพที่ฉันคิดว่า?)
ความคิดที่สองของฉันคือการทำซ้ำรูปภาพเหล่านั้นทั้งหมดและเปลี่ยนสีใหม่ในจานสีสองสีที่เข้มงวด (สมมติว่าขาวดำ) และทำการสแกนแบบเดียวกันตามที่ระบุข้างต้น ภาพ JPEG อีกครั้งไม่เหมือน 100% กับรูปแบบ PNG หรือ GIF (เหมือนเหตุผลด้านบนใช่หรือไม่)
ความคิดที่สามคือการลดอัตราร้อยละของจำนวนภาพที่ต้องทำความคุ้นเคยและเพิ่มจำนวนสีที่สามารถเปลี่ยนแปลงได้ทำให้เกิดการลบภาพที่ไม่ต้องการ ...
ความคิดใด ๆ