ฉันคิดว่าแนวทางที่ดีที่สุดของคุณคือการแปลง PDF เป็นรูปภาพด้วยความละเอียดที่เหมาะสมและมากกว่าการเปรียบเทียบรูปภาพ
เพื่อสร้างภาพจากไฟล์ PDF คุณสามารถใช้ห้องสมุดของ Adobe PDF หรือวิธีการแก้ปัญหาที่วิธีที่ดีที่สุดที่จะไฟล์ PDF แปลงไฟล์
ในการเปรียบเทียบไฟล์ TIFF ที่สร้างขึ้นฉันพบว่า GNU tiffcmp (สำหรับส่วน windows ของGnuWin32 tiff ) และtiffinfoทำได้ดี ใช้ tiffcmp -l และนับจำนวนบรรทัดของเอาต์พุตเพื่อค้นหาความแตกต่าง หากคุณพอใจที่จะมีการเปลี่ยนแปลงเนื้อหาเล็กน้อย (เช่นความแตกต่างของการลบรอยหยัก) ให้ใช้ tiffinfo เพื่อนับจำนวนพิกเซลทั้งหมดจากนั้นคุณสามารถสร้างค่าความแตกต่างเป็นเปอร์เซ็นต์ได้
อย่างไรก็ตามสำหรับทุกคนที่ทำการเปรียบเทียบ PDF อย่างง่ายโดยที่โครงสร้างไม่ได้เปลี่ยนแปลงเป็นไปได้ที่จะใช้ command line diff และละเว้นรูปแบบบางอย่างเช่น GNU diff 2.7:
diff --brief -I xap: -I xapMM: -I / CreationDate -I / BaseFont -I / ID - ไบนารี - ข้อความ
สิ่งนี้ยังคงมีปัญหาที่ไม่สามารถตรวจจับการเปลี่ยนแปลงในชื่อแบบอักษรที่สร้างขึ้นได้เสมอไป