ฉันกำลังมองหาเครื่องมือที่สามารถสคริปต์แบบออฟไลน์ซึ่งทำให้สามารถค้นหาไฟล์ PDF ที่มีอยู่ได้โดยการเรียกใช้ OCR แทนไฟล์ที่ไม่สามารถค้นหาได้ดั้งเดิมด้วยเวอร์ชันที่ค้นหาได้และสามารถเรียกใช้แบบไม่ต้องใส่ข้อมูลได้
เช่น www.pdfscannerapp.com - ทำสิ่งที่ฉันต้องการ แต่เป็น GUI เท่านั้น - ไม่สามารถใช้สคริปต์ได้
ฉันทราบว่า Evernote ทำให้สามารถค้นหาไฟล์ PDF ได้ แต่พวกเขายังคงสามารถค้นหาได้เฉพาะเมื่ออยู่ใน Evernote
ฉันไม่ได้กำลังมองหา OCR ที่สมบูรณ์แบบแม้แต่ OCR ที่ยอมรับได้ในระดับปานกลางก็ใช้ได้ แต่ฉันต้องการยูทิลิตี้ขนาดเล็กมากกว่าแพ็คเกจซอฟต์แวร์ขนาดใหญ่
(ฉันตระหนักถึงคำถามที่คล้ายกัน แต่แตกต่างกันในโฆษณา: กำลังมองหาซอฟต์แวร์เพื่อสแกนหรือแปลงเป็น PDF ที่ค้นหาได้และสามารถลงนามได้ - แต่ฉันไม่จำเป็นต้องลงชื่อหรือเติม PDF และความต้องการของฉันคือโซลูชันนั้นเป็นสคริปต์)
แก้ไข:
1) ยูทิลิตี้ต่าง ๆ อนุญาตให้แยกข้อความที่มีโครงสร้างอย่างไรก็ตามเพื่อที่จะแยกข้อความจะต้องมี; ฉันส่วนใหญ่หมายถึง PDF ที่ห่อบิตแมปเป็นกรณีที่มี PDF ธรรมดาที่สร้างขึ้นโดยสแกนเนอร์
2) ฉันไม่จำเป็นต้องมองหาวิธีแก้ปัญหาฟรีและฉันยินดีที่จะจ่ายค่าสาธารณูปโภคที่ดีตามที่ฉันต้องการ แต่ฉันไม่ได้มองหาแอปพลิเคชันขนาดใหญ่ที่มีคุณสมบัตินับล้านที่มีคุณสมบัติ OCR แต่ ค่าใช้จ่ายไม่ได้คุ้มค่าที่จะซื้อพวกเขาเพียงแค่สำหรับฟังก์ชั่น OCR
3) ตามที่ระบุไว้ข้างต้นฉันไม่ได้กำลังมองหา OCR ที่สมบูรณ์แบบเพียง OCR ที่ยอมรับได้ในระดับปานกลาง น่าเสียดายที่จากประสบการณ์ของฉัน tesseract ต่ำกว่าเกณฑ์ดังกล่าวจริงๆ ฉันกำหนด "OCR ที่ยอมรับได้ในระดับปานกลาง" OCR ที่สามารถกล่าวได้ว่า OCR เป็นค่าสาธารณูปโภคเพื่อให้มีการรับรู้อย่างน้อยหมายเลขบัญชี (หมายเลขลูกค้า) ได้อย่างถูกต้อง
แก้ไข: "scriptable" หรือ "automatable" นั่นคือสามารถเรียกใช้โดยอัตโนมัติและทำงานแบบอัตโนมัติโดยไม่ต้องใส่ข้อมูลใด ๆ ของมนุษย์