ฉันใช้ Tesseract เป็นเครื่องมือในการแปลงเอกสารข้อความที่พิมพ์ด้วยกล้องมือถือเป็นข้อความ ผลลัพธ์ไม่ดี คุณภาพของภาพดีมากไกลกว่าแฟกซ์มาก แต่ดูเหมือนว่าจะมีการระบุอักขระที่ยากลำบากมาก
ฉันได้ลองเลียนแบบเอกสารเหล่านี้ในเท็กซ์เอดิเตอร์การจับภาพหน้าจอของหน้าต่างและเรียกใช้ผ่าน Tesseract และผลลัพธ์จะดีขึ้นเพียงเล็กน้อยเท่านั้น
นี่ทำให้ฉันเชื่อว่าอาจมีแบบอักษรที่ดีที่สุดสำหรับ Tesseract ฉัน Googled เล็กน้อยและเจอ OCR-A แต่ดูเหมือนว่าต้องมีใบอนุญาต จากนั้นฉันก็พบกับ OCR-A ฟรีทางเลือกใน SourceFourge แต่ดูเหมือนจะไม่ดีกว่า Arial หรือ Courier New
มีแบบอักษรที่ทำงานได้ดีที่สุดกับ Tesseract หรือฉันต้องทำอย่างอื่นเพื่อเพิ่มความแม่นยำของการรู้จำตัวอักษร?