13
การประมวลผลภาพเพื่อปรับปรุงความถูกต้องของ tesseract OCR
ฉันใช้ tesseract เพื่อแปลงเอกสารเป็นข้อความ คุณภาพของเอกสารอยู่ในช่วงที่ดุเดือดและฉันกำลังมองหาเคล็ดลับเกี่ยวกับการประมวลผลภาพประเภทใดที่อาจปรับปรุงผลลัพธ์ ฉันสังเกตเห็นว่าข้อความที่มีการจัดเรียงสูง - ตัวอย่างเช่นที่สร้างขึ้นโดยเครื่องแฟกซ์ - เป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับ tesseract ในการประมวลผล - สันนิษฐานว่าขอบหยักเหล่านี้กับตัวอักษรทำให้เกิดความสับสนในอัลกอริทึมการจดจำรูปร่าง เทคนิคการประมวลผลภาพแบบใดที่จะปรับปรุงความแม่นยำ ฉันใช้การเบลอแบบเกาส์เพื่อปรับภาพที่มีตัวอักษรให้เรียบและเห็นการปรับปรุงเล็กน้อย แต่ฉันหวังว่าจะมีเทคนิคเฉพาะที่จะให้ผลลัพธ์ที่ดีกว่า พูดฟิลเตอร์ที่ปรับให้เป็นภาพขาวดำซึ่งจะทำให้ขอบที่ไม่สม่ำเสมอนั้นราบเรียบตามด้วยฟิลเตอร์ที่จะเพิ่มความคมชัดเพื่อทำให้ตัวละครมีความชัดเจนยิ่งขึ้น มีคำแนะนำทั่วไปสำหรับคนที่เป็นมือใหม่ในการประมวลผลภาพหรือไม่?