คำถามติดแท็ก tesseract

13
การประมวลผลภาพเพื่อปรับปรุงความถูกต้องของ tesseract OCR
ฉันใช้ tesseract เพื่อแปลงเอกสารเป็นข้อความ คุณภาพของเอกสารอยู่ในช่วงที่ดุเดือดและฉันกำลังมองหาเคล็ดลับเกี่ยวกับการประมวลผลภาพประเภทใดที่อาจปรับปรุงผลลัพธ์ ฉันสังเกตเห็นว่าข้อความที่มีการจัดเรียงสูง - ตัวอย่างเช่นที่สร้างขึ้นโดยเครื่องแฟกซ์ - เป็นเรื่องยากโดยเฉพาะอย่างยิ่งสำหรับ tesseract ในการประมวลผล - สันนิษฐานว่าขอบหยักเหล่านี้กับตัวอักษรทำให้เกิดความสับสนในอัลกอริทึมการจดจำรูปร่าง เทคนิคการประมวลผลภาพแบบใดที่จะปรับปรุงความแม่นยำ ฉันใช้การเบลอแบบเกาส์เพื่อปรับภาพที่มีตัวอักษรให้เรียบและเห็นการปรับปรุงเล็กน้อย แต่ฉันหวังว่าจะมีเทคนิคเฉพาะที่จะให้ผลลัพธ์ที่ดีกว่า พูดฟิลเตอร์ที่ปรับให้เป็นภาพขาวดำซึ่งจะทำให้ขอบที่ไม่สม่ำเสมอนั้นราบเรียบตามด้วยฟิลเตอร์ที่จะเพิ่มความคมชัดเพื่อทำให้ตัวละครมีความชัดเจนยิ่งขึ้น มีคำแนะนำทั่วไปสำหรับคนที่เป็นมือใหม่ในการประมวลผลภาพหรือไม่?

4
ฉันจะเลือกระหว่าง Tesseract และ OpenCV ได้อย่างไร [ปิด]
ปิด . คำถามนี้เป็นคำถามความคิดเห็นตาม ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบพร้อมข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดให้บริการเมื่อปีที่แล้ว ปรับปรุงคำถามนี้ ฉันเพิ่งมาข้ามTesseractและOpenCV ดูเหมือนว่า Tesseract เป็นเอ็นจิ้น OCR เต็มรูปแบบและ OpenCV สามารถใช้เป็นเฟรมเวิร์กเพื่อสร้างแอปพลิเคชัน / บริการ OCR ฉันลองใช้ Tesseract กับภาพบางภาพและความแม่นยำของมันดูดี ต่อมาฉันเจอบทช่วยสอนง่ายๆเกี่ยวกับการใช้ OpenCV เพื่อดำเนินการ OCR โดยใช้ Python และรู้สึกประทับใจ ในไม่กี่นาทีฉันก็ฝึกระบบเสร็จแล้วและความแม่นยำก็ดี แต่แน่นอนว่าการใช้แนวทางนี้หมายความว่าฉันต้องฝึกระบบของฉันอย่างครอบคลุมโดยใช้ชุดการฝึกอบรมขนาดใหญ่ คำถามเฉพาะของฉันมีดังต่อไปนี้: เราจะเลือกระหว่าง Tesseract และการใช้ OpenCV เพื่อสร้างแอป OCR ที่กำหนดเองได้อย่างไร มีชุดข้อมูลการฝึกอบรมสำหรับ Tesseract สำหรับภาษาต่างๆ OpenCV มีบางอย่างที่คล้ายกันเพื่อที่ฉันจะได้ไม่ต้องเริ่มต้นใหม่เพื่อให้ได้ OCR หรือไม่ อันไหนดีกว่าสำหรับแอปพลิเคชันเชิงพาณิชย์ที่อยากเป็น ข้อเสนอแนะใด ๆ ?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.