คำถามติดแท็ก ocr

3
Chroma-Subsampling: วิธีการคำนวณอัตราข้อมูลอย่างถูกต้อง
ฉันมีความยากลำบากในการทำความเข้าใจวิธีการคำนวณอัตราข้อมูลเมื่อยกระดับการสุ่มตัวอย่างด้วยสีในตัวอย่างของภาพ Y'UV: ฉันมีตัวอย่างต่อไปนี้สำหรับการคำนวณ: ความละเอียดของภาพ: 352*288 ความถี่: 25 fps สำหรับ(4: 4: 4)การคำนวณตัวอย่างจะเป็นดังนี้: (352px * 288px) * 3 color channels * 25 fps * 8 bit = 60 825 600 bit/s จนถึงตอนนี้ดีมาก แต่ตอนนี้มาถึง(4: 2: 0) : (352px*288px) * 1.5 color channels * 25 * 8 = 30 412 800 bit/s ตอนนี้พยายามที่จะถ่ายโอนตัวอย่างนี้ไปยังเช่น(4: 1: …

2
การกรองอิมเมจ“ แบบครึ่งโทนสี” สำหรับการประมวลผล OCR
ฉันมีเอกสาร PDF ที่สแกนซึ่งฉันต้องการเพิ่มเลเยอร์ข้อความที่ซ่อนอยู่ดังนั้นฉันสามารถทำดัชนีเอกสาร ฉันใช้ ghostscript tiff output ขาวดำอุปกรณ์ (tiffg4) เพื่อแยกหน้าเป็นภาพ TIFF และนี่คือตัวอย่างของสิ่งที่พวกเขามีลักษณะ: การประมวลผลภาพนี้ด้วย tesseract ไม่ได้ผลลัพธ์ที่ดี การเปลี่ยนเอาต์พุต ghostscript DPI (600, 300, 150, 96) แสดงว่ารูปภาพที่ 96 DPI ให้ผลลัพธ์ที่ดีที่สุดจาก tesseract แต่ก็ยังไม่เป็นที่น่าพอใจ ตอนนี้ฉันคิดว่าจะขอคำแนะนำว่าตัวกรองใดที่จะปรับปรุงภาพนี้สำหรับการประมวลผล OCR ฉันสามารถใช้ imagemagick หรือ numpy / scipy / ndimage
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.