OCR ฟรีที่ดีกับ GUI สำหรับแก้ไขข้อผิดพลาด? (สำหรับ Windows)

ฉันใช้SimpleOCRซึ่งมี GUI ที่ดีสำหรับการแก้ไขข้อผิดพลาด น่าเสียดายที่มันทำผิดพลาดมากมาย! (และทนต่อข้อบกพร่องและข้อ จำกัด อื่น ๆ )

ในทางตรงกันข้ามTesseractนั้นแม่นยำกว่า แต่ไม่มี GUI เลย

คำถามของฉันคือมีโปรแกรม OCR ฟรีสำหรับ Windows ซึ่งมี GUI ที่ดีและอัตราข้อผิดพลาดต่ำหรือไม่ ฉันต้องการให้ไฮไลต์คำที่ต้องสงสัย (ตามความไม่แน่นอนของ OCR ไม่ใช่แค่การตรวจสอบการสะกด) และแสดงคำดั้งเดิม (บิตแมป) ในขณะที่ฉันกำลังแก้ไขคำ OCRed คล้ายกับที่ SimpleOCR ทำ

โอเพ่นซอร์สจะดีที่สุดตามด้วยฟรีแวร์จากนั้นทดลองใช้ / สาธิต / crippleware เป็นทางยาว

ภาพหน้าจอ SimpleOCR แสดง GUI สำหรับแก้ไขข้อผิดพลาด

windows gui ocr

— Hugh Allen
แหล่งที่มา

เป็นไปได้ซ้ำกับซอฟต์แวร์ OCR ฟรี

— Sathyajith Bhat

@Satya: ข้อกำหนดเฉพาะของฉันแตกต่างจากคำถามนั้น

— Hugh Allen

ไม่ฟรีอย่างแน่นอน แต่คุณเคยดู Microsoft Office หรือไม่ มันมาพร้อมกับ OCR (มองหาคุณลักษณะ "Microsoft Office Document Imaging" ในการตั้งค่า)

— Vivelin

@horsedrowner: ฉันแค่ลองมัน ความแม่นยำนั้นเทียบเท่ากับ Tesseract แต่ต้องใช้ไฟล์ TIFF ที่มีการตั้งค่า DPI ที่เหมาะสมหรือไม่ทำงานและไม่มีส่วนต่อประสานสำหรับการแก้ไขข้อผิดพลาด OCR

— Hugh Allen

@Hugh Allen: มันได้หรือไม่ มันทำงานสวยดีเมื่อฉัน stumbled เมื่อฟังก์ชั่นเมนูบริบทใน OneNote 2007 และผมใช้ไฟล์ภาพแบบสุ่มคัดลอกวางจากเว็บไซต์ ...

— Vivelin

คำตอบ:

คุณลองgimagereaderหน้า gui ของ Tesseract บ้างหรือ

— ukanth
แหล่งที่มา

ฉันเพิ่งลอง (ภายใต้ Windows) และมันไม่ทำงานสำหรับฉัน - กระบวนการออกไปทันทีโดยไม่มีข้อความแสดงข้อผิดพลาด :( ยังไงก็ตามเมื่อดูภาพหน้าจอมันดูเหมือนจะไม่เน้นคำที่คุณกำลังแก้ไขจริง ๆ ลองดูไหม มันได้หรือไม่

— Hugh Allen

OCRopus :

ซอฟต์แวร์บางส่วนมาจาก Tesseract ซึ่งเป็นเครื่องมือ OCR โอเพ่นซอร์สที่ดีที่สุดที่มีอยู่ในตอนนี้ ในขณะที่โครงการคาดว่าจะเปิดตัวในปลายปีหน้าและจะใช้สำหรับโครงการสแกนหนังสือของ Google ทีมมีแอปพลิเคชันที่น่าสนใจอยู่ในใจ:

อินเตอร์เฟสบริการเว็บ

PDF, กล้องและหน้าจอ OCR

ทำงานร่วมกับเครื่องมือค้นหาเดสก์ท็อป: Beagle, Spotlight, Google Desktop

OCRopus (tm) เป็นระบบการวิเคราะห์เอกสารที่ล้ำสมัยและระบบ OCR ที่มีการวิเคราะห์โครงร่างแบบเสียบได้การจดจำตัวละครแบบเสียบได้การสร้างแบบจำลองภาษาธรรมชาติทางสถิติและความสามารถแบบหลายภาษา

เอ็นจิ้น OCRopus นั้นใช้สองโครงการวิจัย: ตัวจำแนกลายมือประสิทธิภาพสูงที่พัฒนาขึ้นในช่วงกลางทศวรรษที่ 90 และได้รับการปรับใช้โดยสำนักสำรวจสำมะโนประชากรของสหรัฐอเมริกาและวิธีการวิเคราะห์เลย์เอาต์ประสิทธิภาพสูงใหม่

OCRopus ได้รับการพัฒนาโดย Google และมีจุดประสงค์เพื่อการแปลงเอกสารจำนวนมากในปริมาณสูง เราคาดหวังว่ามันจะเป็นระบบ OCR ที่ยอดเยี่ยมสำหรับแอพพลิเคชั่นอื่น ๆ อีกมากมาย ลิงค์:

GOCR

GOCR เป็นโปรแกรม OCR (การรู้จำอักขระด้วยแสง) พัฒนาภายใต้ลิขสิทธิ์ GNU Public มันจะแปลงรูปภาพที่สแกนของข้อความกลับเป็นไฟล์ข้อความ Joerg Schulenburg เริ่มโปรแกรมและตอนนี้นำทีมนักพัฒนา GOCR สามารถใช้กับ front-end ที่แตกต่างกันซึ่งทำให้ง่ายต่อการพอร์ตไปยัง OS และสถาปัตยกรรมที่แตกต่างกัน สามารถเปิดรูปแบบภาพต่าง ๆ มากมายและคุณภาพได้รับการปรับปรุงในชีวิตประจำวัน

ลิงค์:

GOCR

— Krazy_Kaos
แหล่งที่มา

ทำอย่างใดอย่างหนึ่งที่มี GUI ที่เหมาะสมไปกับพวกเขา

— Hugh Allen

แก้ไขแล้วตอบคำถามของคุณ .... แต่ฉันจะบอกว่า: "ไม่พวกเขาไม่ได้" แต่ฉันได้ยินเสียง abiword รองรับ OCRopus ( arstechnica.com/open-source/news/2007/08/ … )

— Krazy_Kaos

+1 สำหรับการเพิ่มภาพหน้าจอเพื่อตอบและสำหรับการตรวจสอบโปรแกรมทั้งสองที่นำเสนอ ...

— Kurt Pfeifle

นอกจากนี้ยังมีTOPOCR (aka SnapReader) ที่มีตัวตรวจสอบการสะกดคำภายหลังการประมวลผลสำหรับ 11 ภาษา:

SnapReader สามารถใช้สร้างบันทึกย่อที่ค้นหาได้ของคุณเองจากเกือบทุกรูปเอกสาร หรือคุณสามารถใช้เป็นเครื่องมือในการเขียนและสร้างเนื้อหาที่แก้ไขได้ของคุณเองโดยใช้สแกนเนอร์หรือกล้องของคุณและบันทึกผลลัพธ์เป็น HTML หรือ PDF SnapReader ยังสามารถแปลงข้อความเป็นเสียงที่มีคุณภาพสูงมากโดยใช้ Audrey ดังนั้นไม่เพียง แต่คุณสามารถใช้สแกนเนอร์หรือกล้องของคุณเพื่อจับภาพเอกสารคุณยังสามารถใช้เครื่องเล่นเพลงพกพาหรือสมาร์ทโฟนเพื่อ "อ่าน" ได้

ภาพ

— harrymc
แหล่งที่มา