OCR ฟรีที่ดีกับ GUI สำหรับแก้ไขข้อผิดพลาด? (สำหรับ Windows)


9

ฉันใช้SimpleOCRซึ่งมี GUI ที่ดีสำหรับการแก้ไขข้อผิดพลาด น่าเสียดายที่มันทำผิดพลาดมากมาย! (และทนต่อข้อบกพร่องและข้อ จำกัด อื่น ๆ )

ในทางตรงกันข้ามTesseractนั้นแม่นยำกว่า แต่ไม่มี GUI เลย

คำถามของฉันคือมีโปรแกรม OCR ฟรีสำหรับ Windows ซึ่งมี GUI ที่ดีและอัตราข้อผิดพลาดต่ำหรือไม่ ฉันต้องการให้ไฮไลต์คำที่ต้องสงสัย (ตามความไม่แน่นอนของ OCR ไม่ใช่แค่การตรวจสอบการสะกด) และแสดงคำดั้งเดิม (บิตแมป) ในขณะที่ฉันกำลังแก้ไขคำ OCRed คล้ายกับที่ SimpleOCR ทำ

โอเพ่นซอร์สจะดีที่สุดตามด้วยฟรีแวร์จากนั้นทดลองใช้ / สาธิต / crippleware เป็นทางยาว

ภาพหน้าจอ SimpleOCR แสดง GUI สำหรับแก้ไขข้อผิดพลาด


เป็นไปได้ซ้ำกับซอฟต์แวร์ OCR ฟรี
Sathyajith Bhat

2
@Satya: ข้อกำหนดเฉพาะของฉันแตกต่างจากคำถามนั้น
Hugh Allen

ไม่ฟรีอย่างแน่นอน แต่คุณเคยดู Microsoft Office หรือไม่ มันมาพร้อมกับ OCR (มองหาคุณลักษณะ "Microsoft Office Document Imaging" ในการตั้งค่า)
Vivelin

@horsedrowner: ฉันแค่ลองมัน ความแม่นยำนั้นเทียบเท่ากับ Tesseract แต่ต้องใช้ไฟล์ TIFF ที่มีการตั้งค่า DPI ที่เหมาะสมหรือไม่ทำงานและไม่มีส่วนต่อประสานสำหรับการแก้ไขข้อผิดพลาด OCR
Hugh Allen

@Hugh Allen: มันได้หรือไม่ มันทำงานสวยดีเมื่อฉัน stumbled เมื่อฟังก์ชั่นเมนูบริบทใน OneNote 2007 และผมใช้ไฟล์ภาพแบบสุ่มคัดลอกวางจากเว็บไซต์ ...
Vivelin

คำตอบ:


2

คุณลองgimagereaderหน้า gui ของ Tesseract บ้างหรือ


ฉันเพิ่งลอง (ภายใต้ Windows) และมันไม่ทำงานสำหรับฉัน - กระบวนการออกไปทันทีโดยไม่มีข้อความแสดงข้อผิดพลาด :( ยังไงก็ตามเมื่อดูภาพหน้าจอมันดูเหมือนจะไม่เน้นคำที่คุณกำลังแก้ไขจริง ๆ ลองดูไหม มันได้หรือไม่
Hugh Allen

2

OCRopus :

ซอฟต์แวร์บางส่วนมาจาก Tesseract ซึ่งเป็นเครื่องมือ OCR โอเพ่นซอร์สที่ดีที่สุดที่มีอยู่ในตอนนี้ ในขณะที่โครงการคาดว่าจะเปิดตัวในปลายปีหน้าและจะใช้สำหรับโครงการสแกนหนังสือของ Google ทีมมีแอปพลิเคชันที่น่าสนใจอยู่ในใจ:

  • อินเตอร์เฟสบริการเว็บ
  • PDF, กล้องและหน้าจอ OCR
  • ทำงานร่วมกับเครื่องมือค้นหาเดสก์ท็อป: Beagle, Spotlight, Google Desktop

OCRopus (tm) เป็นระบบการวิเคราะห์เอกสารที่ล้ำสมัยและระบบ OCR ที่มีการวิเคราะห์โครงร่างแบบเสียบได้การจดจำตัวละครแบบเสียบได้การสร้างแบบจำลองภาษาธรรมชาติทางสถิติและความสามารถแบบหลายภาษา

เอ็นจิ้น OCRopus นั้นใช้สองโครงการวิจัย: ตัวจำแนกลายมือประสิทธิภาพสูงที่พัฒนาขึ้นในช่วงกลางทศวรรษที่ 90 และได้รับการปรับใช้โดยสำนักสำรวจสำมะโนประชากรของสหรัฐอเมริกาและวิธีการวิเคราะห์เลย์เอาต์ประสิทธิภาพสูงใหม่

OCRopus ได้รับการพัฒนาโดย Google และมีจุดประสงค์เพื่อการแปลงเอกสารจำนวนมากในปริมาณสูง เราคาดหวังว่ามันจะเป็นระบบ OCR ที่ยอดเยี่ยมสำหรับแอพพลิเคชั่นอื่น ๆ อีกมากมาย ข้อความแสดงแทน ลิงค์:


GOCR

GOCR เป็นโปรแกรม OCR (การรู้จำอักขระด้วยแสง) พัฒนาภายใต้ลิขสิทธิ์ GNU Public มันจะแปลงรูปภาพที่สแกนของข้อความกลับเป็นไฟล์ข้อความ Joerg Schulenburg เริ่มโปรแกรมและตอนนี้นำทีมนักพัฒนา GOCR สามารถใช้กับ front-end ที่แตกต่างกันซึ่งทำให้ง่ายต่อการพอร์ตไปยัง OS และสถาปัตยกรรมที่แตกต่างกัน สามารถเปิดรูปแบบภาพต่าง ๆ มากมายและคุณภาพได้รับการปรับปรุงในชีวิตประจำวัน ข้อความแสดงแทน ข้อความแสดงแทน

ลิงค์:



ทำอย่างใดอย่างหนึ่งที่มี GUI ที่เหมาะสมไปกับพวกเขา
Hugh Allen

1
แก้ไขแล้วตอบคำถามของคุณ .... แต่ฉันจะบอกว่า: "ไม่พวกเขาไม่ได้" แต่ฉันได้ยินเสียง abiword รองรับ OCRopus ( arstechnica.com/open-source/news/2007/08/ … )
Krazy_Kaos

1
+1 สำหรับการเพิ่มภาพหน้าจอเพื่อตอบและสำหรับการตรวจสอบโปรแกรมทั้งสองที่นำเสนอ ...
Kurt Pfeifle

0

นอกจากนี้ยังมีTOPOCR (aka SnapReader) ที่มีตัวตรวจสอบการสะกดคำภายหลังการประมวลผลสำหรับ 11 ภาษา:

SnapReader สามารถใช้สร้างบันทึกย่อที่ค้นหาได้ของคุณเองจากเกือบทุกรูปเอกสาร หรือคุณสามารถใช้เป็นเครื่องมือในการเขียนและสร้างเนื้อหาที่แก้ไขได้ของคุณเองโดยใช้สแกนเนอร์หรือกล้องของคุณและบันทึกผลลัพธ์เป็น HTML หรือ PDF SnapReader ยังสามารถแปลงข้อความเป็นเสียงที่มีคุณภาพสูงมากโดยใช้ Audrey ดังนั้นไม่เพียง แต่คุณสามารถใช้สแกนเนอร์หรือกล้องของคุณเพื่อจับภาพเอกสารคุณยังสามารถใช้เครื่องเล่นเพลงพกพาหรือสมาร์ทโฟนเพื่อ "อ่าน" ได้

ภาพ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.