ฉันจะแยกข้อความจากภาพได้อย่างไร?


25

ฉันจะแยกข้อความจากภาพได้อย่างไร?

ฉันไม่ได้พูดถึงไฟล์ที่สแกน แต่เป็นรูปหลากหลายในสวนเช่นเมื่อคุณถ่ายภาพกระดานดำในระดับสูงและมันเขียนด้วยลายมืออย่างดี หรือเมื่อคุณถ่ายภาพหน้าจากตำราอาหารและต้องการสูตรในรูปแบบข้อความ

มีซอฟต์แวร์ฟรีและแบบเปิดสำหรับอะไร

ฉันลอง tesseract แล้วผลลัพธ์ก็แย่มาก


ฉันต้องการ OCR ที่รองรับภาษาเบงกาลีและภาษาอังกฤษพร้อมกัน
alhelal

คำตอบ:


26

การกระทำของการสกัดข้อความจากภาพที่เรียกว่าOCRและ Ubuntu มีหน้าวิกิพีเดียที่ทุ่มเทให้กับOCR จากหน้านั้น:

เครื่องมือ OCR ที่มี

ที่เก็บ Ubuntu Universe ประกอบด้วยเครื่องมือ OCR ต่อไปนี้:

  1. gocr - บรรทัดคำสั่ง OCR
  2. fuzzyocr - ปลั๊กอิน spamassassin เพื่อตรวจสอบภาพที่แนบมา
  3. libhocr0 - OCR ภาษาฮิบรู
  4. ocrad - โปรแกรมรู้จำตัวอักษรด้วยแสง
  5. ocrfeeder - การวิเคราะห์เลย์เอาต์เอกสารและระบบรู้จำอักขระด้วยแสง
  6. ocropus - การวิเคราะห์เอกสารและระบบ OCR
  7. Tesseract-OCR

อูบุนตูหลายคนยังมี respositories:

  1. รูปแบบ - ระบบ OCR หลายภาษา

บางแพ็กเกจล้าสมัย แต่สามารถพบแพ็คเกจใหม่ที่ไม่เป็นทางการได้ในAlex_P PPA (เพิ่มรหัส PPA: ppa: alex-p / notesalexp) ถ้าคุณไม่เคยใช้การตรวจสอบสัญญาซื้อขายไฟฟ้ากับวิธีการเพิ่มซอฟต์แวร์จาก PPA

แก้ไข: ตามที่แสดงในความคิดเห็นClara OCRก็มีอยู่เช่นกัน แต่ได้ stuk ที่ Hardy และเว็บไซต์ของพวกเขามี 2009 เป็นปรับปรุงล่าสุด


คุณมีประสบการณ์ในการใช้สิ่งเหล่านี้สำหรับตัวอย่างที่ฉันอธิบายหรือไม่? ฉันกลายเป็นคนขี้ระแวงกับเครื่องมือ ocr ปกติสำหรับพวกเขา หมายเลข 7 ในรายการเป็นสิ่งที่ฉันพยายามและก็แย่มาก
Strapakowsky

ถ้าฉันจำได้ฉันก็ลอง gocr ด้วยผลลัพธ์ที่แย่มาก ๆ หากคุณพยายามประสบความสำเร็จอย่างใดอย่างหนึ่งไวยากรณ์ใดที่คุณใช้ ขอบคุณ
Strapakowsky

ไม่มี แต่อย่างใด! ฉันไม่เคยใส่ใจกับ OCR: D การค้นหา Freshmeat แสดงให้เห็นว่า Clara OCR และ tesseract-ocr;) ( freshmeat.net/search/… )
Rinzwind

ฉันผิดหรือเปล่าถ้าฉันบอกว่าการใช้ OCR ที่ประสบความสำเร็จต้องใช้ความรู้เกี่ยวกับกระบวนการและการตั้งค่าอย่างระมัดระวังเพื่อให้พอดีกับภาพที่จะสแกน? ดังนั้นหากฉันพูดถูกผลลัพธ์ที่ไม่ดีอาจเกิดจากผู้ใช้ไม่ใช่ซอฟต์แวร์
NN

OCRทำงานได้ดีที่สุดถ้าคุณรู้ว่าภาพนั้นถูกสร้างขึ้นอย่างไรและคุณมีความเชี่ยวชาญในการใช้ซอฟต์แวร์ที่คุณใช้ (ซึ่งเป็นเหตุผลที่ฉันไม่เคยใช้มันมาก่อน)
Rinzwind

18

tesseract-ocrจะเป็นอันยิ่งใหญ่เมื่อเทียบกับคนอื่น ๆ sudo apt-get install tesseract-ocrสำหรับการติดตั้งคำสั่งเรียก

tesseract filename.jpg output.txtการใช้งาน

output.txtคำสั่งดังกล่าวจะสร้าง

คุณอาจพิจารณาเลือกภาษาที่เหมาะสม ในกรณีที่คุณจะต้องติดตั้งtesseract-ocr-LANGแพคเกจที่LANGเป็นสามตัวอักษรรหัส ISO 639-2 ภาษา ตอนนี้คุณมี 123 ภาษาใน 18.04 repo จากนั้นใช้ตัวอย่าง:

tesseract mySpanishText.jpg output -l spa

เฮ้ดังนั้นนี่ใช้งานได้ แต่ไม่ถูกต้องหรือฉันอยากบอกว่ามีความแม่นยำ 80-85% เช่นเดียวกับภาพนี้: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpgมันทำให้เกิดความสับสนมากขึ้น $ sign และวงเล็บส่วนใหญ่ วงเล็บเหลี่ยมกลมโค้งทั้งหมดเป็นปัญหาพวกเขาไม่ได้รับการดึงออกมาอย่างเหมาะสม คุณรู้วิธีแก้ไขไหม?
Milan Chheda
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.