การใช้งาน Java OCR [ปิด]


160

นี่เป็นเพียงแค่ความอยากรู้หลัก แต่มีการใช้งาน OCR ใน Java บริสุทธิ์? ฉันอยากรู้ว่าสิ่งนี้จะทำงานได้อย่างหมดจดใน Java และ OCR โดยทั่วไปฉันสนใจดังนั้นฉันชอบที่จะเห็นวิธีการใช้งานในภาษาที่ฉันเข้าใจอย่างละเอียด โดยธรรมชาติสิ่งนี้จะต้องมีการใช้งานเป็นโอเพ่นซอร์ส แต่ฉันยังคงสนใจในโซลูชันที่เป็นกรรมสิทธิ์อย่างน้อยที่สุดฉันก็สามารถตรวจสอบประสิทธิภาพในกรณีนี้ได้

ฉันเคยเห็นคู่ที่สามารถใช้ใน Java (เช่นAsprise ) แต่ดูเหมือนจะไม่ใช้ Java เหล่านี้บริสุทธิ์ ... มีอะไรบ้าง


@Robik ก่อนอื่นในขณะที่คุณอยู่ที่นี่คุณควรลบขอบคุณที่ไม่จำเป็น ฯลฯ และอย่างที่สองคุณไม่ควรแก้ไขในข้อสันนิษฐานดังกล่าวโดยเฉพาะถ้า OP ยังคงทำงานอยู่และคุณสามารถแสดงความคิดเห็นได้ - แม้ว่ามันอาจจะเป็น จริงในกรณีนี้ ... @ ratเพื่อชี้แจงคุณหมายถึงความประหลาดใจไหม?
โทเบียส Kienzler

หากคุณไม่ได้ค้นหาวิธีการแบบจาวาบริสุทธิ์อาจจะสร้างสะพาน JNI (เช่นTess4J ) ความรู้สึกของฉันคือห้องสมุด OCR นั้นดีกว่าในโลก C ++ (OCRAD, GOCR, Cuneiform - ดูทั้งหมดที่นี่ )
dma_k

@rat - คุณพูดถูก - Asprise OCR SDK สำหรับ Javaไม่ใช่ภาษาจาวาล้วนๆ ในความเป็นจริงเบื้องหลังใช้รหัสท้องถิ่นเป็น OCR เป็นกระบวนการที่มีราคาแพงมาก
การสนับสนุน Asprise

คำตอบ:


81

ฉันแนะนำให้ลองใช้โครงการJava OCRบน sourceforge.net ฉันเดิมพัฒนามันและฉันมีบล็อกโพสต์เกี่ยวกับมัน

ตั้งแต่ฉันวางไว้บน sourceforge ฟังก์ชั่นของมันได้รับการขยายและปรับปรุงให้ดีขึ้นผ่านการทำงานที่ยอดเยี่ยมของนักวิจัย / นักพัฒนาอาสาสมัคร

ลองดูและถ้าคุณไม่ชอบคุณสามารถปรับปรุงได้ตลอดเวลา!


18
@ Ron ฉันได้ดูโครงการด้วย ฉันไม่พบตัวอย่างและ GUI ดำเนินการด้านกราฟิกต่าง ๆ แต่ไม่มีคำแนะนำเกี่ยวกับวิธีการจดจำตัวอักษรที่แท้จริง
James P.

1
@Ron เมื่อฉันไปตามลิงก์ไปยังบล็อกของคุณจากนั้นฉันเห็นหน้าว่าง
neoneye

3
@Ron ฉันจะได้รับเอกสารหรือบล็อกหรือการสอนเพิ่มเติมได้ที่ไหน
altsyset

1
วิธีนำเข้า java ocr ใน eclipse
Ashraf Faisal

2
สวัสดีมีแบบฝึกหัดสำหรับเรื่องนี้หรือไม่?
The Well

10

เราได้ทดสอบเอนจิ้น OCR สองสามตัวกับ Java เช่น Tesseract, Asprise, Abbyy เป็นต้นในการวิเคราะห์ของเรา Abbyy ให้ผลลัพธ์ที่ดีที่สุด


1
Java API หรือ Java implementations .. ?
Ewoks

ทั้ง ProcessBuilderแต่มีรุ่นบรรทัดคำสั่งที่คุณสามารถพูดคุยโดยใช้
Aaron Digulla

1
Tesseract และ Abbyy ไม่ใช้ Java พวกเขามี API สำหรับ Java
krispy

10

หากคุณกำลังมองหาตัวเลือกที่ขยายมากหรือมีปัญหาโดเมนเฉพาะที่คุณอาจจะพิจารณาการกลิ้งของคุณโดยใช้ตัวเองวัตถุ Java Oriented ประสาทเครื่องยนต์ อีกหนึ่งการอ้างอิงของJOONE

ฉันใช้มันในโครงการส่วนตัวเพื่อระบุตัวอักษรจากรูปภาพเช่น นี้คุณสามารถหาแหล่งที่มาทั้งหมดสำหรับองค์ประกอบ OCR ของแอพลิเคชันของฉันบน GitHub, ที่นี่


1
โอ้ขอบคุณสำหรับตัวอย่าง ฉันดาวน์โหลดและวางแผนที่จะปรับให้เข้ากับความต้องการของฉัน!
Amanda S

คุณสามารถแสดงวิธีการคอมไพล์ได้ไหม
RadijatoR

ฉันกลัวว่าโครงการจะไม่ได้รับการบำรุงรักษาอีกต่อไป @RadijatoR ดังนั้นฉันจึงไม่สามารถให้คำแนะนำใด ๆ ได้
davetapley

4
ลิงก์ส่วนใหญ่เสียชีวิต
Erik

5

มี OCR ไลบรารี่มากมาย อย่างไรก็ตามประสบการณ์ของฉันคือการใช้งานเชิงพาณิชย์ที่สำคัญ ABBYY, Omnipage และ ReadIris ไกลเกินกว่าโอเพ่นซอร์สหรือการใช้งานเล็กน้อยอื่น ๆ ไลบรารีเชิงพาณิชย์เหล่านี้ไม่ได้ออกแบบมาเพื่อทำงานกับ Java เป็นหลัก แต่แน่นอนว่าเป็นไปได้

แน่นอนถ้าคุณสนใจที่จะเรียนรู้รหัสการใช้งานโอเพ่นซอร์สจะทำเคล็ดลับ


3

เพิ่งพบสิ่งนี้ (ไม่ทราบไม่ได้ทดสอบตรวจสอบตัวเอง)

Ron Cemer Java OCR


ในขณะที่คุณต้องการสิ่งนี้เพื่อความอยากรู้คุณสามารถดูที่แหล่งที่มาของแอปเพล็ตนี้ได้

มันทำ OCR ของตัวละครที่เขียนด้วยลายมือด้วยเครือข่ายประสาท

Java OCR: การรู้จำลายมือ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.