คำถามติดแท็ก ocr

การรู้จำอักขระด้วยแสง (OCR) คือกระบวนการแปลงรูปภาพของข้อความเป็นข้อความที่สามารถจัดการได้โดยโปรแกรมประมวลผลคำเป็นต้น

1
OCR ของแบบวิศวกรรม?
อะไรคือทางออกที่ดีที่สุดสำหรับการวิเคราะห์ OCR ของสตริงข้อความที่เขียนด้วยลายมือที่ปรากฏบนแผนที่ คำอธิบายเชิงลึกเพิ่มเติมเกี่ยวกับสิ่งที่ฉันกำลังมองหา: ฉันกำลังทำงานเกี่ยวกับการประมวลผลข้อมูลจำนวนมากที่เกี่ยวข้องกับไลบรารีของแบบวิศวกรรม สิ่งเหล่านี้ใช้สำหรับระบบสาธารณูปโภคดังนั้นภาพวาดจึงเป็นแผนที่ถนนที่ซ้อนทับด้วยคุณสมบัติเช่นสายส่งสัญญาณและหมายเลขรหัสที่เกี่ยวข้องกับสายเหล่านี้ หมายเลขรหัสส่วนใหญ่จะเขียนด้วยลายมือ - ลายมือของวิศวกรมีความเรียบร้อยและสอดคล้องกัน นอกจากนี้เนื่องจากหมายเลขรหัสสอดคล้องกับสายส่งพวกเขาอยู่เหนือการวาดในมุมที่แตกต่างกันตามที่พวกเขาทำตามสาย ฉันต้องการหาโซลูชัน OCR สำหรับเก็บหมายเลขรหัสจากภาพวาดเหล่านี้ ไม่มีใครมีข้อเสนอแนะใด ๆ ? ปัญหาที่คล้ายกันคือ: กำหนดแผนที่เมืองแยกชื่อถนนที่อยู่และจุดที่น่าสนใจทั้งหมด

1
การจดจำรูปแบบโดยใช้ OCR และส่งคืนภาพของค่า
ฉันอยู่ในโครงการที่ประมวลผลหลายร้อยรูปแบบ แบบฟอร์มมีรูปแบบที่สอดคล้องกัน แต่ถูกกรอกด้วยมือโดยบุคคลอื่น ฉันต้องการวิธีการประมวลผลข้อมูลทั้งหมดนี้อย่างรวดเร็วในรูปแบบอิเล็กทรอนิกส์ การรับรู้ OCR สำหรับเอกสารที่พิมพ์ดูเหมือนว่าจะเป็นผู้ใหญ่ แต่สำหรับการเขียนด้วยลายมือนั้นขาดมาก สำหรับความคิดนี้ลองพิจารณาฟอร์มที่มีหลายฟิลด์ที่มีโครงสร้างดังนี้ field1 : value1 ตัวอย่างเช่น: Name: John ที่ไหน Name เป็นสนามและ John คือคุณค่า เมื่อพิจารณาว่าฟอร์มมีโครงสร้างและพิมพ์แล้ว OCR ควรสามารถรับรู้ / ตีความฟิลด์ อย่างไรก็ตามค่าของฟิลด์นั้นเขียนด้วยมือและ OCR จะทำงานได้ไม่ดีสำหรับพวกเขา ดังนั้นมีวิธีที่ฟิลด์จะได้รับการยอมรับในภาพแล้วภาพอันมีค่าจะถูกส่งกลับ

0
OCR ตลก - สถานการณ์
ฉันได้ทำการสแกนไฟล์ PDF ขนาด 300 dpi บนระบบ Ubuntu 16.04 เมื่อฉันเรียกใช้คำสั่งต่อไปนี้: pdfocr -t -l swe -i *.pdf -o newfile.pdf มันส่งผลให้ไฟล์ OCR-read สมบูรณ์แบบ ทุกคำสามารถค้นหาได้ทุกขนาดและรูปร่างของแบบอักษร อย่างไรก็ตามขั้นตอนต่อไปในกระบวนการกำลังแปลง PDF นี้เป็น PDF / A-1b สิ่งนี้ทำโดย Ghostscript 9.18 ที่รันคำสั่ง: gs -dPDFA -dBATCH -dNOPAUSE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=konverterade/$i $i ไฟล์ผลลัพธ์ได้รับการตรวจสอบความถูกต้องเป็นไฟล์ PDF / A-1b-file ที่ถูกต้อง แต่ความสามารถในการค้นหาของไฟล์นั้นเปลี่ยนแปลงไปมาก ดูเหมือนว่า Ghostscript กำลังทำลาย …

1
ฉันจะย้ายเลเยอร์ข้อความจาก PDF หนึ่งไปยังอีกที่หนึ่งได้อย่างไร (ใน windows)
ฉันมีไฟล์ไม่กี่ไฟล์ในรูปแบบ. djvu ซึ่งมีขนาดเล็ก แต่น่าเสียดายที่ mi e-reader ไม่สามารถแสดงได้ ฉันใช้ DjvuToy เพื่อแปลงเป็น PDF และมันยังคงขนาดที่เล็ก แต่เมื่อฉันใช้ Abby FineReader เพื่อทำ OCR และบันทึกขนาดจะเพิ่มขึ้นประมาณแปดเท่า (เกิดขึ้นเฉพาะเมื่อไฟล์มีสีหรือภาพสีเทา) ดังนั้นฉันคิดว่ามันอาจเป็นไปได้ที่จะใช้เลเยอร์ข้อความที่สองและเพิ่มไปที่ชั้นแรกเพื่อให้ได้ขนาดที่เล็กและ OCR ฉันจะทำสิ่งนั้นได้อย่างไร หมายเหตุ: ไฟล์ djvu ดั้งเดิมไม่มีเลเยอร์ข้อความแม้ว่าจะเป็นการดีที่จะทราบวิธีการแปลงจาก djvu เป็น pdf รวมถึงข้อความโดยตรง
2 pdf  ocr  djvu 

1
ซอฟต์แวร์ OCR สำหรับ Windows รองรับภาษาที่ไม่ใช่ภาษาอังกฤษ
แม่นยำฉันต้องการค้นหาซอฟต์แวร์ OCR ซึ่งสามารถแปลงไฟล์ PDF และรูปภาพเป็นข้อความได้ นอกจากนี้ควรสนับสนุนภาษา "ฮังการี" ฉันลองมองไปรอบ ๆ ค้นหาซอฟต์แวร์ดังกล่าว แต่ไม่พบรายการการเปรียบเทียบข้อเสนอแนะ ... อะไร ( ไม่มีปัญหาหากไม่ฟรี)

2
วิธีหลีกเลี่ยงผลลัพธ์ที่บิดเบือนด้วยเครื่องมือ OCR pdfsandwich
โดยปกติแล้วหน้าที่สแกนจะต้องได้รับการสเตดูแลก่อนที่จะใช้เครื่องมือ OCR ที่นี่อินพุตของฉันเป็นหน้าที่สแกนแบบตรงและบางครั้งเอาต์พุต OCR จะเบ้ทั้งตามเข็มนาฬิกาหรือทวนเข็มนาฬิกา ในกรณีที่ฉันใช้หนังสือภาษาอังกฤษ 260 หน้ามันเกิดขึ้นกับ 14 หน้า ตัวอย่าง: input.pdf: output.pdf คำสั่ง: convert -density 300 -quality 100 input.pdf -level 0%,100%,4.0 -black-threshold 75% convert.pdf && pdfsandwich -noimage -coo "-normalize -density 300 -black-threshold 75%" convert.pdf -o output.pdf ฉันจะหลีกเลี่ยงผลลัพธ์ที่เอียงได้อย่างไร อีกวิธีหนึ่งฉันสามารถเดสก์ท็อปเอาต์พุตโดยไม่ทำให้ OCR หายไปได้อย่างไร วิธีการและเครื่องมือทั้งหมดที่ฉันได้พบการแปลงครั้งแรกเป็นรูปแบบภาพที่ทำให้สูญเสีย OCR แล้วไม่มีประโยชน์ที่นี่

0
Applescript + pdfpen สำหรับ ocr บนหลาย ๆ ไฟล์: จะทำอย่างไรต่อไปเมื่อ pdfpen ค้าง
ฉันใช้ AppleScript ต่อไปนี้เป็น PDF สำหรับกระบวนการแบบต่อเนื่องสำหรับ ocr: tell application "Finder" set target_folder to target of front Finder window repeat with i from 1 to count (every folder of target_folder) set current_folder to folder i of target_folder set current_batch to (document files of entire contents of current_folder whose name ends with "pdf") …

1
Autohotkey เพื่อค้นหาภาพ
ฉันเรียนรู้วิธีใช้ autohotkey และฉันต้องการสร้างสคริปต์ที่เปิดเกมจาก Steam และเชื่อมต่อกับเซิร์ฟเวอร์โดยอัตโนมัติ รหัสของฉันคือ: F1:: Run, steam://rungameid/346110 Sleep, 15000 <--- This is more or less the time that my computer takes to load it, and I want another way to check if the game is already loaded MouseClick, left, 156, 520 <--- (Position of "JOIN ARK") Sleep, 1500 …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.