เครื่องสแกนฟีดที่อ่านข้อมูล


1

ฉันไม่รู้ว่านี่เป็นสถานที่ที่เหมาะสมที่จะถามคำถามนี้หรือไม่ แต่ ...

ฉันต้องการสแกนเนอร์ (ตัวป้อนกระดาษสแกนเนอร์) ซึ่งขึ้นอยู่กับบาร์โค้ดหรือหมายเลขหรือตัวระบุบางอย่างบนกระดาษที่กำลังสแกนสร้างไฟล์ PDF ด้วยชื่อตามตัวระบุ

ตัวอย่างเช่น: หากฉันสแกนหน้าด้วยหมายเลข 12345 ที่ด้านบนซ้ายของหน้าไฟล์ PDF ชื่อ 12345.pdf จะถูกสร้างขึ้น

ข้อเสนอแนะใด ๆ จะได้รับการชื่นชมอย่างมาก!

คำตอบ:


2

หากคุณกำลังมองหาเครื่องสแกนเอกสารที่มีความสามารถในการแยกแบทช์โดยใช้บาร์โค้ดและเปลี่ยนชื่อเป็นบาร์โค้ดและ OCR โซนคุณสามารถลองใช้งานร่วมกับ Fujitsu Scanner ที่มาพร้อมกับซอฟต์แวร์สแกนทั้งหมด ทางเลือกอื่นคือคุณกำลังใช้เครื่องสแกน Kodak กับการดักจับโกดัก แต่ซอฟต์แวร์จำหน่ายแยกต่างหากและค่อนข้างมีราคาแพง หากคุณมีเครื่องสแกนที่ใช้ ISIS คุณสามารถลองซอฟต์แวร์ Quick Scan Pro เพื่อทำมัน ฉันใช้สแกนทุกโปรตั้งแต่ 3 ปีที่แล้วไปยังหน้าดิจิตอลนับล้านหน้าและใช้งานได้ดี


1

คุณเคยดูสิ่งต่าง ๆ เช่น Readiris หรือ SimpleOCR หรือ อื่น ๆ OCR ทางเลือก เพื่อดูว่ามีคุณสมบัติใดบ้างที่คุณต้องการ

ฉันเขียนเครื่องสแกนเอกสารโดยใช้ Microsoft Access VBA ที่สามารถดึงหน้าจากเครื่องให้อาหารเอกสารและไฟล์ PDF ออกและตอนนี้ฉันกำลังเขียนมันใหม่ใน Python แต่ฉันยังไม่ได้ใส่ใจมากพอที่จะหาวิธีสร้าง ชนิดของ OCR ลงไปเนื่องจากดูเหมือนจะไม่มีตัวเลือกมากมายสำหรับ OCR ใน Python เครื่องอ่านบาร์โค้ด ดูเหมือนตัวเลือกโดยทั่วไปคุณจะได้รับสิ่งที่เพิ่งให้กระแสข้อมูลแบบอนุกรมที่มีเนื้อหาของบาร์โค้ดซึ่งก็สามารถใช้เป็นชื่อไฟล์ ...

ดูเหมือนว่าชนิดของสิ่งที่ควรมีในรูปแบบของโซลูชั่น OCR แบบชำระเงินฉันคิดว่าคุณอาจต้องประเมินแพคเกจที่รองรับการสแกนเอกสารจำนวนมากและการบันทึกไฟล์ตามกฎ


1

สิ่งนี้ใช้ได้ใน Linux สำหรับกรณีของตัวเลขที่ด้านบนของหน้า คุณสามารถเล่นกับพารามิเตอร์การสแกนและพารามิเตอร์การแปลง PDF เพื่อรับสิ่งที่คุณต้องการ

#!/bin/bash
# Requires scanimage, tesseract and ImageMagick convert

# Scan the image to temp file. Change command for your scanner
scanimage -d hpaio:/usb/Deskjet_F4100_series?serial=CN7CH4T29D04TJ \
--mode Lineart --resolution 300 --compression None --format=tiff \
> out.tif

# OCR to tmp.txt file
tesseract out.tif tmp

# Extract first line --contains number (thanks Serverfault 66587)
read -r NUMBER < tmp.txt

# Convert image to pdf with the desired name
convert out.tif $NUMBER.pdf

# Clean up
rm out.tif tmp.txt

หากคุณต้องการบาร์โค้ดคุณอาจลองประมวลผลภาพด้วย gocr มันจะอ่านบาร์โค้ดบางประเภท แยกผลที่ได้ number นั้นค่อนข้างยุ่งยาก แต่สามารถทำได้ด้วยตัวกรอง sed


0

ขออภัยที่ตอบกระทู้อายุ 3 ปี แต่ฉันกำลังค้นหาสิ่งนี้ในสถานที่ที่ฉันทำงานด้วยหลังจากทำการวิจัยบางอย่าง Batch Scan To Pdf นั่นคือสิ่งที่คุณต้องการในคำอธิบายของคุณ อย่างไรก็ตามแทนที่จะใช้บาร์โค้ดปกติพวกเขาใช้รหัส QR พวกเขาราคาถูกสุด ๆ เมื่อเทียบกับคนอื่น ๆ ที่ฉันเคยเห็น หวังว่านี่จะช่วยผู้อื่นที่อาจต้องการฟังก์ชั่นที่คล้ายกัน


ลิงก์ที่โพสต์ไม่ถูกต้องอีกต่อไป ดูเหมือนว่าหน้าเว็บจะถูกย้ายไปที่ ที่นี่ . ทางออกอื่นก็คือ BarcodeOCR ซึ่งยังทำงานในพื้นหลังและประมวลผลไฟล์โดยอัตโนมัติ
CiTiZEN
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.