สิ่งนี้ใช้ได้ใน Linux สำหรับกรณีของตัวเลขที่ด้านบนของหน้า คุณสามารถเล่นกับพารามิเตอร์การสแกนและพารามิเตอร์การแปลง PDF เพื่อรับสิ่งที่คุณต้องการ
#!/bin/bash
# Requires scanimage, tesseract and ImageMagick convert
# Scan the image to temp file. Change command for your scanner
scanimage -d hpaio:/usb/Deskjet_F4100_series?serial=CN7CH4T29D04TJ \
--mode Lineart --resolution 300 --compression None --format=tiff \
> out.tif
# OCR to tmp.txt file
tesseract out.tif tmp
# Extract first line --contains number (thanks Serverfault 66587)
read -r NUMBER < tmp.txt
# Convert image to pdf with the desired name
convert out.tif $NUMBER.pdf
# Clean up
rm out.tif tmp.txt
หากคุณต้องการบาร์โค้ดคุณอาจลองประมวลผลภาพด้วย
gocr มันจะอ่านบาร์โค้ดบางประเภท แยกผลที่ได้
number นั้นค่อนข้างยุ่งยาก แต่สามารถทำได้ด้วยตัวกรอง sed