0
OCR ตลก - สถานการณ์
ฉันได้ทำการสแกนไฟล์ PDF ขนาด 300 dpi บนระบบ Ubuntu 16.04 เมื่อฉันเรียกใช้คำสั่งต่อไปนี้: pdfocr -t -l swe -i *.pdf -o newfile.pdf มันส่งผลให้ไฟล์ OCR-read สมบูรณ์แบบ ทุกคำสามารถค้นหาได้ทุกขนาดและรูปร่างของแบบอักษร อย่างไรก็ตามขั้นตอนต่อไปในกระบวนการกำลังแปลง PDF นี้เป็น PDF / A-1b สิ่งนี้ทำโดย Ghostscript 9.18 ที่รันคำสั่ง: gs -dPDFA -dBATCH -dNOPAUSE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=konverterade/$i $i ไฟล์ผลลัพธ์ได้รับการตรวจสอบความถูกต้องเป็นไฟล์ PDF / A-1b-file ที่ถูกต้อง แต่ความสามารถในการค้นหาของไฟล์นั้นเปลี่ยนแปลงไปมาก ดูเหมือนว่า Ghostscript กำลังทำลาย …