แปลงภาพเป็นข้อความ


8

ฉันได้รับเอกสารภาพสแกนจากธนาคารและฉันต้องการแปลงเป็นเอกสารข้อความธรรมดาที่มีภาพใน Ubuntu

มีเครื่องมืออะไรบ้างไหม?

คำตอบ:


15

มีตัวอ่านOCRจำนวนหนึ่งสำหรับ linux ที่สามารถแปลงจากรูปภาพเป็นข้อความได้ ดูตัวเลือกต่อไปนี้:

ทั้งหมดข้างต้นยกเว้น ocropus มีอยู่ในที่เก็บ Ubuntu ในแพ็คเกจที่มีชื่อเดียวกัน

ตัวอ่านที่แตกต่างกันรองรับรูปแบบภาพที่แตกต่างกันดังนั้นคุณอาจถูก จำกัด ในตัวเลือกของคุณด้วยรูปแบบไฟล์ที่เอกสารของคุณมีอยู่หรือคุณสามารถใช้เครื่องมือแปลงจาก ImageMagick เพื่อเปลี่ยนรูปแบบหากคุณต้องการใช้ตัวอ่าน OCR เฉพาะ

ที่ดัดแปลงมาจากคำตอบของฉันที่นี่


0

คุณต้องติดตั้ง "tesseract-ocr" บนเครื่อง linux ของคุณก่อน

sudo apt-get install tesseract-ocr

คุณสามารถทำได้ด้วยตนเองจาก CLI หรือฉันได้ทำรหัส PHP สำหรับเดียวกันคุณสามารถใช้มันถ้าคุณต้องการ

หมายเหตุ: ในการเรียกใช้รหัสนี้คำสั่งexecควรเปิดใช้งานใน php.ini

<?php
//IMAGE TO TXT Conversion
    $input_file = $_REQUEST['input_file'];
    $out = explode(".",$input_file);

    $output_file = $out[0]."_".$out[1];
    $output_file_name  =    $output_file.".txt";

    echo "<br />----IMAGE To TXT conversion Started-----</br />";
    echo  exec('tesseract '.$input_file.' '.$output_file);
    echo "<br />----TXT conversion Done-----</br />";

    echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
    echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; 
?>

ใส่รหัสนี้ในโฟลเดอร์รากและเข้าถึงจากเบราว์เซอร์

เช่น :

http://yourserver.com?input_file=1.png

หมายเหตุ: ไฟล์1.pngควรมีอยู่ในไดเรกทอรีปัจจุบันของคุณ

ฉันไม่มีสิทธิ์อัพโหลดภาพฉันใช้ภาพนี้เพื่อการอ้างอิง http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-using-tesseract-ocr/phototest.gif/image_preview

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.