ฉันได้รับเอกสารภาพสแกนจากธนาคารและฉันต้องการแปลงเป็นเอกสารข้อความธรรมดาที่มีภาพใน Ubuntu
มีเครื่องมืออะไรบ้างไหม?
ฉันได้รับเอกสารภาพสแกนจากธนาคารและฉันต้องการแปลงเป็นเอกสารข้อความธรรมดาที่มีภาพใน Ubuntu
มีเครื่องมืออะไรบ้างไหม?
คำตอบ:
มีตัวอ่านOCRจำนวนหนึ่งสำหรับ linux ที่สามารถแปลงจากรูปภาพเป็นข้อความได้ ดูตัวเลือกต่อไปนี้:
ทั้งหมดข้างต้นยกเว้น ocropus มีอยู่ในที่เก็บ Ubuntu ในแพ็คเกจที่มีชื่อเดียวกัน
ตัวอ่านที่แตกต่างกันรองรับรูปแบบภาพที่แตกต่างกันดังนั้นคุณอาจถูก จำกัด ในตัวเลือกของคุณด้วยรูปแบบไฟล์ที่เอกสารของคุณมีอยู่หรือคุณสามารถใช้เครื่องมือแปลงจาก ImageMagick เพื่อเปลี่ยนรูปแบบหากคุณต้องการใช้ตัวอ่าน OCR เฉพาะ
คุณต้องติดตั้ง "tesseract-ocr" บนเครื่อง linux ของคุณก่อน
sudo apt-get install tesseract-ocr
คุณสามารถทำได้ด้วยตนเองจาก CLI หรือฉันได้ทำรหัส PHP สำหรับเดียวกันคุณสามารถใช้มันถ้าคุณต้องการ
หมายเหตุ: ในการเรียกใช้รหัสนี้คำสั่งexecควรเปิดใช้งานใน php.ini
<?php
//IMAGE TO TXT Conversion
$input_file = $_REQUEST['input_file'];
$out = explode(".",$input_file);
$output_file = $out[0]."_".$out[1];
$output_file_name = $output_file.".txt";
echo "<br />----IMAGE To TXT conversion Started-----</br />";
echo exec('tesseract '.$input_file.' '.$output_file);
echo "<br />----TXT conversion Done-----</br />";
echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />";
?>
ใส่รหัสนี้ในโฟลเดอร์รากและเข้าถึงจากเบราว์เซอร์
เช่น :
http://yourserver.com?input_file=1.png
หมายเหตุ: ไฟล์1.pngควรมีอยู่ในไดเรกทอรีปัจจุบันของคุณ
ฉันไม่มีสิทธิ์อัพโหลดภาพฉันใช้ภาพนี้เพื่อการอ้างอิง http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-using-tesseract-ocr/phototest.gif/image_preview