คำถามติดแท็ก ocr

การรู้จำอักขระด้วยแสง (OCR) คือกระบวนการแปลงรูปภาพของข้อความเป็นข้อความที่สามารถจัดการได้โดยโปรแกรมประมวลผลคำเป็นต้น

9
วิธีการแยกข้อความด้วย OCR จาก PDF บน Linux?
ฉันจะแยกข้อความจาก PDF ที่ไม่ได้สร้างด้วยดัชนีได้อย่างไร มันคือข้อความทั้งหมด แต่ฉันไม่สามารถค้นหาหรือเลือกอะไรก็ได้ ฉันใช้ Kubuntu อยู่และ Okular ไม่มีคุณสมบัตินี้
42 linux  ubuntu  pdf  extract  ocr 

4
วิธีสร้าง PDF ด้วยหน้าที่สแกน แต่ข้อความที่เลือกได้?
วันนี้ฉันได้รับ PDF จากซัพพลายเออร์ของเราและมีหน้าที่พิมพ์และสแกนหลายหน้าพร้อมลายเซ็น ฯลฯ ฉันเปิดมันใน Acrobat Reader DC แต่ด้วยความประหลาดใจของฉันข้อความจากภาพที่สแกนชัดเจนสามารถเลือกและคัดลอกเป็นข้อความ ดูภาพหน้าจอ: เห็นได้ชัดว่ามี OCR บางอย่างอยู่เบื้องหลังสิ่งนี้เนื่องจากข้อความที่คัดลอกมีข้อผิดพลาด แต่สิ่งนี้เป็นไปได้อย่างไร ฉันไม่เคยเห็นสิ่งนี้มาก่อนสิ่งนี้จะสร้างได้อย่างไร

6
Batch-OCR PDF จำนวนมาก
เรื่องนี้ถูกพูดถึงเมื่อปีที่แล้วที่นี่ Batch OCR สำหรับไฟล์ PDF จำนวนมาก (ยังไม่ได้ทำ OCR) มีวิธีใดในการแบทช์ไฟล์ PDF OCR ที่ยังไม่ได้ทำ OCR อยู่แล้ว? ฉันคิดว่าสถานะปัจจุบันของสิ่งต่าง ๆ ที่เกี่ยวข้องกับสองประเด็น: Batch OCR PDF ของ windows Acrobat - นี่คือเอ็นจิ้น Oocr ที่ตรงที่สุดที่จะทำการ OCR ปัญหาเดียวน่าจะเป็น 1) มันจะไม่ข้ามไฟล์ที่ OCRed 2 ไปแล้ว) ลองขว้าง PDF เป็นไฟล์ (มันเก่า) แล้วดูมันพัง มันเป็นรถเล็ก ๆ น้อย ๆ มันจะเตือนคุณเมื่อเกิดข้อผิดพลาดแต่ละครั้ง (แม้ว่าคุณจะสามารถบอกให้ซอฟต์แวร์ไม่แจ้งเตือนได้ แต่อีกครั้งมันเสียชีวิตอย่างน่ากลัวใน PDF บางประเภทดังนั้นระยะของคุณอาจแตกต่างกันไป ABBYY FineReader …

8
ฉันจะแปลงรูปภาพที่สแกนเป็น PDF เป็นไฟล์ PDF ที่ค้นหาได้อย่างไร [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน4 ปีที่แล้ว ฉันมี PDF ของหนังสือที่สแกน ฉันกำลังมองหาซอฟต์แวร์ฟรีที่จะใช้งาน OCR จากนั้นให้ตัวเลือกในการบันทึกเป็น PDF หรือเอกสารอีกครั้ง มีหรือไม่
19 software-rec  pdf  ocr 

3
ฉันจะระบุแบบอักษรจากภาพได้อย่างไร [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน4 ปีที่แล้ว หลายครั้งที่ฉันเจอบิตแมปโดยไม่มีอะไรนอกจากย่อหน้าข้อความดังนั้นฉันจึงมองหาวิธีระบุแบบอักษรที่ใช้การจัดเรียงย่อหน้าระยะห่างระหว่างบรรทัดและสีตัวหนาตัวเอียง แพ็คเกจ OCR อนุญาตให้ฉันทำเช่นนั้นได้หรือไม่? ถ้าไม่ฉันมีทางเลือกอะไรบ้าง

7
วิธีลบ OCR จาก PDF
ฉันค้นหา Google มาระยะหนึ่งแล้ว แต่ไม่พบคำตอบสำหรับคำถามของฉัน ฉันมีเลเยอร์ OCR ที่ไม่พึงประสงค์ในเอกสารที่ฉันเพิ่งสแกนด้วย Adobe Acrobat มี OCRed ไม่ถูกต้องและฉันต้องการ redact ข้อมูลบางส่วน แต่ OCR กำลังทำให้ข้อมูลที่ต้องการลบออก ฉันแปลงไฟล์เป็น TIFs แต่สังเกตเห็นว่ามีการสูญเสียคุณภาพอย่างมาก ฉันได้ยินมาว่าการพิมพ์ไปยัง PDF อื่นอาจเก็บข้อความหรือลดคุณภาพของภาพลง ฉันขอขอบคุณความช่วยเหลือใด ๆ ในการแก้ปัญหานี้โดยเร็ว ขอบคุณ.
14 pdf  adobe-acrobat  ocr  tif 

6
แยกข้อความ OCR จาก Evernote
OCR ในEvernoteทำภาพที่คุณบันทึกไว้ มีวิธีในการทำให้ข้อความเต็มเทียบเท่ากับภาพใน Evernote หรือเป็น OCR สำหรับการค้นหาเท่านั้นหรือไม่
13 ocr  evernote 

8
โซลูชัน OCR ที่ใช้งานได้จริงสำหรับการแปลงหนังสือขนาดใหญ่เป็นรูปแบบดิจิทัลหรือไม่
ฉันถูกแทนที่โดยสถานที่ปู่ย่าตายายของฉันเมื่อสุดสัปดาห์ที่ผ่านมานี้ ยายดึงหนังสือยักษ์เล่มนี้ (ประมาณ 1,400 หน้า) ออกจากประวัติครอบครัวของเธอกลับไปที่ 1630 หรือมากกว่านั้น Giant nerd ที่ฉันเป็นฉันคิดว่ามันจะลื่นไหลหากมีข้อมูลทั้งหมดที่จัดเก็บไว้ในฐานข้อมูลและหาได้จากเว็บ ฉันสามารถจัดการการเขียนโปรแกรมเว็บและการแสดงผลปกติทั้งหมด แต่สิ่งที่ฉันไม่รู้คือวิธีที่ดีที่สุดในการรับข้อความจากหนังสือไปยังคอมพิวเตอร์ ฉันรู้ว่าจำเป็นต้องใช้ OCR บางอย่างจากการวิจัยเล็ก ๆ น้อย ๆ ที่ฉันทำดูเหมือนว่าตัวเลือกของฉันคือ: ถ่ายภาพทุกหน้าด้วยกล้องจากนั้นประมวลผลภาพด้วยซอฟต์แวร์ OCR ใช้เครื่องสแกนเพื่อสแกนแต่ละหน้าจากนั้นประมวลผลด้วยซอฟต์แวร์ OCR ใช้ประเภทของอุปกรณ์มือถือบางอย่างเช่นนี้ ใครบ้างมีความคิดเกี่ยวกับวิธีที่ดีที่สุดในการแก้ไขปัญหานี้ ฉันไม่ต้องการทำลายหนังสือเพราะเท่าที่ฉันรู้มันไม่สามารถถูกแทนที่ได้ อาจเป็นครั้งเดียวที่ฉันจะสแกนหนังสือเล่มใหญ่ดังนั้นฉันไม่คิดว่าฉันต้องการใช้เงินมากกว่า $ 250 สำหรับอุปกรณ์ประเภทใด ฉันไม่สนใจความพยายามด้วยตนเองที่นี่ (ฉันรู้ว่านี่น่าจะใช้เวลาเป็นเดือน ๆ ) แต่ฉันต้องการค้นหาวิธีที่มีประสิทธิภาพที่สุดเท่าที่จะทำได้ หมายเหตุเกี่ยวกับหนังสือเล่มนี้: มันอายุประมาณ 20 ปีเท่านั้นดังนั้นมันจึงค่อนข้างดี เป็นขาวดำและหน้าเว็บยังไม่เริ่มเป็นสีเหลือง แม้ว่ามันจะมีขนาดใหญ่มากฉันจึงกังวลเกี่ยวกับเงาที่อาจเกิดขึ้นเมื่อข้อความเข้าใกล้ความผูกพัน
12 ocr 

5
PDF มีช่องว่างพิเศษในทุกคำหลังจากทำงานผ่าน Ghostscript
PDF นี้ผลิตโดย Abbyy Finereader 10: http://ebooks.zeitr.org/from_abbyy.pdf คุณสามารถคัดลอกและวางประโยคแรกและรับผลลัพธ์ข้อความ (ดีมาก) นี้: Der » Bund Deutscher Gymnastik-Schulleiter «เมื่อวันที่ 20 พฤศจิกายน 1955 อ่านเพิ่มเติม หลังจากประมวลผลบางอย่างด้วย Ghostscript 9.02 (Windows 64 บิต) ฉันได้รับไฟล์นี้: http://ebooks.zeitr.org/after_ghostscript.pdf ตอนนี้ประโยคแรกดูเหมือนแปลก - มีช่องว่างเพิ่มเติมก่อนอักขระตัวสุดท้ายของแต่ละคำ Der » Bun d Deutsche r GymnastikSchulleiter « wurd eam 20. Novembe r 195 5 ปีที่ผ่านมาคุณสามารถเข้าสู่ นี่มีผลกระทบเชิงลบหลักที่คุณไม่สามารถค้นหาคำทั้งหมดใน Acrobat Reader ฉันสามารถสร้างเอฟเฟกต์ใหม่ด้วยชุดพารามิเตอร์ขั้นต่ำต่อไปนี้สำหรับ …
10 pdf  ocr  ghostscript 

4
Batch OCR สำหรับไฟล์ PDF จำนวนมาก (ยังไม่ได้ทำ OCR) [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน5 ปีที่ผ่านมา ฉันใช้ Google Desktop Search (ฉันอยู่บน Vista) และไม่ใช่ไฟล์ PDF ทั้งหมดของฉันที่ได้รับการยอมรับในโฟลเดอร์เก็บถาวรของฉัน เป็นเรื่องปกติเนื่องจาก " ไฟล์ PDF ที่มีภาพสแกน " ไม่ได้จัดทำดัชนี ( http://desktop.google.com/support/bin/answer.py?hl=th&answer=90651 ) ดังนั้นฉันจึงต้องการ OCR ไฟล์ PDF จำนวนมากที่ยังไม่ได้เป็น OCR เป้าหมายของฉัน: ฉันให้โปรแกรมโฟลเดอร์และค้นหาคนเดียวในโฟลเดอร์ย่อยไฟล์ PDF ที่ต้องแปลงเป็นไฟล์ PDF-OCRed หมายเหตุ: ในอดีตหากไฟล์ PDF ได้รับการป้องกันด้วยรหัสผ่านฉันจะลบรหัสผ่านด้วยชุดเครื่องมือ (จ่ายเงิน) อีกชุด: verypdf.com "pwdremover" http://www.verypdf.com/pwdremover/ มีแนวคิด (ไม่แพงเกินไป) ไหม? ฉันพยายามแล้ว: …

3
OCR ฟรีที่ดีกับ GUI สำหรับแก้ไขข้อผิดพลาด? (สำหรับ Windows)
ฉันใช้SimpleOCRซึ่งมี GUI ที่ดีสำหรับการแก้ไขข้อผิดพลาด น่าเสียดายที่มันทำผิดพลาดมากมาย! (และทนต่อข้อบกพร่องและข้อ จำกัด อื่น ๆ ) ในทางตรงกันข้ามTesseractนั้นแม่นยำกว่า แต่ไม่มี GUI เลย คำถามของฉันคือมีโปรแกรม OCR ฟรีสำหรับ Windows ซึ่งมี GUI ที่ดีและอัตราข้อผิดพลาดต่ำหรือไม่ ฉันต้องการให้ไฮไลต์คำที่ต้องสงสัย (ตามความไม่แน่นอนของ OCR ไม่ใช่แค่การตรวจสอบการสะกด) และแสดงคำดั้งเดิม (บิตแมป) ในขณะที่ฉันกำลังแก้ไขคำ OCRed คล้ายกับที่ SimpleOCR ทำ โอเพ่นซอร์สจะดีที่สุดตามด้วยฟรีแวร์จากนั้นทดลองใช้ / สาธิต / crippleware เป็นทางยาว
9 windows  gui  ocr 

3
Acrobat 11 สามารถทำ OCR โดยใช้คอร์ CPU หลายแกนได้หรือไม่?
การประมวลผล OCR ต้องใช้เวลา การใช้แกนประมวลผลหลายแกนจะทำให้การประมวลผลเร็วขึ้น Acrobat 10 ก็ไม่ได้เป็นโปรแกรมแบบมัลติเธรด เกี่ยวกับ Acrobat 11 OCR 11 ใช้ค่าเริ่มต้นโดยใช้ซีพียูหลายคอร์หรือไม่ (ถ้ามี) ถ้าไม่มีมีวิธีแก้ไขปัญหาเช่นการเขียนสคริปต์เพื่อช่วยให้ Acrobat 11 ทำ OCR โดยใช้หลายแกนประมวลผลหรือไม่ ไม่ว่าจะผ่านภาษาสคริปต์ของ Acrobat หรือใช้สคริปต์ภายนอกที่เรียกใช้และสั่งอินสแตนซ์เธรดเดี่ยวหลายรายการของ Acrobat ไปในแนวเดียวกับชิ้นส่วนของงานประมวลผล หมายเหตุ: คำถามนี้ไม่ได้แปลเป็นภาษาท้องถิ่น (ไม่ จำกัด เฉพาะช่วงเวลา) เนื่องจาก (1) Adobe ไม่ได้ปล่อย Acrobat รุ่นใหม่ที่สำคัญบ่อยนัก (Acrobat 10 เปิดตัวเมื่อสองปีก่อน) และ (2) Adobe Acrobat เป็นวงกว้าง แอปพลิเคชันที่ใช้

3
ฉันจะเริ่มต้นการสแกน OCR ใน Microsoft Office Word 2010 ได้อย่างไร
คุณเริ่มการสแกนและการรู้จำอักขระโดยใช้ Microsoft Office Word 2010 (เบต้า) อย่างไร ฉันไม่พบตัวเลือกในการสแกนเอกสารในสแกนเนอร์ของฉันลงในเอกสาร 2010 Word โดยตรง ฉันตรวจสอบการตั้งค่าการติดตั้งสำหรับ Office 2010 (เบต้า) และติดตั้งองค์ประกอบOCRแล้ว

2
วิธีแทนที่รูปภาพของข้อความใน PDF ด้วยข้อความที่จัดรูปแบบโดยใช้ OCR
ฉันได้รับ PDF จำนวนมากจากบุคคลอื่นที่ประกอบด้วยเอกสารเก่าที่สแกน แต่น่าเสียดายที่บางครั้งข้อความในการสแกนแม้อ่านง่ายดูเป็นเม็ดเล็กและอ่านยาก สิ่งที่ฉันสามารถทำได้จนถึงตอนนี้ก็คือการแยกข้อความโดยใช้ OCR ลงในเอกสารคำ อย่างไรก็ตามเนื่องจากเอกสารเก่าเหล่านี้มักมีภาพประกอบและการจัดรูปแบบที่ซับซ้อนสิ่งที่ฉันอยากจะทำก็คือเพียงแค่ลบข้อความที่เป็นเม็ดสีเก่าและแทนที่ด้วยแบบอักษรที่สร้างด้วยคอมพิวเตอร์ กล่าวอีกนัยหนึ่งฉันต้องการเก็บ PDF และการจัดรูปแบบของหน้าเว็บให้มากที่สุดเท่าที่จะเป็นไปได้ในขณะที่ "ล้าง" ข้อความโดยแทนที่ด้วยการคูณครั้งใหม่ของโรมัน ฉันดูออนไลน์ไม่กี่วันเพื่อหาวิธีที่ง่ายและอัตโนมัติในการล้างข้อมูลและฉันยังไม่ได้ทำอะไรเลย ดูเหมือนว่าแน่นอนควรมีวิธีการทำเช่นนี้ดูเหมือนจะไม่ซับซ้อน แต่บางทีฉันอาจมองข้ามบางแง่มุมของปัญหานี้ที่วางไว้ด้านนอกของสิ่งที่สามารถใช้ OCR ได้ ข้อเสนอแนะใด ๆ

3
วิธีค้นหา PDF ที่ไม่สามารถค้นหาได้โดยอัตโนมัติ
สมมติว่าฉันมีไดเรกทอรีที่เต็มไปด้วย PDF จำนวนมาก ในส่วนใหญ่ข้อความสามารถค้นหาได้อย่างสมบูรณ์ซึ่งเป็นวิธีที่ฉันต้องการ แต่บางคนก็เป็นเพียงการสแกนภาพและพวกเขาต้องเป็น OCR-ed ถ้าอย่างนั้นการทำ OCR แบบแบตช์ในไดเรคทอรีทั้งหมดมีวิธีที่จะระบุว่า PDF ใดเป็นไฟล์ภาพอย่างเดียวที่ต้องเป็น OCR-ed หรือไม่? ฉันไม่ใช่โปรแกรมเมอร์ แต่ต้องการโซลูชันที่เป็นมิตรกับ linux
4 pdf  ocr 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.