วิธีลบ OCR จาก PDF


14

ฉันค้นหา Google มาระยะหนึ่งแล้ว แต่ไม่พบคำตอบสำหรับคำถามของฉัน

ฉันมีเลเยอร์ OCR ที่ไม่พึงประสงค์ในเอกสารที่ฉันเพิ่งสแกนด้วย Adobe Acrobat มี OCRed ไม่ถูกต้องและฉันต้องการ redact ข้อมูลบางส่วน แต่ OCR กำลังทำให้ข้อมูลที่ต้องการลบออก ฉันแปลงไฟล์เป็น TIFs แต่สังเกตเห็นว่ามีการสูญเสียคุณภาพอย่างมาก ฉันได้ยินมาว่าการพิมพ์ไปยัง PDF อื่นอาจเก็บข้อความหรือลดคุณภาพของภาพลง

ฉันขอขอบคุณความช่วยเหลือใด ๆ ในการแก้ปัญหานี้โดยเร็ว

ขอบคุณ.

คำตอบ:


6

ใน Acrobat Pro DC คำสั่งที่เหมาะสมคือ "ลบข้อมูลที่ซ่อนอยู่" ซึ่งมีให้ผ่านเครื่องมือ "ป้องกัน" และ "ทำซ้ำ"

ในการรันคำสั่งมันแค่ค้นหาข้อมูลที่ซ่อนอยู่ แต่ไม่เปลี่ยนเอกสาร จากนั้นคุณต้องบอก Acrobat ว่าต้องการลบข้อมูลใด ในกรณีนี้เลือก "ข้อความที่ซ่อน" ในบานหน้าต่างผลลัพธ์จากนั้นคลิกปุ่มลบและบันทึกเอกสารที่เปลี่ยนแปลง


ฉันใช้ "ลบข้อมูลที่ซ่อนอยู่" แต่สำหรับฉันด้วยเหตุผลบางอย่างที่เพิ่งลบส่วนของภาพในบางหน้า ขอบคุณสำหรับการตอบกลับของคุณ
Sanoo

สิ่งนี้ไม่เป็นความจริงในระดับสากล อย่างใด (อาจ macOS PDFKit ข้อบกพร่อง) ข้อความ ABBYY FineReader-OCRed ของฉันได้รับความเสียหายและการตรวจสอบ "ข้อความที่ซ่อนอยู่" ภายใต้ Redact →ลบที่ซ่อนไม่ได้ลบข้อความโดยไม่มีปัญหาใด ๆ ; จากนั้นฉันก็สามารถใช้ Enhance Scans → Recognize Text เพื่อทำ OCR ภายใน Acrobat ได้
Nicholas Riley

ปัญหาสำหรับฉันคือหลังจากที่ฉันลบข้อความที่ซ่อนอยู่ฉันยังคงไม่สามารถเรียกใช้ OCR ด้วย "ClearScan" (เช่น "ข้อความและรูปภาพที่แก้ไขได้") มันแปลกเพราะเลเยอร์ข้อความดูเหมือนจะหายไป แต่การเรียกใช้ OCR ทำให้เกิดข้อผิดพลาด "Acrobat ไม่สามารถทำการจดจำได้เพราะ: หน้ามีข้อความที่สามารถแสดงผลได้"
1125483

1

หลังจากการทดลองหลายครั้งฉันพบว่าการพิมพ์ไปยัง Adobe PDF จาก Adobe Acrobat พิมพ์เอกสารโดยไม่ใช้ OCR และไม่สูญเสียคุณภาพ

อย่างไรก็ตามหลายเว็บไซต์อ้างว่ามันใช้งานไม่ได้ ฉันลองเครื่องพิมพ์อื่น ๆ เช่น Foxit Reader และ OneNote แต่คุณภาพลดลง JPEG ก็เหมือนกัน

โปรดทราบว่าระยะทางของคุณอาจแตกต่างกันไป

หมายเหตุ: ฉันออกจากกระทู้นี้ทำเครื่องหมายว่ายังไม่ได้ตอบหวังว่าจะได้คำตอบที่ดีกว่าของฉัน


1

(หนึ่งปีที่ผ่านมา ... )

ถ้าอย่างที่คุณบอกว่าเอกสารนั้นถูกสแกนและไม่ได้พิมพ์เป็น PDF จาก Word คุณสามารถลบออกได้อย่างง่ายดายด้วย Adobe:

เลือกเอกสารตรวจสอบเอกสารและตอนนี้คุณสามารถลบข้อความที่ซ่อนอยู่ (OCR)


ขอบคุณสำหรับการตอบกลับของคุณ. ฉันจะทดสอบทันทีที่ฉันทำได้และแจ้งให้คุณทราบ ขอบคุณสำหรับคำตอบ!
Sanoo

ฉันคิดว่าฉันได้แสดงความคิดเห็นเกี่ยวกับเรื่องนี้แล้ว แต่ปัญหาคือว่าฉันมี Acrobat DC Pro และเมนูเหล่านั้นถูกลบ ขอบคุณสำหรับคำตอบของคุณ
Sanoo

1

ใน Acrobat Pro: ใช้ 'ลบข้อมูลที่ซ่อนอยู่' (ใต้ 'การป้องกัน') เลือกทั้งหมดดำเนินการ OCR หายไป


1

ใน Acrobat X ภายใต้การป้องกันจะมีปุ่มเอกสาร Sanitize ที่เอาทุกอย่างออก แต่สิ่งที่สามารถมองเห็นได้ (รวมถึง OCR'd ชั้นข้อความ) แปลงเอกสารเป็นบิตแมปแบน


1

ฉันแก้ไขมันโดยส่งออกเป็น JPEG จากนั้น JPEG รวมไฟล์เป็น acrobat นี่คือจากเอกสารที่เดิมเป็นคำว่า doc และถูกแปลงเป็น PDF OCR หายไป


0

ฉันสร้างเครื่องมือเพื่อทำPDF Redactorฟรี หากคุณอัปโหลดภาพและเพียงคลิก redact มันจะทำให้ไฟล์แบนราบและลบ OCR หากคุณต้องการคุณสามารถวาดเครื่องหมายการ Redaction บนเอกสารได้เช่นกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.