แปลงไฟล์ PDF เป็นข้อความ [ปิด]


9

ฉันกำลังมองหาวิธี "หนึ่งคลิก" ในการรับ PDF ใด ๆ และแปลงเป็นข้อความธรรมดา นึกคิดบน OSX หรือ Linux

เป็นการดีที่โซลูชันจะมีฟังก์ชั่น OCR แต่ไม่จำเป็นต้องเป็นสิ่งจำเป็น

ลำดับความสำคัญสูงสุดคือมีบางสิ่งที่สามารถใช้ไฟล์ใดก็ได้โดยไม่ต้องกำหนดค่า

คำตอบ:


23

มีxpdfซึ่งรวมถึงpdftotextไบนารี

Pdftotext แปลงไฟล์ Portable Document Format (PDF) เป็นข้อความธรรมดา

บน Linux มีโปรแกรมติดตั้งให้ใช้งาน ดูเหมือนว่ามันจะมาในpoppler-utilsแพ็คเกจด้วย บน OS X คุณสามารถติดตั้งได้โดยใช้Homebrew (ติดตั้งก่อน) จากนั้นใช้

brew install homebrew/x11/xpdf

ซึ่งจะดาวน์โหลดไฟล์ต้นฉบับและรวบรวมสำหรับ OS X หลังจากนั้นให้ใช้ดังนี้

pdftotext your_pdf_file.pdf

ซึ่งจะสร้างไฟล์ข้อความธรรมดา มีสองตัวเลือกเช่นกันตรวจสอบman pdftotextรายละเอียดเพิ่มเติม

อีกทางเลือกหนึ่งคือpopplerใน OSX:

brew install poppler

ใน Debian และผองเพื่อน

apt-get install poppler-utils

ณ วันนี้คำสั่งคือbrew install homebrew/x11/xpdf
Diego Vieira

1
@DiegoVieira ขอบคุณ ครั้งต่อไปอย่าลังเลที่จะแนะนำการแก้ไข!
slhck

ประโยชน์จากการใช้ poppler แทน xpdf / pdftotext?
กอนซาโล่ Bahamondez

brew install Caskroom/cask/pdftotext
Hugo

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.