คำตอบของอิกนาชิโอก็โอเค ความจริงมันเป็นสิ่งแรกในรายการของฉัน ดีและบางทีอาจจะแนะนำpdftohtml
เครื่องมือที่มาพร้อมกับ poppler รวมกับpdfreflowหากคุณต้องการรวมข้อความเป็นย่อหน้า ฯลฯ (แน่นอนว่าสิ่งนี้จะให้เอาต์พุต HTML แต่การแปลง HTML เป็นข้อความธรรมดาสามารถทำได้ ทำได้หลายวิธี)
นี่คือตัวเลือกอื่น ๆ ด้วย
ebook-convert
เครื่องมือบรรทัดคำสั่งจากCaliberซึ่งสามารถแปลง .PDFs ข้อความธรรมดา (หรือ RTF หรือจำนวนของรูปแบบ ebook เช่น ePub, ฯลฯ )
pdftxtextract
จากPodofo
Abiwordสามารถเรียกได้จาก commandline เพื่อแปลงระหว่างรูปแบบใด ๆ ที่สามารถป้อนจาก / ส่งออกเป็นและด้วยปลั๊กอินนำเข้าที่เหมาะสมซึ่งรวมถึง PDF:
abiword --to=txt file.pdf
(ในความเป็นธรรมฉันคิดว่า AbiWord และความสามารถทั้งสองใช้ห้องสมุด poppler แต่ฉันไม่ได้คิดบวก)