วิธีแปลงไฟล์ pdf เป็นไฟล์ odt


32

ฉันต้องการแปลง.pdfไฟล์เป็น.odtไฟล์เพื่อให้ฉันสามารถแปลง.docไฟล์เป็นไฟล์เพิ่มเติมได้ มีซอฟต์แวร์ / สคริปต์ใด ๆ ที่สามารถทำได้ ฉันพยายามที่จะคัดลอกเนื้อหาของ.pdfไฟล์และวางไว้ในผู้เขียน liberoffice การจัดรูปแบบไม่ได้ถูกรักษาไว้

เอกสารเป็นความลับดังนั้นฉันไม่ต้องการใช้บริการออนไลน์ใด ๆ สำหรับการแปลง

ความช่วยเหลือใด ๆ ที่ชื่นชมอย่างมาก


ที่เกี่ยวข้อง (แต่ไม่ซ้ำ!): วิธีแปลง odt เป็น pdf?
Eliah Kagan

1
สำหรับ LIBREOFFICE / คำถามเฉพาะของ OpenOffice ฉันแนะนำAsk.libreoffice.org
Bucic

คำตอบ:


15

ฉันรู้สึกหงุดหงิดจากการที่ไม่มีตัวแปลง PDF เป็น ODT ฟรี ฉันไม่ต้องการอะไรที่ซับซ้อนเลยแม้แต่น้อย เป็นเครื่องมือที่สร้างไฟล์ ODT ที่ฉันสามารถใส่คำอธิบายประกอบใน LibreOffice (เช่นกรอกแบบฟอร์ม)

ฉันรู้วิธีการทำสิ่งนี้ด้วยตนเองโดยการแปลงเอกสาร PDF เป็นไฟล์กราฟิกแล้วนำเข้าสู่ LibreOffice แต่มันน่าเบื่ออย่างรวดเร็ว

ในที่สุดฉันก็เลยเขียนเชลล์สคริปต์สั้น ๆ ที่ทำตามขั้นตอนที่จำเป็นทั้งหมดโดยอัตโนมัติ คุณสามารถค้นหาได้ที่https://github.com/gutschke/pdf2odt

มันสามารถใช้ไฟล์ PDF และไฟล์รูปภาพเป็นจำนวนเท่าใดก็ได้และสร้างไฟล์ ODT ที่สามารถเปิดและแก้ไขใน LibreOffice รูปภาพจะปรากฏเป็นพื้นหลังของหน้าคุณจึงสามารถเขียนทับได้อย่างอิสระ แต่ละภาพมีความเกี่ยวข้องกับสไตล์หน้าของตัวเอง โปรดทราบว่าเมื่อแทรกตัวแบ่งหน้าและปรับลักษณะหน้าตามที่จำเป็น

ฉันทดสอบสคริปต์ทั้งบน Linux และ Mac เมื่อพิจารณาว่าจำเป็นต้องใช้เครื่องมือมาตรฐานเพียงหยิบมือเดียวเท่านั้นจึงควรพกพาได้


สคริปต์นี้สร้างภาพหน้าจอของแต่ละหน้าและแปลงเป็นรูปแบบเป้าหมายขอบคุณสำหรับสคริปต์ Gutschke
Oliver

ฉันเคยใช้pdf2ooเมื่อไม่กี่ปีที่ผ่านมา แต่ตอนนี้ดูเหมือนว่าจะสร้างไฟล์ที่เสียหายสำหรับ LibreOffice สคริปต์นี้ทำอย่างนั้นและอีกมากมาย - ขอบคุณ!
eacousineau

3
โชคไม่ดีที่สคริปต์ pdf2odt แปลงเป็นรูปแบบภาพที่ใช้เป็นพื้นหลัง ODT อย่าคาดหวังว่าจะสามารถ "แก้ไข" ข้อความต้นฉบับใด ๆ ได้
Richard Elkins

13

คุณสามารถดูPDF Utilities(poppler-utils ผ่าน Synaptic หรือ apt-get) ซึ่งรวมถึงpdftotext :

Poppler เป็นไลบรารีการเรนเดอร์ PDF จาก Xpdf PDF viewer

แพคเกจนี้ประกอบด้วยยูทิลิตี้บรรทัดคำสั่ง (ขึ้นอยู่กับ Poppler) สำหรับการรับข้อมูลของเอกสาร PDF แปลงเป็นรูปแบบอื่นหรือจัดการกับมัน:
* pdfdetach - แสดงรายการหรือแยกไฟล์ฝังตัว (ไฟล์แนบ)
* pdffonts - ตัววิเคราะห์ตัวอักษร
* pdfimages Image Extractor
* pdfinfo - ข้อมูลเอกสาร
* pdfseparate - เครื่องมือดึงข้อมูลหน้า
* pdftocairo - แปลง PDF เป็น PNG / JPEG / PDF / PS / EPS / SVG โดยใช้ Cairo
* pdftohtml - ตัวแปลง PDF เป็น HTML
* pdftoppm - PDF เป็น PPM / PNG / JPEG Image Converter
* pdftops - ตัวแปลงPDF เป็น PostScript (PS)
* pdftotext - การแยกข้อความ
* pdfunite - เครื่องมือการรวมเอกสาร

แน่นอนว่าความสำเร็จจะขึ้นอยู่กับการสร้างไฟล์ pdf ถ้าคุณได้รับสิ่งที่คุณต้องการเป็นไฟล์ข้อความ, คุณสามารถแล้วบันทึกว่าเป็นไฟล์ .odt

แก้ไข:ฉันลืมจัดหาแหล่งอ้างอิง มันมาจากแท็บคำอธิบายใน Synaptic สำหรับPDF Utilities (based on Poppler).


3
จากรายการนี้pdftohtmlจะต้องเหมาะสมที่สุดสำหรับงานเนื่องจาก HTML สามารถดำเนินการจัดรูปแบบ จากนั้นสามารถแปลง HTML เป็น ODT หรือ DOC
imz - Ivan Zakharyaschev

10

LibreOffice สามารถนำเข้า.pdfไฟล์ได้ เพียงเปิดใน LibreOffice เวอร์ชันปัจจุบันเพื่อผลลัพธ์ที่ดีที่สุด อย่างไรก็ตามมันจะเปิดเอกสารในรูปวาดและคุณจะสามารถแปลงเป็นรูปแบบภาพที่รองรับเพียงรูปแบบเดียวเท่านั้นไม่ใช่เอกสาร Writer

โดยธรรมชาติการจัดรูปแบบทั้งหมดไม่ได้ถูกสงวนไว้ แต่อย่างน้อยก็มี


1
ฉันลองมันเมื่อเร็ว ๆ นี้และมันแย่มากมันไม่ได้บันทึกการจัดรูปแบบแม้แต่น้อย ยิ่งไปกว่านั้นมันทำให้ข้อความอ่านไม่ได้เลย
Hi-Angel

3

หากมีการติดตั้งแพคเกจpoppler-utils สคริปต์ Nautilusด้านล่าง (ที่จะวางในโฟลเดอร์ ~ / .gnome2 / nautilus-สคริปต์เป็นไฟล์ที่ปฏิบัติการได้) จะช่วยแปลงไฟล์ PDF เป็น HTML (ตัวเลือก "-i" สามารถลบเพื่อรวม อิมเมจด้วย) ซึ่งสามารถเปิดได้ด้วย LibreOffice Writer และบันทึกเป็น ODTแม้ว่าความสำเร็จของการจัดรูปแบบการแปลงจะขึ้นอยู่กับการสร้าง PDF เป็นอย่างมาก

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


ขอบคุณสำหรับสคริปต์ที่มีประโยชน์นี้ เพียงคำพูดเล็ก ๆ (จากman pdftohtml): -noframes : generate no frames. Not supported in complex output mode.ดังนั้น-noframesจะไม่มีผลกระทบใด ๆ กับ-cชุด
Glutanimate

2
ขอบคุณฉันได้ลบตัวเลือกที่ซ้ำซ้อนนี้ออกจากสคริปต์ของฉันตอนนี้ สคริปต์ทุบตี zenity ขับเคลื่อนเพื่อให้ GUI สำหรับตัวเลือกทั้งหมดเหล่านี้จะเป็นสิ่งที่ดีมากดูเหมือนว่า ;-)
Sadi

#MHC ดูเหมือนว่าข้อมูลนี้ผิด หากเราไม่รวม -noframes เราจะได้รับไฟล์ html แยกต่างหากสำหรับหน้า pdf ดังนั้นฉันจึงใส่มันอีกครั้งในสคริปต์ของฉัน
Sadi

มันแปลกมาก จะต้องเป็นความผิดพลาดในเอกสารประกอบนั้น ฉันจะเปลี่ยนสำเนาสคริปต์ของฉันตามนั้น ขอบคุณสำหรับหัวขึ้น!
Glutanimate

3

ลองความสามารถ มันจะแปลงเป็น html และจากนั้นเป็นรูปแบบอื่น ๆ มันทำได้ค่อนข้างดีสำหรับไฟล์ขนาดใหญ่ (183 หน้า) ที่ฉันจะต้องพิมพ์

ในกรณีของฉันฉันแปลงเป็น epub แต่เพื่อความสนุกเพียงแปลงเป็น. docx ซึ่งเปิดออกได้ดีมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.