วิธีแปลง html เป็น doc / docx ด้วย OpenOffice หรือ LibreOffice


1

ฉันพยายามแปลง html เป็น doc หรือ docx ฉันใช้คลาส PHP ที่มี แต่ผลลัพธ์ไม่ดี ฉันสงสัยว่าฉันสามารถแปลงไฟล์ html เป็น doc โดยใช้ซอฟต์แวร์ office บางตัวเช่น LibreOffice หรือ OpenOffice ได้หรือไม่

LibreOffice (AbiWord) "แปลง" html เป็นไฟล์ doc แต่ไม่มีการจัดรูปแบบ ฉันหมายถึงฉันเห็นซอร์สโค้ด HTML เมื่อฉันเปิดไฟล์ doc

abiword --plugin AbiCommand
convert /home/qqq/test/test.htm /home/qqq/test/test.doc doc

และด้วย openOffice ไม่มีอะไรเกิดขึ้น .. :

soffice --headless --convert-to doc:DOC  /home/qqq/test/test.htm

ฉันต้องกด ctrl + c เพื่อกลับไปที่คอนโซล

ความคิดเห็นใด ๆ วิธีการแปลง html เป็น doc? ฉันสามารถเปิด html ในเวอร์ชันเดสก์ท็อปของทั้งสองแอพและบันทึกเป็น doc แต่ดูเหมือนว่าจะไม่ทำงานในเวอร์ชันคอนโซล


IIRC, libre / openoffice จะไม่ทำงานเว้นแต่จะมีเพียงอินสแตนซ์เดียวเท่านั้นที่เปิด นั่นอาจเป็นปัญหาของคุณกับคำสั่งที่สอง
evilsoup

pandocทำได้ค่อนข้างดี แต่คุณ จำกัด คำถามของคุณไว้เฉพาะ OO / LO ดังนั้นฉันจึงไม่ตอบคำถามนี้ ...
ม.ค.

@Jan - ติดตั้งและทดสอบแล้ว มันไม่ทำงาน. มันเปลี่ยนชื่อ html เป็น docx แต่ไม่มีการแปลงจริง :( ฉันเปิดให้บริการสำหรับการแก้ปัญหาใด ๆ
MilMike

เพียงตรวจสอบอีกครั้งทำงานตามที่ควรจะเป็น: pandoc -s -r html page.html -o output.docx... มันเป็นโปรแกรมที่ซับซ้อนมากและคุณต้องคุ้นเคยกับมัน
ม.ค.

หากคุณเปิด output.docx ในเท็กซ์เอดิเตอร์คุณจะเห็นว่ามันเป็นเพียงซอร์สโค้ด HTML และซอร์สโค้ดก็ถูกทำลายโดยแพนโดกด้วย html ใน docx นั้นไม่เหมือนกับ html ต้นทางของฉัน - ผลลัพธ์ดูแย่มาก
MilMike

คำตอบ:


0

นี่อาจเป็นวิธีแก้ปัญหาที่โง่หรือมีลักษณะเฉพาะกับไฟล์ HTML ที่ฉันใช้อยู่ แต่ลองเปลี่ยนชื่อไฟล์ด้วยนามสกุล. docx ฉันสามารถเปิดเป็นไฟล์ "word" และบันทึกเป็นไฟล์คำได้ในภายหลัง


ถ้ามันใช้งานได้ผล
บ้า

0

นี่เป็นการตอบกลับที่ช้ามาก แต่ฉันหวังว่าจะช่วยได้ไม่กี่คน

LibreOffice ใช้ประโยชน์จากตัวกรอง

ในตัวอย่างโค้ดด้านล่าง (แปลง HTML เป็น PDF เป็นต้น) คุณจะสังเกตเห็นอาร์กิวเมนต์ตัวเลือกรองเช่น --infilter = writerglobal8_HTML และ: writer_web_pdf_Export:

soffice --headless --infilter=writerglobal8_HTML  --convert-to pdf:writer_web_pdf_Export --outdir /SomeFolder/Output /SomeFolder/Example.html

สิ่งเหล่านี้เรียกว่า 'ตัวกรอง' มันเทียบเท่ากับหมวดหมู่ย่อยของแต่ละประเภทไฟล์ ตัวอย่างเช่น. doc อาจเป็นเอกสาร Microsoft Office 95 หรือเอกสาร 2003 โดยพื้นฐานแล้วมันให้เบาะแสแก่ LibreOffice ว่าไฟล์นั้นอยู่ในรูปแบบใด

มีตัวกรองสองประเภทตัวกรองแบบ in (โดยทั่วไปคือ 'รูปแบบย่อยคือไฟล์ขาเข้า') และตัวกรองแบบออก (รูปแบบใดคือขาออก, IE ที่ส่งออก, ไฟล์เข้า)

ในกรณีของคุณตัวกรอง DOC ที่ถูกต้องรวมอยู่ด้วย (ซึ่งมีที่ว่างรวมอยู่ด้วยคุณอาจต้องใช้ใบเสนอราคา แต่บ่อยครั้งที่ฉันพบว่าราคาไม่ทำงานดังนั้นระยะทางของคุณอาจแตกต่างกันไป):

MS WinWord 5
MS WinWord 6.0
MS Word 2003 XML      
MS Word 2007 XML      
MS Word 2007 XML Template      
MS Word 2007 XML VBA      
MS Word 95      
MS Word 95 Vorlage      
MS Word 97      
MS Word 97 Vorlage      
MS_Works      
MS_Write

คุณสามารถทำงานออกบางส่วนของฟิลเตอร์ไฟล์จาก (ค่อนข้างเป็นระเบียบ) .ods อุปกรณ์ LibreOffice แผ่นพบที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.