การแปลง HTML เป็น PDF โดยอัตโนมัติอย่างสมเหตุสมผล (ในสภาพแวดล้อม UNIX / Linux) [ปิด]


16

มีวิธีการสร้างเอกสาร PDF จากไฟล์ HTML โดยอัตโนมัติใน Linux หรือไม่ที่ PDF มีระดับความคล้ายคลึงกับไฟล์อินพุตที่เหมาะสม?

เครื่องมือบรรทัดคำสั่งซึ่งแตกต่างจาก GUI เชิงโต้ตอบบางประเภทเป็นกุญแจสำคัญ

แน่นอนว่าฉันได้ลองhtmldocและญาติ ๆ ที่เกี่ยวข้องแล้ว แต่เครื่องมือเหล่านี้เป็นยุคหินอย่างสิ้นหวัง htmldocไม่รองรับ CSS เลย คุณจะไม่พบมากของเอกสาร HTML วันนี้ที่ไม่ได้มีอย่างน้อยบาง CSS สไตล์ ฉันไม่สนใจเรื่องโง่ ๆ หรือการปรุงแต่งเล็กน้อย แต่ปัญหาก็คือ CSS เป็นแก่นของโครงร่างส่วนใหญ่ในทุกวันนี้ มีคนไม่มากที่ใช้ตารางซ้อนกัน 6 ชั้นอีกต่อไป ดังนั้นหากเครื่องมือแปลงไม่มีความเข้าใจ CSS ใด ๆ มันไม่ใช่แค่เรื่องของ "เอกสารดูไม่ถูกต้อง"; มีแนวโน้มที่จะไม่ตรงตามมาตรฐานขั้นต่ำของการใช้งานเลย

บางคนแนะนำให้ฉันลองใช้เครื่องมือสร้างภาพเคลื่อนไหวตุ๊กแกเพื่อสร้างภาพที่สามารถแปลงเป็น PDF ได้ แต่ฉันไม่รู้ว่าจะทำสิ่งนี้ได้อย่างไรปล่อยให้อยู่คนเดียวได้อย่างง่ายดาย

ฉันไม่มีปัญหาในการเชื่อว่ามีเครื่องมือทางการค้าที่ดีที่ทำสิ่งนี้ แต่ฉันกำลังมองหาแพ็คเกจโอเพ่นซอร์สจริง ๆ ถ้าเป็นไปได้เพราะความพยายามนั้นเป็นโอเพนซอร์ซและไม่จ่ายเงิน

ขอบคุณล่วงหน้า!

คำตอบ:


7

คุณเคยเห็นwkhtmltopdfไหม? ไม่สามารถบอกได้ว่ามันทำงานได้ดีแค่ไหน แต่ดูเหมือนว่าคุณต้องการ ปัญหาเดียวอาจเกิดขึ้นกับโซลูชันนี้และ 'เบราว์เซอร์อัตโนมัติ' ใด ๆ ที่จะรับสไตล์การพิมพ์มากกว่าที่จะแสดงหน้าจอหนึ่งดังนั้น PDF อาจไม่ตรงกับที่คุณเห็นบนหน้าจอ


สไตล์ชีทการพิมพ์คืออะไร ฉันต้องไม่พลาดสิ่งใหม่ล่าสุดและยิ่งใหญ่ที่สุดจากจักรวาล CSS
Alex Balashov

ไม่มีอะไรใหม่มันเป็นเพียงการใช้งานได้จริงสำหรับเว็บไซต์ส่วนใหญ่เมื่อพวกเขาเปลี่ยนเป็น CSS เพื่อจัดวางแทนตาราง ลองalistapart.com/articles/goingtoprintหรือwebcredible.co.uk/user-friendly-resources/css/...สำหรับการแนะนำ
robertc


2

XHTML2PDFเป็นชุดเครื่องมือ Python ที่มีทั้งสคริปต์บรรทัดคำสั่งและไลบรารี Python (หากคุณต้องการฝังสิ่งนี้ในบางสิ่งที่ใหญ่กว่าโดยไม่ต้องใช้ shelling กับสคริปต์) รองรับ HTML / XHTML และ CSS พร้อม CSS สไตล์เฉพาะของผู้จำหน่ายเพิ่มเติม ปรับแต่งเอาต์พุตที่จัดรูปแบบ (เช่นหมายเลขหน้าโฟลว์ย่อหน้า ฯลฯ )

ฉันใช้มันเพียงเล็กน้อยเพื่อประมวลผลเอกสาร HTML เพียงเล็กน้อย แต่ก็ใช้งานได้ดี คู่มือถูกซ่อนอยู่ในหน้าตัวอย่าง แต่เป็นตัวอย่างที่ดีของการแปลงจากเอกสาร HTML เป็น PDF

ฉันมีตัวอย่างลิงค์ "ก่อน" และ "หลัง" ที่ดี แต่ฉันเพิ่งสร้างบัญชีของฉันและเห็นได้ชัดว่ามีผู้ส่งอีเมลขยะเพียงหนึ่งรายเท่านั้นที่ใส่ลิงค์มากกว่าหนึ่งรายการในโพสต์แรก :-p


1

ฉันต้องการสร้าง PNG บางส่วนจากหน้า HTML จากบรรทัดคำสั่ง บางที่ฉันพบสคริปต์ทับทิมนี้ที่ใช้ mozembed เพื่อสร้างภาพหน้าจอ คุณสามารถลบเส้นสเกลได้หากคุณไม่ต้องการให้ปรับขนาด

ปัญหาเดียวที่ฉันเห็นคือหน้าจริงปรากฏบนหน้าจอสักครู่ ...


หืมมม ส่วนสุดท้ายดูเหมือนจะเป็นนักฆ่า สิ่งนี้จะต้องถูกนำไปอบแบ็กเอนด์ฝั่งเซิร์ฟเวอร์อย่างหมดจด ไม่มีหัวจอแสดงผลหรืออะไร วิธีใดที่จะบรรลุเป้าหมายนั้น?
Alex Balashov

0

ลอง dompdf มันใช้งานได้ดีจากคำสั่ง de และโดยตัวอย่างมันใช้งานได้กับ html ทุกชนิด


0

PrinceXML สามารถจัดการ CSS ได้ดี มีรุ่น Linux, Windows, Mac OS X AFAICS นี่เป็นเทคโนโลยีที่อยู่เบื้องหลังผลลัพธ์ PDF ของ Google เอกสาร แต่หมายเหตุ: นี่คือเครื่องชำระเงิน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.