มีหลายวิธีในการแปลงเว็บเพจเป็น PDF (บริการออนไลน์, bookmarklets, พิมพ์เป็น PDF, ฯลฯ ... )
แต่สิ่งเหล่านี้ไม่สามารถสร้าง PDF ที่ค้นหาได้ ดูเหมือนว่าพวกเขาทั้งหมดแปลง HTML เป็นภาพขนาดมหึมาหนึ่งภาพ มีการแปลงเว็บเพจเป็นไฟล์ PDF ที่ค้นหาได้หรือไม่?
มีหลายวิธีในการแปลงเว็บเพจเป็น PDF (บริการออนไลน์, bookmarklets, พิมพ์เป็น PDF, ฯลฯ ... )
แต่สิ่งเหล่านี้ไม่สามารถสร้าง PDF ที่ค้นหาได้ ดูเหมือนว่าพวกเขาทั้งหมดแปลง HTML เป็นภาพขนาดมหึมาหนึ่งภาพ มีการแปลงเว็บเพจเป็นไฟล์ PDF ที่ค้นหาได้หรือไม่?
คำตอบ:
ฉันพบ wkhtmltopdf โครงการซึ่งดูเหมือนจะทำเคล็ดลับ มันเป็นบรรทัดคำสั่งดังนั้นจึงมีช่วงโค้งการเรียนรู้เล็กน้อย แต่ก็ไม่ได้แย่เกินไป
โดยเฉพาะการแปลงหน้าเว็บให้เปิดหน้าต่างคำสั่งในไดเรกทอรีที่ wkhtmltopdf
ได้รับการติดตั้งและดำเนินการต่อไปนี้:
wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf
แอปพลิเคชั่นมีตัวเลือกจำนวนมากที่ออกแบบมาเพื่อปรับแต่งเอาต์พุตตามที่ต้องการ แต่ค่าเริ่มต้นจะให้ผลลัพธ์ที่ดีทีเดียว
นักเขียน CutePDF ใช้ GhostScript สำหรับการประมวลผลข้อความจากนั้น ps2pdf เพื่อสร้าง PDF ที่สามารถค้นหาได้ของหน้าเว็บ แน่นอนว่านี่จะไม่ทำงานหากข้อความในหน้านั้นเป็นรูปภาพที่จะเริ่มต้นด้วย
ปัญหาในการแก้ไขปัญหาการพิมพ์เป็น PDF คืออะไร ฉันมีเครื่องพิมพ์เสมือนสองเครื่องติดตั้งอยู่ในระบบของฉัน: ผู้สร้าง PDF & amp; เครื่องพิมพ์เสมือนจาก Adobe Acrobat X ทั้งสองทำงานได้ดี ฉันสามารถค้นหาข้อความใน PDF ที่สร้างได้อย่างง่ายดายตราบใดที่โปรแกรมดู PDF ของฉันมีความสามารถใน OCR (ซึ่งเป็นเรื่องปกติในปัจจุบัน)
หากคุณกำลังคิดที่จะสร้างบางสิ่งเช่นข้อความและเอกสารคำคุณไม่สามารถทำได้ ข้อ จำกัด ของรูปแบบ PDF หรือระบุว่ารูปแบบ PDF ทำงานอย่างไร ด้วยเหตุนี้เราจึงสามารถฝังแบบอักษร ฯลฯ ในรูปแบบนี้โดยไม่ต้องพึ่งพาเพื่อให้เป็นสากล
และฉันไม่คิด wkhtmltopdf โครงการสามารถสร้างไฟล์ PDF ซึ่งสามารถค้นหาข้อความโดยไม่ต้องใช้เทคโนโลยี OCR (เพราะจะเป็นการละเมิดข้อกำหนด PDF)
ฉันใช้ Adobe Acrobat 8 Professional (รุ่นปัจจุบันคือ Adobe Acrobat X ) มันมีตัวเลือกเมนู File... Create PDF... From Web Page...
ซึ่งขอให้ฉัน URL จากนั้นจะดาวน์โหลดหน้าเว็บที่ URL เป็นไฟล์ PDF พร้อมข้อความที่ค้นหาได้ นอกจากนี้ยังจะแปลงหน้าที่เชื่อมโยงไปยังจากหน้านั้นซ้ำ คุณสามารถจบด้วยหน้า HTML จำนวนมากในไฟล์ PDF แบบหลายหน้าพร้อมกับลิงก์ระหว่างหน้าที่สงวนไว้
สำหรับบางหน้าเว็บ Acrobat สร้าง PDF ทำให้การจัดรูปแบบผิด ในกรณีที่ฉันกลับไปที่ Adobe PDF 8.0
ไดรเวอร์เครื่องพิมพ์ที่ Acrobat 8 Professional ติดตั้งบนระบบของฉัน มันดีมากที่จะให้ PDF ที่เทียบเท่ากับเว็บเพจที่ฉันกำลังดูพร้อมข้อความที่ค้นหาได้
Adobe Acrobat 8 Professional ไม่ใช่ซอฟต์แวร์ฟรี มันเป็นซอฟต์แวร์ที่มีราคาเต็ม อย่างไรก็ตาม IMHO มันสมควรได้รับตำแหน่งในคอมพิวเตอร์ของผู้ใช้ความรู้ทุกคนเช่นเดียวกับ Microsoft Office และคุณไม่ได้ระบุว่าคุณยืนยันใน ฟรี ซอฟต์แวร์ในการแปลงเว็บเพจเป็น PDF ที่ค้นหาได้
นี่เป็นเครื่องมือที่ดีที่จะแปลงเว็บเพจเป็น PDF ที่สามารถค้นหาได้: http://kitpdf.com/web_to_pdf/ . ลองและดูว่ามันตอบสนองความต้องการของคุณ
ฉันเพิ่งพิมพ์หน้านี้ใน Google Chrome และบันทึกเป็น pdf ฉันไม่มีปัญหากับการใช้การค้นหาในไฟล์ PDF ที่พิมพ์ออกมา ผลลัพธ์อาจแตกต่างกันไปขึ้นอยู่กับประเภทของหน้าหากหน้ามีเฟรมแฟลช - ส่วนใหญ่คุณจะไม่สามารถค้นหาเนื้อหาที่นั่น
GrabzIt สามารถแปลงหน้าเว็บเป็น PDF ที่ค้นหาได้อย่างสมบูรณ์ มากกว่าพวกเขาให้ฟรี เครื่องมืองานที่กำหนดเวลาออนไลน์ ซึ่งหมายความว่าไม่จำเป็นต้องมีการเข้ารหัส
PrimoPDF! ว่าง. มันทำงานได้อย่างสมบูรณ์และสามารถเปลี่ยนสิ่งที่คุณสามารถพิมพ์เป็น PDF (ค้นหาได้) มันทำงานได้โดยการเพิ่มตัวเองเป็นเครื่องพิมพ์ใหม่ ถอนการติดตั้งง่ายเช่นกัน
หวังว่านี่จะช่วยได้