มันยากมากที่จะแทนที่แบบอักษรที่ฝังอยู่ใน PDF ฉันไม่ได้ตระหนักถึงความเป็นอิสระในการพูด (GPL ได้รับใบอนุญาต) หรือฟรี as-ในเบียร์ (ฟรี) ซอฟแวร์ใด ๆ ที่อาจอาจจะทำอย่างนั้น (โดยยกเลิกการฝังตัวอักษรแรกและจากนั้นอีกครั้งฝัง แบบอักษรแบบยั่งยืน) ฉันเพียงรู้ของทั้งสองผลิตภัณฑ์ในเชิงพาณิชย์ซึ่งทำที่: callassoftware.com ของpdfToolbox4และ Enfocus' PitStop (แน่นอนว่ายังมีคนอื่น ๆ แน่นอน แต่ฉันไม่ได้ตระหนักถึงพวกเขาและทั้งสองเป็นผู้นำตลาดที่นี่)
ต่อไปนี้เป็นวิธีแยกแบบอักษรแบบฝังจาก PDF โดยใช้ซอฟต์แวร์ฟรี โปรดระวังว่าคุณได้รับอนุญาตตามกฎหมายเท่านั้นหากใบอนุญาตแบบอักษรไม่ได้ห้าม ในที่เก็บซอร์สโค้ด Ghostscript จะใช้ยูทิลิตีโปรแกรม PostScript extractFonts.ps
ซึ่งตั้งชื่อไว้ซึ่งสามารถช่วยเหลือได้ที่นี่:
- ติดตั้ง Ghostscript ใช้เวอร์ชันล่าสุด 8.71
- ดาวน์โหลดไฟล์ http://svn.ghostscript.com/ghostscript/trunk/gs/toolbin/extractFonts.ps
- คุณอาจต้องการอ่านความคิดเห็นที่อยู่ในไฟล์ที่ดาวน์โหลด
เรียกใช้คำสั่งต่อไปนี้ในกล่อง DOS (cmd.exe):
gswin32c.exe ^
-q ^
-dNODISPLAY ^
C:/path/to/extractFonts.ps ^
-c "(c:/path/to/your-pdf-file.pdf) extractFonts quit"
- จดบันทึกคำเตือนหรือข้อความแสดงความผิดพลาดไว้เป็นอย่างดีคำสั่งอาจพ่นออกมา
- ตอนนี้การแยกแบบอักษรที่ประสบความสำเร็จจะถูกเก็บไว้ในไดเรกทอรีปัจจุบันของคุณโดยใช้ชื่อเดียวกับใน PDF
(โปรดทราบว่าการสกัดแบบอักษรที่นี่ไม่ได้หมายความว่าการถอดอักษรจากไฟล์ PDF แต่เพื่อสร้าง fontfiles ซึ่งเป็นสำเนาของคนที่ฝังตัวในรูปแบบไฟล์ PDF.)
นี่คือ Building Block อื่นที่อาจนำไปสู่การบรรลุสิ่งที่คุณต้องการ คุณอาจต้องการที่จะบีบอัดชิ้นส่วน / สตรีมที่บีบอัดทั้งหมดของ PDF ของคุณเพื่อให้คุณสามารถแก้ไขไฟล์ได้ง่ายขึ้นด้วยเครื่องมือแก้ไขข้อความอย่างง่าย (คำเตือน: การแก้ไข PDF ไม่ใช่เรื่องง่ายตรงไปตรงมา - ความพยายามแก้ไขของคุณจะต้องใช้ความรู้และความชาญฉลาดเกี่ยวกับรูปแบบไฟล์ PDF ภายใน)
เคล็ดลับนี้ยังใช้ประโยชน์จากtoolbin
ไดเรกทอรีย่อยของการโค่นล้มผีของ
- ดาวน์โหลดไฟล์http://svn.ghostscript.com/ghostscript/trunk/gs/toolbin/pdfinflt.ps
- คุณอาจต้องการอ่านความคิดเห็นในไฟล์ที่ดาวน์โหลด
เรียกใช้คำสั่งต่อไปนี้ในกล่อง DOS (cmd.exe):
gswin32c.exe ^
-- ^
c:/path/to/pdfinflt.ps ^
c:/path/to/your-pdf-file.pdf ^
c:/path/to/your-pdf-file-decompressed.pdf
คำสั่งนี้จะพยายามคลายการบีบอัดข้อมูลแบบ'flate'ทั้งหมด (หากคุณโชคไม่ดีไฟล์ของคุณจะมีสตรีมโดยใช้วิธีการบีบอัดอื่น ๆ (เช่น'zip' ) ซึ่งจะไม่เปลี่ยนแปลงโดยคำสั่งนี้)