แทนแบบอักษรในเอกสาร PDF


13

ฉันมีเอกสาร PDF (ไม่เข้ารหัส) ด้วยฟิลด์แบบฟอร์มที่แก้ไขได้ อย่างไรก็ตามแบบอักษรสำหรับฟิลด์เหล่านั้นใช้งานไม่ได้: มันหายไปบางร่ายมนตร์ดังนั้นเมื่อฉันป้อนข้อความช่องว่างบางอย่างจะปรากฏขึ้น

ฉันจะแก้ไขเอกสาร PDF ได้อย่างไร - ฉันไม่สามารถเข้าถึงเอกสารต้นฉบับที่ใช้ในการสร้างมันได้ - เพื่อทดแทนแบบอักษรที่แตกต่างแทนที่เอกสารที่เสียหายได้อย่างไร

แบบอักษรที่เป็นปัญหาคือ Adobe Caliban Regularซึ่งฉันเห็นว่าฝังอยู่ในเอกสาร ร่ายมนตร์ที่แสดงว่างรวมถึง "i", "T", "V"; บางทีคนอื่นที่ฉันไม่ได้ค้นพบ

ฉันยังมีเอกสารอื่นที่คล้ายกันโดยใช้คาลิบันซึ่งจะแสดงผลอย่างถูกต้องรวมทั้งร่ายมนตร์ที่ระบุไว้ข้างต้นเสีย หากใครบางคนสามารถบอกฉันถึงวิธีการใช้แบบอักษรจากหนึ่ง PDF และแทนที่เป็น PDF ที่มีอยู่นั่นจะเป็นวิธีแก้ปัญหา

ฉันกำลังใช้:

  • Debian GNU + Linux
  • Evince (และฉันก็ลองOkular ) เพื่อดู
  • Popplerห้องสมุดสำหรับการแสดงผลในรูปแบบ PDF
  • Emacs (หรือโปรแกรมแก้ไขข้อความใด ๆ ) สำหรับการแก้ไขรหัส PDF
  • ติดตั้งpdftkและOpenOffice.orgหากเป็นเช่นนั้น

ฉันจะสนใจเครื่องมือแก้ไข PDF ซอฟต์แวร์ฟรีอื่น ๆ( ไม่ว่าจะเป็นราคาที่เป็นศูนย์หรือไม่ก็ตาม) หากพวกเขาจะช่วยงานนี้


คุณใช้ซอฟต์แวร์ดูหรือแก้ไข PDF ประเภทใด แบบอักษรใดที่เขตข้อมูลฟอร์มใช้อยู่ และแบบอักษรนั้นฝังอยู่หลังจากที่คุณบันทึกฟอร์ม PDF ไปยังชื่อไฟล์อื่นหรือไม่
Kurt Pfeifle

ขอบคุณสำหรับความคิดเห็นฉันได้ขยายคำอธิบายเพื่อตอบคำถามของคุณ
bignose

อีกหนึ่งคำถาม: คุณสามารถตั้งชื่อ glyphs (ความหมายคร่าว ๆ : รูปทรงตัวอักษร) ที่คุณต้องการใส่ลงในฟิลด์แบบฟอร์มและแสดงเป็นช่องว่างได้หรือไม่
Kurt Pfeifle

แบบอักษร Caliban ของคุณมีลักษณะเช่นนี้: linotype.com/de/202/caliban-schriftfamilie.htmlหรือค่อนข้างเช่นนี้: fontspace.com/george-williams/caliban
Kurt Pfeifle

1
@bignose คุณพบวิธีแก้ปัญหานี้หรือไม่?
Jubei

คำตอบ:


5

มันยากมากที่จะแทนที่แบบอักษรที่ฝังอยู่ใน PDF ฉันไม่ได้ตระหนักถึงความเป็นอิสระในการพูด (GPL ได้รับใบอนุญาต) หรือฟรี as-ในเบียร์ (ฟรี) ซอฟแวร์ใด ๆ ที่อาจอาจจะทำอย่างนั้น (โดยยกเลิกการฝังตัวอักษรแรกและจากนั้นอีกครั้งฝัง แบบอักษรแบบยั่งยืน) ฉันเพียงรู้ของทั้งสองผลิตภัณฑ์ในเชิงพาณิชย์ซึ่งทำที่: callassoftware.com ของpdfToolbox4และ Enfocus' PitStop (แน่นอนว่ายังมีคนอื่น ๆ แน่นอน แต่ฉันไม่ได้ตระหนักถึงพวกเขาและทั้งสองเป็นผู้นำตลาดที่นี่)

ต่อไปนี้เป็นวิธีแยกแบบอักษรแบบฝังจาก PDF โดยใช้ซอฟต์แวร์ฟรี โปรดระวังว่าคุณได้รับอนุญาตตามกฎหมายเท่านั้นหากใบอนุญาตแบบอักษรไม่ได้ห้าม ในที่เก็บซอร์สโค้ด Ghostscript จะใช้ยูทิลิตีโปรแกรม PostScript extractFonts.psซึ่งตั้งชื่อไว้ซึ่งสามารถช่วยเหลือได้ที่นี่:

  1. ติดตั้ง Ghostscript ใช้เวอร์ชันล่าสุด 8.71
  2. ดาวน์โหลดไฟล์ http://svn.ghostscript.com/ghostscript/trunk/gs/toolbin/extractFonts.ps
  3. คุณอาจต้องการอ่านความคิดเห็นที่อยู่ในไฟล์ที่ดาวน์โหลด
  4. เรียกใช้คำสั่งต่อไปนี้ในกล่อง DOS (cmd.exe):

    gswin32c.exe ^
        -q ^
        -dNODISPLAY ^
        C:/path/to/extractFonts.ps ^
        -c "(c:/path/to/your-pdf-file.pdf) extractFonts quit"
    
  5. จดบันทึกคำเตือนหรือข้อความแสดงความผิดพลาดไว้เป็นอย่างดีคำสั่งอาจพ่นออกมา
  6. ตอนนี้การแยกแบบอักษรที่ประสบความสำเร็จจะถูกเก็บไว้ในไดเรกทอรีปัจจุบันของคุณโดยใช้ชื่อเดียวกับใน PDF

(โปรดทราบว่าการสกัดแบบอักษรที่นี่ไม่ได้หมายความว่าการถอดอักษรจากไฟล์ PDF แต่เพื่อสร้าง fontfiles ซึ่งเป็นสำเนาของคนที่ฝังตัวในรูปแบบไฟล์ PDF.)


นี่คือ Building Block อื่นที่อาจนำไปสู่การบรรลุสิ่งที่คุณต้องการ คุณอาจต้องการที่จะบีบอัดชิ้นส่วน / สตรีมที่บีบอัดทั้งหมดของ PDF ของคุณเพื่อให้คุณสามารถแก้ไขไฟล์ได้ง่ายขึ้นด้วยเครื่องมือแก้ไขข้อความอย่างง่าย (คำเตือน: การแก้ไข PDF ไม่ใช่เรื่องง่ายตรงไปตรงมา - ความพยายามแก้ไขของคุณจะต้องใช้ความรู้และความชาญฉลาดเกี่ยวกับรูปแบบไฟล์ PDF ภายใน)

เคล็ดลับนี้ยังใช้ประโยชน์จากtoolbinไดเรกทอรีย่อยของการโค่นล้มผีของ

  1. ดาวน์โหลดไฟล์http://svn.ghostscript.com/ghostscript/trunk/gs/toolbin/pdfinflt.ps
  2. คุณอาจต้องการอ่านความคิดเห็นในไฟล์ที่ดาวน์โหลด
  3. เรียกใช้คำสั่งต่อไปนี้ในกล่อง DOS (cmd.exe):

    gswin32c.exe ^
         -- ^
         c:/path/to/pdfinflt.ps ^
         c:/path/to/your-pdf-file.pdf ^
         c:/path/to/your-pdf-file-decompressed.pdf
    

คำสั่งนี้จะพยายามคลายการบีบอัดข้อมูลแบบ'flate'ทั้งหมด (หากคุณโชคไม่ดีไฟล์ของคุณจะมีสตรีมโดยใช้วิธีการบีบอัดอื่น ๆ (เช่น'zip' ) ซึ่งจะไม่เปลี่ยนแปลงโดยคำสั่งนี้)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.