วิธีค้นหาแบบอักษรที่อ้างอิงและแบบอักษรที่ฝังอยู่ในเอกสาร PDF


105

เรามีปัญหาเล็กน้อยเกี่ยวกับแบบอักษรในเอกสาร PDF เพื่อที่จะวางนิ้วบนปัญหาที่ฉันต้องการตรวจสอบว่าแบบอักษรใดที่ฝังอยู่ในเอกสาร pdf จริงและมีการอ้างอิงเท่านั้น มีวิธีที่ง่าย (และราคาถูกเหมือนฟรี) ในการทำเช่นนั้นหรือไม่?

คำตอบ:


144

pdffontsเครื่องมือบรรทัดคำสั่งมีพื้นเพมาจากxpdfนี้เป็นส่วนหนึ่งของPoppler

เครื่องมือนี้มีอยู่ในลีนุกซ์ส่วนใหญ่เป็นส่วนหนึ่งของpoppler-utilsแพ็คเกจ

ตัวอย่างการใช้งานและผลลัพธ์:

$ pdffonts some.pdf 

name                                 type              emb sub uni object ID
------------------------------------ ----------------- --- --- --- ---------
BAAAAA+Arial-Black                   TrueType          yes yes yes     53  0
CAAAAA+Tahoma                        TrueType          yes yes yes     28  0
DAAAAA+Wingdings-Regular             TrueType          yes yes yes     43  0
EAAAAA+Webdings                      TrueType          yes yes yes     38  0
FAAAAA+Arial-BoldMT                  TrueType          yes yes yes     33  0
GAAAAA+Tahoma-Bold                   TrueType          yes yes yes     23  0
HAAAAA+OpenSymbol                    TrueType          yes yes yes     48  0

เพื่อหลีกเลี่ยง linkrot โปรดใส่ตัวอย่างและ / หรือเอกสารบางส่วน
Jake Berger

ดูเหมือนว่าจะได้รับการติดตั้งโดยค่าเริ่มต้นในการติดตั้ง Lubuntu 14.10 ของฉัน
DaAwesomeP

8
สำหรับผู้ใช้ Mac brew install popplerสามารถpdffontsรับคำสั่งได้อย่างง่ายดาย
Edward Newell

ใน evince document viewer ไปที่ File -> properties -> Fonts tab
Lnux

86

ง่ายกว่ามากหากคุณต้องการค้นหาชื่อแบบอักษร: เรียกใช้สิ่งนี้จากเทอร์มินัล

strings yourPDFfilepath.pdf | grep FontName

12
Windows: findstr FontName yourPDFfilepath.pdf
Craigo

11
ไม่ได้ผลสำหรับฉัน (Mac ที่มี PDF ที่สร้างโดยลาเท็กซ์) pdffontsแสดงแบบอักษรที่ฝังอยู่สองแบบ สิ่งนี้ไม่แสดง เห็นได้ชัดว่าวิธีนี้ใช้ได้ผลบ้าง แต่ไม่น่าเชื่อถือ
Mike

ลองใช้ตัวพิมพ์เล็ก f บน fontName
Ken Aspeslagh

@texnic ลองนี่สิ คลิกขวาและเปิดไฟล์ในโปรแกรมแก้ไขข้อความ (เช่น Notepad) และค้นหา FontName
Kevin Lee

50

ในที่สุดฉันก็ได้ไฟล์ตัวอย่างที่ดูเหมือนจะมีฟอนต์ฝังอยู่

ใช้ Adobe Reader ปกติ (หรือ Foxit ถ้าคุณต้องการ) เลือกไฟล์ -> คุณสมบัติบนกล่องโต้ตอบผลลัพธ์เลือกแท็บฟอนต์ คุณจะเห็นรายการแบบอักษร คนที่ฝังไว้จะระบุข้อเท็จจริงนี้ใน () หลังชื่อแบบอักษร


5

CAM :: PDFมีตัวรายงานแบบอักษรพร้อมใช้งานในรูปแบบยูทิลิตี้บรรทัดคำสั่งหรือผ่านการเรียกไลบรารี หากคุณเรียกใช้ "listfont.pl file.pdf" คุณจะได้ผลลัพธ์ดังนี้:

Page 1:
  Name: F1.0
    Type: TrueType
    BaseFont: NZUXSR+Impact
    Encoding: MacRomanEncoding
    Widths: yes
      Characters: 0-255
    Embedded: yes
  Name: F2.0
    Type: TrueType
    BaseFont: XSFKRA+ArialMT
    Encoding: MacRomanEncoding
    Widths: yes
      Characters: 0-255
    Embedded: yes

3

คุณสามารถแยกแบบอักษรจาก PDF โดยใช้Online Font Converter


ปลั๊กไร้ยางอาย แต่เป็นวิธีการข้ามแพลตฟอร์มเดียวที่นี่ที่ส่งคืนการพิสูจน์ แถมยังดีไซต์เด็ดอีกด้วย
commonpike

1

โดยใช้ iText ฟรี (หรือ iTextSharp หากคุณใช้. NET) คุณสามารถเขียนยูทิลิตี้ที่จะดึงข้อมูลนี้ให้คุณโดยใช้เมธอด BaseFont.GetDocumentFonts

อ่านลิงค์นี้เพื่อดูรหัส

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.