การค้นหาข้อมูลเมตาเกี่ยวกับ PDF


32

สมมติว่าฉันมี PDF และฉันต้องการได้รับข้อมูลเมตาใด ๆ ที่พร้อมใช้งานสำหรับ PDF นั้น ฉันควรใช้โปรแกรมอรรถประโยชน์ใด

ฉันพบชิ้นส่วนของข้อมูลที่ฉันมักจะสนใจรู้มากที่สุดคือขนาดกระดาษสิ่งที่ผู้ดู PDF มักไม่รายงาน เช่นจดหมายขนาด PDF, ถูกกฎหมาย, A4 หรืออย่างอื่นคืออะไร แต่ข้อมูลอื่น ๆ ที่มีอยู่อาจเป็นที่สนใจเช่นกัน

แก้ไข: นี่คือคำแนะนำที่มีประโยชน์กับขนาดกระดาษขอบคุณ @terdon


แปลก. ทำไมบางคนถึงลงคะแนนคำถามนี้ สนใจที่จะอธิบาย?
Faheem Mitha

คำตอบ:


39

หนึ่งในเครื่องมือที่เป็นที่ยอมรับในเรื่องนี้คือpdfinfoซึ่งมาพร้อมกับ xpdf หากฉันจำได้ ตัวอย่างผลลัพธ์:

[0 1017 17:10:17] ~/temp % pdfinfo test.pdf
Creator:        TeX
Producer:       pdfTeX-1.40.14
CreationDate:   Sun May 18 09:53:06 2014
ModDate:        Sun May 18 09:53:06 2014
Tagged:         no
Form:           none
Pages:          1
Encrypted:      no
Page size:      595.276 x 841.89 pts (A4)
Page rot:       0
File size:      19700 bytes
Optimized:      no
PDF version:    1.5

1
อย่างน้อยก็ใน Debian นี่เป็นส่วนหนึ่งของ poppler-utils ฉันมีไฟล์ที่นี่ซึ่ง pdfinfo รายงานว่า 595.2 x 841.44 แต้ม แต่นี่ไม่ได้รายงานว่าเป็น A4 ตัดสินใจทำเครื่องหมายเป็น A4 อย่างไร
Faheem Mitha

2
ชื่อคือ hardcoded : ตัวอักษรคือ 612 ± 0.1 x 792 ± 0.1, ขนาดมหัศจรรย์สำหรับ DIN / ISO A คือ (ทั้งหมด± 1 pt): 3370.98, 2383.64, 1685.49, 1191.82, 842.74, 595.91, ... ดูเหมือนว่า หน้าเว็บของคุณแคบเกินไปที่pdfinfoจะหยิบมันขึ้นมา
Ulrich Schwarz

ฉันเห็นบิตของรหัสif ((fabs(w - 612) < 0.1 && fabs(h - 792) < 0.1) || (fabs(w - 792) < 0.1 && fabs(h - 612) < 0.1))?
Faheem Mitha

นั่นคือตัวอักษรรูปแบบ A อยู่ในลูปกับsqrt(2)s
Ulrich Schwarz

13

ยูทิลิตี้มูลค่ามองเข้าไปอีกคือexiftool อาจไม่ใช่เครื่องมือที่เหมาะสมในกรณีเฉพาะของคุณเนื่องจากไม่ได้รายงานข้อมูลใด ๆ เกี่ยวกับรูปทรงเรขาคณิตของเอกสาร แต่โดยทั่วไปอาจเป็นเครื่องมือที่มีคุณสมบัติครบถ้วนที่สุดสำหรับการตรวจสอบข้อมูลเมตาของ PDF

นี่คือตัวอย่างของคำสั่งที่จะพิมพ์ข้อมูลเมตาทั้งหมดที่มีอยู่ ( -a) เรียงลำดับตามกลุ่ม ( -G1):

exiftool -a -G1 "$File"

เอกสารอย่างเป็นทางการนำเสนอภาพรวมของแท็กที่เกี่ยวข้องกับ PDF ที่รองรับ:

คุณสามารถติดตั้ง exiftool บน Debian / Ubuntu ด้วย:

sudo apt-get install libimage-exiftool-perl

หากคุณมีมากขึ้นในด้าน GUI ของสิ่งที่คุณสามารถให้โครงการของฉันPDFMtEdลอง เป็นชุดเครื่องมือที่ทำหน้าที่เป็นส่วนหน้าแบบกราฟิกเพื่อยกระดับและอนุญาตให้ดูและแก้ไขข้อมูลเมตาของ PDF

นี่คือภาพหน้าจอสองสามภาพ:

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.