ตัวแสดงข้อมูลเมตา PDF / เครื่องมือแก้ไขแท็กสำหรับ Ubuntu


26

มีคำถามและคำตอบมากมายเกี่ยวกับโปรแกรมดู PDF ที่ดีที่สุดที่มีใน Ubuntu แต่ฉันต้องการแยกวิเคราะห์ไฟล์ PDF และรู้รายละเอียดของ PDF เช่นรูปภาพแบบอักษรและลิงก์ที่มีอยู่ในไฟล์ PDF ที่กำหนด

มีโปรแกรมดูเมตาดาต้า PDF หรือเครื่องมือแก้ไขแท็กใดบ้าง


2
ผู้ลงคะแนนปิด: เพียงเพราะคำถามนี้บอกว่า "ดีที่สุด" ในชื่อเรื่องไม่ได้ทำให้เป็นไปตามความคิดเห็น!
เซท

คำตอบ:


31
  1. ดูข้อมูลเมตาของ pdf สำหรับไฟล์ชื่อ Example.pdf:

    pdfinfo Example.pdf  
    
  2. แก้ไขข้อมูลเมตาที่มีอยู่ในเทอร์มินัลโดยใช้โปรแกรมแก้ไขนาโน:

    pdftk Example.pdf dump_data output Metadata-output.txt
    nano Metadata-output.txt  
    
  3. อัปเดตข้อมูลเมตา:

    pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
    

แป้นพิมพ์ลัดของตัวแก้ไขนาโน
ใช้การรวมแป้นพิมพ์Ctrl+ Oและหลังจากนั้นกดEnterเพื่อบันทึกไฟล์ไปยังตำแหน่งปัจจุบัน
ใช้การรวมแป้นพิมพ์Ctrl+ Xเพื่อออกจากนาโน


10

โซลูชัน CLI

ยูทิลิตี้มูลค่ามองเข้าไปอีกคือexiftool ข้อดี exiftool ถือครองมากกว่า pdfinfo ก็คือมันรองรับประเภทข้อมูลเมตามากขึ้น (เช่นแท็ก XMP)

นี่คือตัวอย่างของคำสั่งที่จะพิมพ์ข้อมูลเมตาทั้งหมดที่มีอยู่ ( -a) เรียงลำดับตามกลุ่ม ( -G1):

exiftool -a -G1 "$File"

ภาพรวมของแท็กที่เกี่ยวข้องกับ PDF ที่รองรับ:

คุณสามารถติดตั้ง exiftool บน Ubuntu ด้วย:

sudo apt-get install libimage-exiftool-perl

โซลูชัน GUI

หากคุณกำลังมองหาโปรแกรมดู / ตัวแก้ไขข้อมูลเมตา GUI GUI PDF คุณสามารถลองใช้โปรแกรมPDFMtEdได้ เป็นชุดของยูทิลิตีกราฟิกที่ฉันเขียนเพื่อจัดการข้อมูลเมตา PDF ด้วย exiftool:

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่


1

คำตอบของ "ดีที่สุด" นั้นขึ้นอยู่กับว่าคุณต้องการรายละเอียดมากน้อยเพียงใดและขึ้นอยู่กับว่าคุณต้องการให้ผู้ดูมีเสถียรภาพแค่ไหน มีโปรแกรมมากมายสำหรับการดูและแก้ไขโพสต์สคริปต์และไฟล์ pdf ใน linux; ทั้งหมดที่ดูเหมือนจะถูกลบออกจากที่เก็บ Ubuntu ปัจจุบัน (อาจเป็นเพราะปัญหาด้านความเสถียร)

สำหรับตอนนี้ฉันขอแนะนำให้ลอง pdfedit หากคุณใช้ Quantal หรือรุ่นก่อนหน้ามันสามารถติดตั้งผ่าน

sudo apt-get install pdfedit

สำหรับรุ่นที่ใหม่กว่าคุณจะต้องดาวน์โหลดจากหน้าโครงการของมันแกะมันและรวบรวมด้วยตัวคุณเอง


ฉันไม่ต้องการผู้ชม ฉันต้องแยกวิเคราะห์ซึ่งสามารถดึงข้อมูลรายละเอียดจาก pdf ไฟล์เช่นการเชื่อมโยงที่มีอยู่ในไฟล์ .... ภาพที่ใช้ได้ ... ดัชนีของไฟล์ ฯลฯ
ซาฮิลโกรเวอร์

ขออภัย pdftk สับสนกับ pdfedit เพราะพวกเขาลบ pdfedit ออกจากที่เก็บ
virtualxtc

0

ในการอธิบายอย่างละเอียดเกี่ยวกับpdftkวิธีการแก้ไขซึ่งเป็นสิ่งที่ดีเพราะมันแสดงให้คุณเห็นทุกสิ่งที่ถูกตั้งค่าในเวลาเดียวกับที่ช่วยให้คุณสามารถเปลี่ยนแปลงสิ่งที่คุณต้องการนี่คือสคริปต์ (สำหรับ.bashrcไฟล์นามแฝงของคุณหรือไฟล์อื่น ๆ ) . สิ่งนี้จะสร้างเวอร์ชันใหม่ของไฟล์ที่คุณต้องการแก้ไขเปิดตัวแก้ไขที่คุณชื่นชอบด้วย metadatafile จากนั้นปรับใช้การเปลี่ยนแปลงของคุณและตั้งค่าเวลาในการสร้าง / แก้ไขไฟล์ในไฟล์ PDF ที่แก้ไขให้เหมือนกับต้นฉบับ หากต้องการใช้งานหลังจาก.bashrcพิมพ์ไฟล์ของคุณอีกครั้ง

editPDFmetadata myfile.pdf

นี่คือนามแฝง:

editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA  output $OUTPUT
touch -r ${1} ${OUTPUT}
}

เพียงวางคำจำกัดความข้างต้นลงใน.bashrcไฟล์ในโฟลเดอร์บ้านของคุณจากนั้นเปิดเทอร์มินัลใหม่และจะพร้อมใช้งาน


0

sudo apt-get install libimage-exiftool-perl

ข้อมูลเมตาสามารถลบออกได้ทั้งหมดโดยใช้คำสั่งต่อไปนี้

exiftool -all:all= file_name

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.