มีคำถามและคำตอบมากมายเกี่ยวกับโปรแกรมดู PDF ที่ดีที่สุดที่มีใน Ubuntu แต่ฉันต้องการแยกวิเคราะห์ไฟล์ PDF และรู้รายละเอียดของ PDF เช่นรูปภาพแบบอักษรและลิงก์ที่มีอยู่ในไฟล์ PDF ที่กำหนด
มีโปรแกรมดูเมตาดาต้า PDF หรือเครื่องมือแก้ไขแท็กใดบ้าง
มีคำถามและคำตอบมากมายเกี่ยวกับโปรแกรมดู PDF ที่ดีที่สุดที่มีใน Ubuntu แต่ฉันต้องการแยกวิเคราะห์ไฟล์ PDF และรู้รายละเอียดของ PDF เช่นรูปภาพแบบอักษรและลิงก์ที่มีอยู่ในไฟล์ PDF ที่กำหนด
มีโปรแกรมดูเมตาดาต้า PDF หรือเครื่องมือแก้ไขแท็กใดบ้าง
คำตอบ:
ดูข้อมูลเมตาของ pdf สำหรับไฟล์ชื่อ Example.pdf:
pdfinfo Example.pdf
แก้ไขข้อมูลเมตาที่มีอยู่ในเทอร์มินัลโดยใช้โปรแกรมแก้ไขนาโน:
pdftk Example.pdf dump_data output Metadata-output.txt
nano Metadata-output.txt
อัปเดตข้อมูลเมตา:
pdftk Example.pdf update_info Metadata-output.txt output Example-new.pdf
แป้นพิมพ์ลัดของตัวแก้ไขนาโน
ใช้การรวมแป้นพิมพ์Ctrl+ Oและหลังจากนั้นกดEnterเพื่อบันทึกไฟล์ไปยังตำแหน่งปัจจุบัน
ใช้การรวมแป้นพิมพ์Ctrl+ Xเพื่อออกจากนาโน
โซลูชัน CLI
ยูทิลิตี้มูลค่ามองเข้าไปอีกคือexiftool ข้อดี exiftool ถือครองมากกว่า pdfinfo ก็คือมันรองรับประเภทข้อมูลเมตามากขึ้น (เช่นแท็ก XMP)
นี่คือตัวอย่างของคำสั่งที่จะพิมพ์ข้อมูลเมตาทั้งหมดที่มีอยู่ ( -a
) เรียงลำดับตามกลุ่ม ( -G1
):
exiftool -a -G1 "$File"
ภาพรวมของแท็กที่เกี่ยวข้องกับ PDF ที่รองรับ:
คุณสามารถติดตั้ง exiftool บน Ubuntu ด้วย:
sudo apt-get install libimage-exiftool-perl
โซลูชัน GUI
หากคุณกำลังมองหาโปรแกรมดู / ตัวแก้ไขข้อมูลเมตา GUI GUI PDF คุณสามารถลองใช้โปรแกรมPDFMtEdได้ เป็นชุดของยูทิลิตีกราฟิกที่ฉันเขียนเพื่อจัดการข้อมูลเมตา PDF ด้วย exiftool:
คำตอบของ "ดีที่สุด" นั้นขึ้นอยู่กับว่าคุณต้องการรายละเอียดมากน้อยเพียงใดและขึ้นอยู่กับว่าคุณต้องการให้ผู้ดูมีเสถียรภาพแค่ไหน มีโปรแกรมมากมายสำหรับการดูและแก้ไขโพสต์สคริปต์และไฟล์ pdf ใน linux; ทั้งหมดที่ดูเหมือนจะถูกลบออกจากที่เก็บ Ubuntu ปัจจุบัน (อาจเป็นเพราะปัญหาด้านความเสถียร)
สำหรับตอนนี้ฉันขอแนะนำให้ลอง pdfedit หากคุณใช้ Quantal หรือรุ่นก่อนหน้ามันสามารถติดตั้งผ่าน
sudo apt-get install pdfedit
สำหรับรุ่นที่ใหม่กว่าคุณจะต้องดาวน์โหลดจากหน้าโครงการของมันแกะมันและรวบรวมด้วยตัวคุณเอง
ในการอธิบายอย่างละเอียดเกี่ยวกับpdftk
วิธีการแก้ไขซึ่งเป็นสิ่งที่ดีเพราะมันแสดงให้คุณเห็นทุกสิ่งที่ถูกตั้งค่าในเวลาเดียวกับที่ช่วยให้คุณสามารถเปลี่ยนแปลงสิ่งที่คุณต้องการนี่คือสคริปต์ (สำหรับ.bashrc
ไฟล์นามแฝงของคุณหรือไฟล์อื่น ๆ ) . สิ่งนี้จะสร้างเวอร์ชันใหม่ของไฟล์ที่คุณต้องการแก้ไขเปิดตัวแก้ไขที่คุณชื่นชอบด้วย metadatafile จากนั้นปรับใช้การเปลี่ยนแปลงของคุณและตั้งค่าเวลาในการสร้าง / แก้ไขไฟล์ในไฟล์ PDF ที่แก้ไขให้เหมือนกับต้นฉบับ หากต้องการใช้งานหลังจาก.bashrc
พิมพ์ไฟล์ของคุณอีกครั้ง
editPDFmetadata myfile.pdf
นี่คือนามแฝง:
editPDFmetadata() {
OUTPUT="${1}-new.pdf"
METADATA="tmp${1}-report.txt"
pdftk ${1} dump_data output $METADATA
$EDITOR $METADATA
pdftk ${1} update_info $METADATA output $OUTPUT
touch -r ${1} ${OUTPUT}
}
เพียงวางคำจำกัดความข้างต้นลงใน.bashrc
ไฟล์ในโฟลเดอร์บ้านของคุณจากนั้นเปิดเทอร์มินัลใหม่และจะพร้อมใช้งาน
sudo apt-get install libimage-exiftool-perl
ข้อมูลเมตาสามารถลบออกได้ทั้งหมดโดยใช้คำสั่งต่อไปนี้
exiftool -all:all= file_name