ฉันจะลบความคิดเห็นและคำอธิบายประกอบทั้งหมด (เพิ่มด้วย Foxit Reader) ได้อย่างง่ายดายจากไฟล์ PDF ทั้งหมดในโฟลเดอร์ได้อย่างไร
ฉันจะลบความคิดเห็นและคำอธิบายประกอบทั้งหมด (เพิ่มด้วย Foxit Reader) ได้อย่างง่ายดายจากไฟล์ PDF ทั้งหมดในโฟลเดอร์ได้อย่างไร
คำตอบ:
ฉันเพิ่งพบปัญหานี้และไม่มีคำตอบให้ที่นี่สำหรับฉัน สิ่งที่ได้ผลคือrewritepdf
เครื่องมือจากแพ็คเกจ Ubuntu libcam-pdf-perl
:
rewritepdf -C in.pdf out.pdf
การรวมสิ่งนี้ไว้ในสคริปต์เล็กน้อยเพื่อลบคำอธิบายประกอบออกจากไฟล์ pdf ทั้งหมดในไดเรกทอรีนั้นเป็นเรื่องง่าย:
for i in *.pdf; do rewritepdf -C '$i' '$i'.new; done
ให้คุณใช้ระบบ Unix:
cd <directory containing PDFs>
find . -type f -name '*.pdf' -exec perl -pi -e 's:/Annots \[[^]]+\]::g' {} +
นี่คือแฮ็คที่จะลบ/Annots
คำสั่งทั้งหมดออกจาก PDF (คำสั่งที่ดึงหมายเหตุประกอบ) มันปล่อยให้วัตถุคำอธิบายประกอบอยู่ตรงนั้น (คุณสามารถเปิด PDF ด้วยโปรแกรมแก้ไขข้อความและค้นหาได้) พวกมันไม่ได้ถูกวาด
s:
(ตัวแทนที่) /Annots \[
(ข้อความ " /Annots [
") [^]]+
(อย่างน้อยหนึ่งอินสแตนซ์ของตัวละครใด ๆ นอกเหนือจาก " ]
") \]
(ตัวอักษรตัวอักษร " ]
") ::
(แทนที่สิ่งใดg
ๆ
]
โดยปกติแล้วตัวอักษรจะต้องหลบหนี แต่ไม่ถูกต้องหลังจากถูก^
ปฏิเสธ
ยังไม่ได้ทดสอบมันมากนัก แต่สิ่งต่อไปนี้ดูเหมือนจะใช้ได้ มันจะลบคำอธิบายประกอบทั้งหมดยกเว้นลิงก์เอกสารภายใน (ซึ่งไม่มีคำตอบที่นี่ดูเหมือนจะทำ) สคริปต์นี้ขึ้นอยู่กับไลบรารีpdfrw python
#!/usr/bin/python
import sys, pdfrw
try:
in_path = sys.argv[1]
out = sys.argv[2]
except:
print("Usage:\tannotclean IN.pdf OUT.pdf")
exit(0)
reader = pdfrw.PdfReader(in_path)
for p in reader.pages:
if p.Annots:
# See PDF reference, Sec. 12.5.6 for all annotation types
p.Annots = [a for a in p.Annots if a.Subtype == "/Link"]
pdfrw.PdfWriter(out, trailer=reader).write()
การใช้งาน:
PATH
) /usr/local/bin/annotclean
เช่นannotclean in.pdf cleaned.pdf
# fish shell syntax
for p in **pdf # pdfs from current directory and subdirectories
annotclean $p $p.new
mv $p.new $p # overwrite the old
end
ฉันคิดว่าคุณสามารถทำได้อย่างง่ายดายที่สุดโดย "อ้างอิง" PDF วิธีการอ้างอิง: ก่อนอื่นให้แปลงไฟล์เป็น PostScript จากนั้นแปลง PostScript กลับเป็น PDF โดยทั่วไปการ refried จะขมวดคิ้วเพราะคุณมักจะสูญเสียคุณภาพและเนื้อหาบางส่วน ในกรณีของคุณคุณต้องการหลวมเนื้อหา การทอดอีกครั้งสามารถทำได้ด้วยGhostscript (และชุดไฟล์ผู้ช่วยจัดส่งพร้อม - ดาวน์โหลดgs900w32.exe
ถ้าคุณใช้ Windows) ดังนั้นคุณจะไปได้ด้วยคำสั่งง่ายๆ 2 คำสั่ง:
pdf2ps.bat input.pdf output.ps
ps2pdf.bat output.ps input_refried.pdf
ตกลงคุณบอกว่าคุณจะต้องพิจารณาโซลูชันเชิงพาณิชย์ด้วยเช่นกัน ....
ผมอยากแนะนำให้คุณพยายามCallas pdfToolbox สามารถใช้งานได้กับ Windows และ Mac OS X (มี CLI สำหรับ Linux ด้วย แต่คุณสามารถใช้ "โปรไฟล์" ที่กำหนดค่าไว้ล่วงหน้าเท่านั้นด้วย Windows GUI คุณสามารถสร้างโปรไฟล์ที่กำหนดเองและนำกลับมาใช้ใหม่ได้ด้วย แม้ว่า Linux CLI
pdfToolbox มีวิธีมากมายในการจัดการและแก้ไขปัญหา PDF ของแต่ละบุคคลมากมาย
หนึ่งใน "Fixups" คือการลบคำอธิบายประกอบทั้งหมด
คุณไม่จำเป็นต้องใช้เงินในการทดสอบก่อน callas ให้สิทธิ์ใช้งานทดลองใช้ 14 วันฟรี