ในระยะสั้น:
หากต้องการทราบว่ามันถูกบีบอัดอยู่แล้ว:
strings your.pdf | grep /Filter
หากต้องการ (un) บีบอัด PDF ให้ใช้QPDF
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
คำอธิบาย:
คำหลัก "ตัวกรอง" ในไฟล์ pdf เป็นตัวบ่งชี้วิธีการบีบอัดที่ใช้ บางส่วนของพวกเขาคือ:
CCITT G3 / G4 - ใช้สำหรับภาพขาวดำ
JPEG - อัลกอริธึมการสูญเสียที่ใช้สำหรับรูปภาพ
JPEG2000 - ทางเลือกที่ทันสมัยกว่าสำหรับ JPEG ซึ่งใช้สำหรับการบีบอัดภาพ
Flate - ใช้สำหรับการบีบอัดข้อความรวมถึงรูปภาพ
JBIG2 - ทางเลือก การบีบอัด CCITT สำหรับภาพขาวดำ
LZW - ใช้สำหรับการบีบอัดข้อความรวมถึงรูปภาพ แต่การแทนที่ด้วย Flate
RLE - ใช้สำหรับภาพขาวดำ
ZIP - ใช้สำหรับภาพโทนสีเทาหรือสี
(คัดลอกมาจากที่นี่ )
อย่างไรก็ตามเนื่องจากโครงสร้างไฟล์ PDF ที่ซับซ้อนส่วนใหญ่แล้วบางส่วน (หรือ "สตรีม") ของ PDF จะถูกบีบอัดอยู่แล้วในบางวิธี (และจะแสดงเมื่อ grepping / Filter) ในขณะที่บางส่วนจะไม่เป็นเช่นนั้น ไม่มีคำตอบใช่ / ไม่ใช่สำหรับคำถามว่า PDF นั้นถูกบีบอัดหรือไม่
วิธีหนึ่งที่จะเอาชนะนี้จะเพิ่ม-c
ตัวเลือกในการ grep ซึ่งส่งกลับจำนวนของเหตุการณ์ที่เกิดขึ้นเพื่อให้คุณสามารถมองเห็นค่อนข้างวิธีที่ดีที่ถูกบีบอัด ตัวอย่างเช่นถ้าส่งคืนน้อยกว่า 10 จะไม่บีบอัดstrings
"large
.pdf" | grep -c /Filter
สถานที่ให้บริการอื่นที่เกี่ยวข้องกับขนาดในรูปแบบไฟล์ PDF คือพวกเขาได้รับการปรับให้เหมาะสมสำหรับการเข้าถึงที่รวดเร็วหรือไม่ด้วยไฟล์ PDF "ที่ได้รับการปรับปรุง" ที่มีขนาดใหญ่กว่าเพื่อเสนอราคาจากวิกิพีเดีย :
รูปแบบไฟล์ PDF มีสองรูปแบบ - ไม่ใช่แบบเส้นตรง (ไม่ใช่ "ปรับให้เหมาะสม") และเป็นเส้นตรง ("ปรับให้เหมาะสม") ไฟล์ PDF ที่ไม่ใช่แบบเชิงเส้นใช้พื้นที่ดิสก์น้อยกว่าแบบเชิงเส้นแม้ว่าพวกเขาจะเข้าถึงได้ช้ากว่าเนื่องจากบางส่วนของข้อมูลที่จำเป็นในการรวบรวมหน้าเอกสารถูกกระจายไปทั่วไฟล์ PDF ไฟล์ PDF เป็น Linear (เรียกอีกอย่างว่า "ไฟล์ PDF ที่ปรับให้เหมาะสม" หรือ "เว็บที่เหมาะที่สุด") สร้างขึ้นในลักษณะที่ช่วยให้พวกเขาสามารถอ่านได้ในเว็บเบราเซอร์ปลั๊กอินโดยไม่ต้องรอให้ไฟล์ทั้งหมดดาวน์โหลดเนื่องจากเขียนลงดิสก์ แฟชั่นเชิงเส้น (ตามลำดับหน้า) ไฟล์ PDF อาจถูกปรับให้เหมาะสมโดยใช้ซอฟต์แวร์ Adobe Acrobat หรือ QPDF
คุณสามารถตรวจสอบว่ารูปแบบไฟล์ PDF pdfinfo your.pdf
ที่มีการเพิ่มประสิทธิภาพการใช้
file
แต่พยายาม ควรแสดงว่าไฟล์ถูกบีบอัดหรือไม่