อะไรทำให้ขนาดไฟล์ PDF เพิ่มขึ้นเมื่อบันทึกในหน้าตัวอย่าง


17

ดูเหมือนว่าการแก้ไขคำอธิบายประกอบหรือแม้กระทั่งเพียงแค่เปิดและบันทึกไฟล์ PDF ในหน้าตัวอย่างจะทำให้ขนาดไฟล์เพิ่มขึ้นอย่างมีนัยสำคัญ ฉันสังเกตเห็นว่าสำหรับหนังสือบางเล่มที่ฉันสแกนสิ่งนี้ก็เกิดขึ้นเพื่อปรับปรุงเวลาในการแสดงหน้าเว็บ

มีใครบ้างไหมที่ทำให้เกิดความเปลี่ยนแปลงที่เกิดขึ้นกับสิ่งที่เกิดขึ้น? ฉันสนใจที่จะซิงค์คำอธิบายประกอบของ ebooks PDF ระหว่าง Preview และ iPad (อาจเป็น GoodReader) แต่สิ่งนี้อาจไม่สามารถใช้ได้กับไฟล์ PDF ขนาดใหญ่


2
อาจเกิดจากวิธีที่พวกเขาตัดสินใจเข้ารหัส PDF ในหน้าตัวอย่าง ขณะนี้ PDF เป็นรูปแบบเปิด แต่ไม่ได้แปลว่าทุกคนกำลังเข้ารหัสในลักษณะเดียวกัน ทางออกที่ปลอดภัยที่สุดของคุณคือรับตัวแก้ไข Adobe PDF และใช้สิ่งนั้น จากการสนทนาของคนเหล่านี้ให้พูดคุยว่า. apple.com/thread/3896311?start=0&tstart=0 มันสร้างความแตกต่าง พวกเขายังหารือถึงเหตุผลที่เป็นไปได้ที่อยู่เบื้องหลังปัญหาของคุณ
Tony

คำตอบ:


12

ในนวนิยายเล็ก ๆ ที่เขารู้จักPDF Karenina , Leo Tolstoy เขียน

ไฟล์ PDF ที่เข้ารหัสอย่างเหมาะสมมีลักษณะเหมือนกันทั้งหมด ไฟล์ PDF ที่เข้ารหัสย่อยทุกไฟล์จะถูกเข้ารหัสย่อยอย่างเหมาะสมในรูปแบบของมันเอง

เป็นเรื่องยากสำหรับทุกคนที่จะตอบว่าเพราะเหตุใดไฟล์ PDF ของคุณจึงใหญ่ขึ้นหลังจากดูตัวอย่างปรับเปลี่ยนไฟล์ ไฟล์ PDF ประกอบด้วยข้อมูลหลายประเภท: รูปภาพ, สตรีมเนื้อหา, ฟอนต์, ค่าใช้จ่ายเอกสาร, พื้นที่สี, สถานะกราฟิกขยายและตารางอ้างอิงโยง เช่นเดียวกับประโยคหนึ่งอาจกระชับและ verbose อื่น แต่ทั้งคู่เป็นภาษาอังกฤษที่ถูกต้องและพูดในสิ่งเดียวกันดังนั้นไฟล์ PDF หนึ่งไฟล์อาจมีวิธี verbose ที่มากขึ้นในการแสดงเนื้อหาเดียวกันเป็นไฟล์ PDF ที่กระชับยิ่งขึ้น เราต้องดูไฟล์ PDF ที่แน่นอนของคุณ อาจเป็นไปได้ว่าพวกเขาถูกสร้างขึ้นด้วยซอฟต์แวร์ที่หลากหลายแตกต่างกันไปบางข้อตกลงบางอย่างก็น้อยกว่า

นอกจากนี้ยังมีความสำคัญกับรุ่นของ Mac OS X และตัวอย่างที่คุณใช้เนื่องจากเป็นตัวกำหนดซอฟต์แวร์ที่เขียนไฟล์ PDF ใหม่เมื่อคุณบันทึกเป็นในหน้าตัวอย่าง

อย่างไรก็ตามฉันสามารถบอกได้ว่าไฟล์ PDF ของฉันมีขนาดใหญ่ขึ้นเท่าใด เรื่องราวนี้ใช้กับคอมพิวเตอร์ของฉันที่ใช้ Mac OS X 10.5.8 และ Apple Preview 4.2 (469.5)

หนึ่งไฟล์Giulio.pdfเป็นเอกสาร 22 หน้าที่มีข้อความเป็นข้อความไม่ใช่รูปภาพที่สแกน มันมีขนาดใหญ่ 461,092 ไบต์ ฉันเปิดมันในหน้าตัวอย่างได้ทำไฟล์ ... บันทึกเป็น ...และบันทึกไว้ในชื่อไฟล์ใหม่ ไฟล์ใหม่มีขนาด 724,421 ไบต์หรือใหญ่กว่า 57%

ฉันเปิดแต่ละไฟล์ด้วย Adobe Acrobat Professional เวอร์ชัน 8.3.1 สำหรับ Mac OS ฉันไม่ขั้นสูง ... รูปแบบไฟล์ PDF เพิ่มประสิทธิภาพการใช้งาน ... ตรวจสอบพื้นที่ ... กล่องโต้ตอบขนาดเล็กมีการแจกแจงจำนวนไบต์เนื่องจากการใช้งานแต่ละประเภทรวมถึงเปอร์เซ็นต์ของขนาดไฟล์ทั้งหมดสำหรับประเภท

ต้นฉบับGiulio.pdfมี 390,754 ไบต์ (84.75%) ที่อุทิศให้กับสตรีมเนื้อหาและเป็นศูนย์ที่อุทิศให้กับภาพ มันอยู่ในรูปแบบ PDF 1.4 ไฟล์ที่บันทึกโดยดูตัวอย่างมีขนาด 675,846 ไบต์ (93.29%) ที่ใช้สำหรับการสตรีมเนื้อหารวมถึงศูนย์ไบต์ของรูปภาพและอยู่ในรูปแบบ PDF 1.3 ดูตัวอย่างทำให้สตรีมเนื้อหามีขนาดใหญ่ขึ้น 285,092 ไบต์ซึ่งแสดงถึง 73% ของความแตกต่างของขนาดไฟล์ระหว่างสองไฟล์

ฉันสงสัยว่ารูปแบบไฟล์ PDF 1.3 นั้นมีประสิทธิภาพน้อยกว่าหรือไม่สำหรับการจัดเก็บไฟล์ประเภทนี้ ฉันเปิดต้นฉบับGiulio.pdfใน Adobe Acrobat Professional 8 และทำขั้นสูง ... เครื่องมือเพิ่มประสิทธิภาพ PDF ... เข้ากันได้กับ: Acrobat 3.0 และใหม่กว่าและกดตกลง ฉันบันทึกไฟล์ผลลัพธ์ภายใต้ชื่อใหม่ ไฟล์ผลลัพธ์อยู่ในรูปแบบ PDF 1.3 และมีขนาด 452,356 ไบต์หรือเล็กกว่าต้นฉบับ สตรีมเนื้อหามี 375,171 ไบต์ (82.94%) ซึ่งเป็นสัดส่วนที่ใกล้เคียงกัน แต่มีขนาดเล็กกว่าสตรีมเนื้อหาของไฟล์ต้นฉบับ

ดังนั้นจึงดูเหมือนว่าเราสามารถสรุปได้ว่าแอพ Preview บน Mac OS X 10.5.8 นั้นไม่ได้มีประสิทธิภาพเท่ากับผู้สร้าง PDF อื่น ๆ ที่สร้างสตรีมเนื้อหาที่รัดกุมในไฟล์ PDF และความแตกต่างก็เพียงพอที่จะรองรับความแตกต่างขนาดสามในสี่ ในไฟล์ PDF ที่ไม่มีภาพ

ฉันทำการทดลองที่คล้ายกันในform k.pdfเอกสารที่สแกน 1 หน้าจากกระดาษ ไฟล์ต้นฉบับคือ 303,730 ไบต์ซึ่ง 298,197 ไบต์ (98.18%) เป็นภาพ สำเนาของไฟล์นี้สร้างโดยดูตัวอย่างโดยใช้บันทึกเป็น ... มีขนาด 300,601 ไบต์หรือเล็กกว่า 1% ความแตกต่างของขนาดไฟล์นี้มากกว่าโดยหมวดหมู่ "ค่าใช้จ่ายเอกสาร" ที่มีขนาดเล็กกว่าของไบต์ในไฟล์ที่สร้างขึ้นโดยดูตัวอย่าง

ดังนั้นเราจึงสามารถสรุปได้ว่า Preview ไม่ทำให้ไฟล์ PDF มีขนาดเพิ่มขึ้นเสมอไป ขึ้นอยู่กับลักษณะของไฟล์ PDF ต้นฉบับและวิธีการเริ่มต้นโดยย่อ


3

ฉันรู้ว่ามันค่อนข้างช้า แต่ฉันได้พบบางสิ่งที่ดูเหมือนว่าจะใช้ได้อย่างน้อยถ้าใช้ครั้งแรกฉันได้ลองใช้ตัวกรองควอตซ์เพื่อ "ลดขนาดไฟล์" ดูเหมือนว่าจะใช้งานได้ แต่ไม่ได้เปิดอยู่ตามค่าเริ่มต้น ฉันสามารถเลือกได้โดยเฉพาะผ่านทางเมนูบันทึกเป็น (ตัวเลือกการถือ) แต่ฉันกังวลว่ามันจะใช้วิธีการตามปกติในบันทึกอัตโนมัติ

นี่คือสิ่งที่เกิดขึ้นสำหรับฉันและฉันมาที่หน้านี้ได้อย่างไรตั้งแต่แรก: PDF เริ่มเป็นหนังสือหน้า 91MB 900 ฉันเพิ่มบันทึกย่อเดียวและบันทึกและไฟล์กระโดดได้ถึง 2.29GB ปิดด้านบนมันใช้เวลาตลอดไปในการบันทึกโดยเฉพาะอย่างยิ่งเมื่อฉันบันทึกลงในไดรฟ์ภายนอก ขอบคุณพระเจ้าที่ไดรฟ์คือ USB 3!

มีอยู่แล้วเพื่อแยกหมายเหตุประกอบเหล่านี้? ฉันสามารถใส่คำอธิบายประกอบและไฮไลต์ที่ Goodreader และ PDF Expert บน iPad ของฉัน หาก Preview ไม่สามารถอนุญาตให้ฉันทำสิ่งนี้บนคอมพิวเตอร์ของฉันจะมีแอพอื่นที่จะทำหรือไม่ เหตุใดจึงไม่สามารถบันทึกคำอธิบายประกอบ / ไฮไลต์ แต่ไม่พยายามบีบอัดรูปภาพทั้งหมดใหม่เช่นฉันกำลังบันทึก JPEG อีกครั้งในแต่ละครั้ง ขอบคุณสำหรับความช่วยเหลือ!


ใช้งานได้: 400 KiB> 1.3 MiB> 540 KiB PDF ต้นฉบับของฉันมีขนาดต่ำกว่า 400 KiB และกลายเป็นสิ่งมหัศจรรย์ 1.3 MiB หลังจากเพิ่มไฮไลต์ / ขีดเส้นใต้คู่ ฉันไม่ได้รับการแนะนำและไฟล์ลงไป 540 กิโลไบท์: Save As ...กับควอตซ์กรองชุดเพื่อลดขนาดไฟล์ ฉันยังคงสามารถแก้ไขไฮไลต์ก่อนหน้า (ซึ่งเป็นไปไม่ได้สำหรับการส่งออกเป็น PDF ... ) และขนาดมีความสอดคล้องกับสิ่งที่ฉันได้รับจากการแก้ไขบนอุปกรณ์อื่น
Daniel

1

ปัญหายังคงเป็นปัญหาที่ร้ายแรง ในตัวอย่าง 7.0 (Mac Os 10.9.5.) ฉันสร้าง pdf โดยใช้ Acrobat 9.5.5 ที่ทำให้เกิดไฟล์ 5 MB ในตัวอย่างฉันเพิ่ม 12 ตัวอักษรอย่างแน่นอน (โดยใช้เครื่องมือแก้ไข) หลังจากบันทึกไฟล์นี้จะมีขนาด 14 MB

คุณสามารถแก้ไขได้โดยการเปิดและบันทึกอีกครั้งใน Acrobat (อาจต้องใช้ตัวเลือก "ลดขนาดไฟล์")


2
สิ่งนี้ไม่ได้อธิบายว่าทำไมมันถึงเกิดขึ้นซึ่งเป็นคำถามที่ถาม
Ian C.

0

ไม่สามารถเพิ่มเบาะแสในโซลูชัน ฉันสามารถเพิ่มสถานการณ์ที่คล้ายกัน (OS X 10.11.3): รูปแบบไฟล์ PDF ที่สแกนในที่มีน้ำหนัก ~ 800kb เปิดขึ้นในภาพตัวอย่างมีการสแกนเพจเปล่าสองหน้าที่ว่างเปล่าซึ่งจะถูกลบออกทำให้ PDF ที่สั้นกว่าสองหน้าคือ ~ 2,2Mb "ตัวเลือกบันทึกเป็น" และเลือกตัวกรอง quartz "ลดขนาดไฟล์" บีบอัดไฟล์ลงไปที่ ... 1,9Mb

ไฟล์ต้นฉบับถูกสร้างขึ้นโดย Xerox WC 7830 เครื่องถ่ายเอกสารซึ่งจากประสบการณ์ของฉัน (เมื่อเทียบกับเครื่องมัลติฟังก์ชั่นก่อนหน้า / เครื่องถ่ายเอกสารที่เรามี) ผลิตไฟล์ PDF ที่สแกนอย่างเหมาะสม

ไม่เห็นความแตกต่างในไฟล์โดยมองเห็น ฉันเดาว่ารูปภาพของหน้าเว็บถูกบีบอัดใหม่ใน 24bpp ในขณะที่ไฟล์ต้นฉบับนั้นใช้ความละเอียดของสีน้อยกว่ามากซึ่งน่าจะเป็น 6-bit (เป็นเอกสารที่พิมพ์และเซ็นชื่อข้อความเท่านั้นสแกนเนอร์ทำงานได้ดีในการรักษา พื้นหลังสีขาว น่าเสียดายที่ตัวอย่างไม่ฉลาดพอที่จะตรวจจับและบำรุงรักษาได้และดูเหมือนว่าจะต้องบีบอัดไฟล์ทั้งหมดใหม่แม้ว่าจะไม่มีการเปลี่ยนแปลงในหน้าที่เหลือ (อีกครั้งมีการลบหน้าเพียงไม่กี่หน้าเท่านั้น)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.