'ขนาดพจนานุกรม' มีผลต่อการบีบอัดอย่างไร


39

ฉันรู้ว่าขนาดที่สูงขึ้นอาจนำไปสู่อัตราส่วนการบีบอัดที่ดีกว่าและ verca รอง แต่มีวิธีที่ฉันสามารถตัดสินใจได้ดีขึ้นหรือไม่ .. เนื่องจากมีตัวเลือกมากมาย 7zip


จนถึงตอนนี้ฉันสังเกตุเห็นว่าขนาดไฟล์ dictionary ขนาดพจนานุกรมให้การบีบอัดที่เหมาะสมที่สุด ขนาดไฟล์
นี่คือไฟล์ ∼8mb test.aviมีอัตราส่วนการบีบอัดเท่ากันสำหรับทุกพจนานุกรมที่มีขนาดมากกว่า 8mb จากนั้นมันก็จะเริ่มตก


2
ใช่นั่นเป็นเพราะไฟล์ทั้งหมดอยู่ในหน่วยความจำ อย่างไรก็ตามสิ่งนี้อาจเป็นไปไม่ได้หากจัดการกับไฟล์หลายกิ๊ก ผลตอบแทนจากการลงทุนจะลดลงตามไปด้วย หากคุณต้องการที่ 1% สุดท้ายแล้วขนาด = ขนาดไฟล์ หมายเหตุ: เมื่อคุณมีชุดข้อมูลที่ใหญ่กว่าขนาดพจนานุกรม 128mb + จะเพิ่มเวลาที่ใช้ในการบีบอัดไฟล์อย่างมีนัยสำคัญ
ไซเบอร์นาร์ด

คำตอบ:


28

รายการที่ทำซ้ำได้จะถูกเก็บไว้ในพจนานุกรมและมีการกำหนดรหัสแทน

นี่เป็นสิ่งที่เรียบง่ายกว่า

aaaaaaaaaaaaaaaaaaaaaaaa  0001
bbbbbbbbbbbbbbbbbbbbbbbb  0002
alsdjl;asjdfkl;asdfjkljj  0003

แทนที่จะใส่ทั้งบรรทัดมันแค่วางโค้ดไว้ที่เดิม ยิ่งพจนานุกรมมีขนาดใหญ่ก็จะสามารถใช้รหัสได้มากขึ้น โดยปกติเมื่อพจนานุกรมเต็มมันจะเริ่มใหม่ทันที เมื่อมันเริ่มใหม่มันจะว่างเปล่าและรหัสใหม่จะถูกกำหนดให้กับรูปแบบที่ตรวจพบ

โดยทั่วไปยิ่งจุดยิ่งใหญ่ พจนานุกรมทั้งหมดถูกเก็บไว้ในหน่วยความจำดังนั้นคุณต้องใช้ RAM มากกว่าขนาดพจนานุกรม

ขนาดพจนานุกรมขึ้นอยู่กับความสามารถในการบีบอัดข้อมูลของคุณจำนวนไฟล์ขนาดและขนาดโดยรวม

โดยทั่วไปแล้ว 32mb นั้นมากเกินพอ แต่ถ้าคุณทำการบีบอัดไฟล์แบบมัลติกิ๊กจำนวนมากจะสามารถใช้ตัวเลขที่สูงกว่าได้มาก พจนานุกรมขนาดใหญ่มักจะทำให้กระบวนการช้าลง แต่ผลลัพธ์ในไฟล์ที่เล็กลง


2
ขนาดที่คุณกำหนดไว้สำหรับขนาดพจนานุกรมหรือขนาดที่แท้จริงจะเป็นอย่างไร โปรแกรม (โดยเฉพาะอย่างยิ่ง 7-zip) โดยปกติจะกำหนดอย่างชาญฉลาดหรือไม่ว่าพวกเขาต้องการเติมทั้งพจนานุกรมที่คุณอนุญาตหรือไม่
สแตน

1
ใช่มันเป็นขีด จำกัด เมื่อเต็มพวกเขาอาจเริ่มพจนานุกรมใหม่หรือส่งข้อมูลเก่าอย่างชาญฉลาด เว้นแต่ข้อมูลที่จะบีบอัดจะยิ่งใหญ่กว่าขนาดของพจนานุกรมที่จะได้รับการเติม
cybernard

@cybernard "จะได้รับการเติม"? เพื่อให้มีความชัดเจนขนาดของพจนานุกรมจะยังคงน้อยกว่าขีด จำกัด เมื่อมันไม่ได้ถูกเติม?
LonnieBest

1
@LonnieBest ใช่พจนานุกรมเริ่มว่างเปล่าอย่างสมบูรณ์ ทุกๆบิตจำนวนมาก / ไบต์ทำให้รายการพจนานุกรมใหม่จนกว่าจะได้รับเต็ม
cybernard
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.