วิธีการเก็บถาวรแบบใดที่ดีกว่าสำหรับการบีบอัดไฟล์ข้อความบน Linux


17

ในแอปพลิเคชันของฉันฉันต้องใช้การบีบอัดไฟล์บันทึกที่เป็นไฟล์ข้อความ

ดูเหมือนว่าbzip2และgzipมีอัตราส่วนการบีบอัดเท่ากัน

ถูกต้องหรือไม่


xz (จาก xz-tools หรือ 7z จาก p7zip มันเหมือน lzma มากที่สุด) bzip2 ดีกว่า gzip
osgx

คำตอบ:


5

โดยทั่วไป bz2 มีอัตราส่วนการบีบอัดที่ดีกว่ารวมกับคุณสมบัติการกู้คืนที่ดีขึ้น

OTOH, gz เร็วขึ้น

xz บอกว่าดีกว่า bz2 แต่ฉันไม่รู้พฤติกรรมเวลา


xz ช้ากว่า bzip2
osgx

xz ไม่เพียงช้าลง แต่ช้าลงมากไฟล์ 300 mb ใช้เวลาประมาณ 30 วินาทีเพื่อให้บีบอัด bzip2 ฉันฆ่า xz หลังจากที่บีบอัดมานานกว่า 5 นาที
Tebe

@ Копать_Шо_я_нашелฉันคิดว่ามันขึ้นอยู่กับระดับการบีบอัดที่คุณเลือก ด้วย-1มันไม่ได้ช้ามาก แต่ด้วยการตั้งค่าเริ่มต้นมันก็ค่อนข้างช้า
glglgl

7

อัปเดตล่าสุดของmaxcompression.comคือเดือนมิถุนายน 2011 (คำตอบอัพเดทในเดือนตุลาคม 2015)
ดังนั้นเว็บไซต์นี้ไม่ได้กล่าวถึงเครื่องอัดข้อความแชมเปี้ยน
ปัจจุบันทั่วโลก :

      cmix

การแข่งขัน / Benchmarks:

รายละเอียด:
ไบรอน Knollเป็นอย่างแข็งขัน developping cmixเป็นซอฟต์แวร์ฟรี (GPL) ตั้งแต่ 2013 ตามหนังสือการบีบอัดข้อมูลอธิบายโดยแมตต์ฮอนี่ย์ แมตต์มาฮอนี่ย์ยังคงรักษามาตรฐานข้างต้นบางอย่างและเสนอZPAQ ( WP ) ซึ่งเป็นผู้จัดเก็บส่วนเพิ่มบรรทัดคำสั่ง


หากคุณต้องการเครื่องมือมาตรฐานเพิ่มเติม (ต้องการ RAM น้อยกว่า) ฉันแนะนำ:

      lrzip

lrzipเป็นวิวัฒนาการของrzipโดยคอนโคลิวาส
lrzipย่อมาจากสองชื่อ: Long Range ZIPและLZMA RZIP
lrzipมักจะดีกว่าxz(เครื่องมือบีบอัดที่เป็นที่นิยมอื่น)
อเล็กซานเด Ricciolrzipยังแนะนำ


สิ่งที่ฉันชอบคือ:

      zpaq

"Archiver ผู้เชี่ยวชาญ" , แมตต์ฮอนี่ย์ได้ทำงานอย่างมีPAQอัลกอริทึมสำหรับสิบปีและให้การประนีประนอมที่ดีที่สุดระหว่าง CPU / ทรัพยากรหน่วยความจำและระดับการบีบอัด

อย่างไรก็ตามรุ่นล่าสุดzpaqมักจะไม่ได้บรรจุ / พร้อมใช้งานใน distro ล่าสุด :-(
ฉันมักจะรวบรวมจากแหล่งเมื่อฉันมีเครื่องใหม่และฉันต้องการคอมเพรสเซอร์ที่ดีมาก: https://github.com/zpaq/zpaq

clone https://github.com/zpaq/zpaq
cd zpaq
g++ -O3 -march=native -Dunix zpaq.cpp libzpaq.cpp -pthread -o zpaq


1

ฉันได้ทำการทดสอบเพื่อบีบอัดข้อมูลต่อไปนี้: ผลลัพธ์
โฟลเดอร์ 204MB (พร้อมไฟล์ 1,600 html)

7zip =>     2.38 MB
winrar =>   49.5 MB
zip =>      50.8 MB
gzip =>     51.9 MB

ดังนั้น 7zip ที่ดีที่สุดในพวกเขาคุณสามารถหาได้จากที่นี่
http://www.7-zip.org/


0

bz2 มีการบีบอัดที่เข้มงวดมากขึ้นอัลกอริทึมมีตัวเลือกเพิ่มเติมเพื่อค้นหาความซ้ำซ้อนในการบีบอัด

gzip เป็นเครื่องมือที่มากขึ้นและเป็นแพลตฟอร์มข้ามมากขึ้น เครื่องมือ Windows เพิ่มเติมสามารถจัดการกับไฟล์. gz มันเป็นส่วนหนึ่งของ http ดังนั้นแม้แต่เว็บเบราว์เซอร์ก็สามารถเข้าใจได้

บน linux มีเครื่องมือที่ให้คุณทำงานกับไฟล์บีบอัดได้โดยตรง zgrep และ bzgrep สามารถค้นหาในไฟล์บีบอัด

ถ้าเพียงแค่บน Linux ฉันจะใช้ bzip2 สำหรับอัตราส่วนการบีบอัดที่ดีขึ้นเล็กน้อย


0

xz บีบอัดได้ดีกว่า bz2 มาก แต่ใช้เวลามากกว่านี้ ดังนั้นหากการบีบอัดสูงสุดคือเป้าหมายและพื้นที่บนฮาร์ดไดรฟ์ของคุณอยู่ที่ระดับพรีเมี่ยม (ซึ่งเป็นกรณีของฉันที่มีไดรฟ์หนึ่งตัวที่ 98% เต็ม - ในขณะที่ฉันจัดระเบียบระบบไฟล์ใหม่) และคุณสามารถปิดสคริปต์เพื่อทำงาน - หยุดพักและกลับมาใน 5 นาที

unxz รวดเร็วในการคลายการบีบอัดในประสบการณ์ของฉัน - ซึ่งเป็นสิ่งที่ดีสำหรับฉันทุกวัน

bz2 นั้นเร็วกว่าการบีบอัดมากกว่า xz แต่ไม่ปรากฏว่าได้ผลลัพธ์การบีบอัดของ xz

วิธีเดียวที่จะทำให้การประเมินผลเหล่านี้คือการเรียกใช้การวัดประสิทธิภาพเทียบกับการรวมไฟล์ทั่วไปที่คุณมักจะบีบอัด / คลายการบีบอัดและเปลี่ยนพารามิเตอร์เพื่อดูว่าไฟล์ใดอยู่ด้านบน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.