ฉันมีชุดของ.tar.gz
ไฟล์ซึ่งเป็นไฟล์สำรองที่ซ้ำกัน (ทั้งข้อมูลสำรองเต็มหรือไฟล์เพิ่มเติม) ฉันต้องการคำนวณว่าไดเรกทอรีใดใช้พื้นที่ในการสำรองข้อมูลมากที่สุด นี่อาจเป็นตัวเลขที่แตกต่างกันในการคำนวณว่าไดเรกทอรีใดมีพื้นที่ว่างมากที่สุดในระบบไฟล์สดเพราะฉันจำเป็นต้องพิจารณาว่าไฟล์มีการเปลี่ยนแปลงบ่อยแค่ไหน (ดังนั้นจึงมีพื้นที่สำหรับการสำรองข้อมูลเพิ่มเติม) และวิธีบีบอัดไฟล์
ฉันรู้ว่าในขณะที่รูปแบบไฟล์เก็บถาวรอื่น ๆ หลายรูปแบบจัดเก็บไฟล์บีบอัดเป็นเอนทิตีที่แตกต่างกันภายในไฟล์เก็บถาวร.tar.gz
ไฟล์ทำไม่ได้และดังนั้นจึงเป็นไปไม่ได้ที่จะได้รับจำนวนที่แน่นอนของการจัดเก็บข้อมูล มีเครื่องมือใดในการคำนวณการประมาณการอย่างน้อยบ้างไหม?