ฉันมีไฟล์ JSON บางไฟล์ 20 GB แต่ละไฟล์ที่ฉันต้องการบีบอัดด้วยgzip
:
gzip file1.json
นี่ใช้ซีพียูเต็มแกนหนึ่งตัว
มันประมวลผลประมาณ 25 MB / s (ตรวจสอบในatop
), ฮาร์ดไดรฟ์ของฉันสามารถอ่าน 125 MB / s และฉันมี 3 คอร์โปรเซสเซอร์ฟรีดังนั้นฉันคาดว่าจะได้รับความเร็วเมื่อบีบอัดหลายไฟล์ในแบบคู่ขนาน ดังนั้นฉันจึงวิ่งในอาคารอื่น ๆ :
gzip file2.json
gzip file3.json
gzip file4.json
น่าแปลกที่ปริมาณงานของฉันไม่เพิ่มขึ้น CPU อยู่ที่ประมาณ 25% ของแต่ละคอร์และ HD ของฉันยังคงอ่านที่ 25 MB / s เท่านั้น
ทำไมและวิธีการที่อยู่หรือไม่
dd
ทำเช่นเดียวกันหรือไม่