ฉันมีพีซีที่ใช้ Intel (R) Pentium (R) CPU G640 @ 2.80 GHz และ RAM 8 GB ฉันใช้ Scientific Linux 6.5 บนระบบไฟล์ EXT3
ในการตั้งค่านี้วิธีที่เร็วที่สุดที่ฉันสามารถทำได้sort -u
บนไฟล์ 200 กิกะไบต์คืออะไร?
ฉันควรแบ่งไฟล์ออกเป็นไฟล์ที่เล็กกว่า (เล็กกว่า 8 GB) sort -u
รวมเข้าด้วยกันแล้วแยกเป็นขนาดอื่นsort -u
อีกครั้งหรือไม่ หรือมีสคริปต์การเรียงลำดับโปรแกรมที่สามารถจัดการไฟล์ขนาดใหญ่นี้ด้วย RAM ที่มีจำนวน จำกัด ของฉันได้หรือไม่
parallel
สำหรับสิ่งนี้ฉันคิดว่าแทนที่จะใช้มากกว่าparallel
นั้นที่ติดตั้งตามค่าเริ่มต้นในบางระบบ
sort(1)
สามารถเรียกใช้พื้นที่ว่างบน/tmp
; ถ้าเป็นเช่นนั้นคุณสามารถกำหนดพื้นที่อื่นสำหรับไฟล์ชั่วคราวด้วยตัวแปรสภาพแวดล้อมTMPDIR
หรือตั้งค่าสถานะ-T=<tmpdir>
/tmp
คำสั่งควรจะทำงานตราบเท่าที่คุณมีพื้นที่ว่างเพียงพอบน