ฉันมี URL จำนวนมากที่ไม่มีตัวคั่นในรูปแบบเดียวกับด้านล่าง:
http://example.comhttp://example.nethttp://example.orghttp://etc...
ฉันต้องการให้แต่ละ URL อยู่ในบรรทัดใหม่ ฉันพยายามทำสิ่งนี้โดยแทนที่ "http: //" ด้วย "\ nhttp: //" โดยใช้ sed
sed 's_http://_\nhttp://_g' urls.txt
แต่เกิดข้อผิดพลาดในการแบ่งกลุ่ม (การละเมิดหน่วยความจำ) ฉันสามารถคาดเดาได้ว่าขนาดไฟล์ที่แท้จริง (เกิน 100GB) ทำให้เกิดความผิดเพี้ยนเกินขีด จำกัด
ฉันสามารถแบ่งไฟล์ออกเป็นไฟล์เล็ก ๆ หลาย ๆ ไฟล์เพื่อการประมวลผลได้ แต่อินสแตนซ์ทั้งหมดของ "http: //" จะต้องถูกเก็บรักษาไว้เหมือนเดิม
มีวิธีที่ดีกว่าในการทำเช่นนี้?