[root@server]# awk '!seen[$0]++' out.txt > cleaned
awk: (FILENAME=out.txt FNR=8547098) fatal error: internal error
Aborted
[root@server]#
"" เซิร์ฟเวอร์ "" มี: 8 GByte RAM + 16 GByte SWAP, x> 300 GByte พื้นที่ว่าง, amd64, CPU ของเดสก์ท็อป ลินุกซ์ทางวิทยาศาสตร์ 6.6 ไม่มีอะไรอื่นที่จะทำเพื่อให้โหลด อ๊ะยกเลิกหลังจากนั้นสองสามวินาที .. out.txt คือ ~ 1.6 GByte GNU Awk 3.1.7
คำถาม : ฉันจะลบบรรทัดที่ซ้ำกันในขณะที่รักษาลำดับของบรรทัดได้อย่างไร ตัวพิมพ์เล็กก็สำคัญเช่นกัน: "A" และ "a" เป็นสองบรรทัดที่แตกต่างกันต้องเก็บไว้ แต่ "a" และ "a" ซ้ำกันจำเป็นต้องใช้อันแรกเท่านั้น
คำตอบอาจเป็นอะไรก็ได้ .. ถ้า awk ไม่ดีสำหรับสิ่งนี้ .. แล้ว perl / sed .. ปัญหาอาจเป็นอย่างไร
[root@server]# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 61945
max locked memory (kbytes, -l) 99999999
max memory size (kbytes, -m) unlimited
open files (-n) 999999
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 99999999
cpu time (seconds, -t) unlimited
max user processes (-u) 61945
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
[root@server]#
อัปเดต: ฉันลองสิ่งนี้ในเครื่อง RHEL แต่ก็ไม่ได้ยกเลิก แต่ฉันไม่มีเวลารอให้เสร็จแล้วทำไม SL ลินุกซ์ถึงแตกต่างจาก RHEL
อัปเดต: ฉันพยายามใช้ Ubuntu 14 gues เสมือนจริง .. จนถึงตอนนี้ก็ใช้งานได้! ไม่ใช่ปัญหาเกี่ยวกับ ulimit: mawk 1.3.3
root@asdf-VirtualBox:~# ulimit -a
core file size (blocks, -c) 0
data seg size (kbytes, -d) unlimited
scheduling priority (-e) 0
file size (blocks, -f) unlimited
pending signals (-i) 51331
max locked memory (kbytes, -l) 64
max memory size (kbytes, -m) unlimited
open files (-n) 1024
pipe size (512 bytes, -p) 8
POSIX message queues (bytes, -q) 819200
real-time priority (-r) 0
stack size (kbytes, -s) 8192
cpu time (seconds, -t) unlimited
max user processes (-u) 51331
virtual memory (kbytes, -v) unlimited
file locks (-x) unlimited
root@asdf-VirtualBox:~#
awk
รุ่นในสองเครื่อง?
out.txt
ไหน คำสั่งเดียวกันใช้งานได้หรือไม่หากคุณลองใช้ไฟล์ที่เล็กกว่านี้? มีผู้ใช้บนเครื่องกี่คน? มีหน่วยความจำเพียงพอสำหรับกระบวนการหรือไม่ มีสิ่งใดเป็นพิเศษเกี่ยวกับบรรทัด 8547098 ของไฟล์อินพุตหรือไม่