คำถามติดแท็ก text-processing

การจัดการหรือตรวจสอบข้อความโดยโปรแกรมสคริปต์ ฯลฯ

5
สุ่มสุ่มจำนวนบรรทัดจากไฟล์ข้อมูล
ฉันมีรายการข้อมูลเช่น 12345 23456 67891 -20000 200 600 20 ... สมมติว่าขนาดของชุดข้อมูลนี้ (เส้นเช่นของไฟล์) Nเป็น ฉันต้องการสุ่มวาดmเส้นจากไฟล์ข้อมูลนี้ ดังนั้นผลลัพธ์ควรเป็นสองไฟล์หนึ่งไฟล์เป็นไฟล์ที่รวมmบรรทัดข้อมูลเหล่านี้และอีกไฟล์หนึ่งมีN-mข้อมูลอยู่ด้วย มีวิธีการที่ใช้คำสั่ง Linux หรือไม่

4
วิธีการใช้ regex กับ AWK สำหรับการเปลี่ยนสตริง
สมมติว่ามีข้อความจากไฟล์: (bookmarks ("Chapter 1 Introduction 1" "#1" ("1.1 Problem Statement and Basic Definitions 23" "#2") ("Exercises 31" "#30") ("Notes and References 42" "#34")) ) ฉันต้องการเพิ่ม 11 ลงในแต่ละหมายเลขแล้วตามด้วย a "ในแต่ละบรรทัดหากมีหนึ่งเช่น (bookmarks ("Chapter 1 Introduction 12" "#12" ("1.1 Problem Statement and Basic Definitions 34" "#13") ("Exercises 42" "#41") ("Notes and References 53" …

3
ฉันจะเปลี่ยนเส้นทางการจับคู่ไปยังไฟล์และไม่ตรงกับไฟล์อื่นได้อย่างไร
มีสคริปต์ / โปรแกรม / ยูทิลิตี้สำหรับความต้องการต่อไปนี้แล้วในวิธีที่ได้รับการปรับให้เหมาะสมหรือไม่? someCommand | tee >(grep "pattern" > LinesWhichMatch) | grep -v "pattern" > LinesWhichDoesNotMatch

3
พิมพ์บรรทัดระหว่าง (และไม่รวม) สองรูปแบบ
ฉันจะส่งแบบฟอร์มโดยใช้ cURL ซึ่งเนื้อหาบางส่วนมาจากไฟล์อื่นที่เลือกโดยใช้ sed หากparam1เป็นรูปแบบการจับคู่บรรทัดจากไฟล์อื่น ๆ ที่ใช้sedคำสั่งด้านล่างจะทำงานได้ดี: curl -d param1="$(sed -n '/matchpattern/p' file.txt)" -d param2=value2 http://example.com/submit ตอนนี้ไปที่ปัญหา ฉันต้องการแสดงเฉพาะข้อความระหว่าง 2 รูปแบบการจับคู่ที่ไม่รวมรูปแบบการจับคู่นั้น ช่วยบอกว่าfile.txtประกอบด้วย: Bla bla bla firstmatch It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout. secondmatch …

2
เรียงลำดับผลลัพธ์ตามคอลัมน์
ฉันต้องการที่จะใช้คำสั่งนี้find -maxdepth 1 -type d | while read -r dir; do printf "%s:\t" "$dir"; find "$dir" | wc -l; done( จากที่นี่ ) ซึ่งมีผลลัพธ์ของพื้น ./kennel: 11062 ./shadow: 15449 ./ccc: 9765 ./journeyo: 14200 ./norths: 10710 และเรียงตามหมายเลขที่ใหญ่ที่สุดไปหาน้อยที่สุด แต่ฉันไม่แน่ใจว่าจะทำsortอย่างไรหรืออะไรก็ตามที่ทำงานในคอลัมน์อื่น

3
การลบอักขระที่ไม่ใช่แบบ ASCII ทั้งหมดออกจากเวิร์กโฟลว์ (ไฟล์)
ฉันจะลบอักขระที่ไม่ใช่ ASCII ทั้งหมดออกจากไฟล์เดียวได้อย่างไร จะมีคำสั่งเฉพาะให้ทำสิ่งนี้หรือไม่? grep --colour='auto' -P -n'[^\x00-\x7]' /usr/local/... ฉันเชื่อว่าสิ่งนี้จะค้นหาอักขระภายในเวิร์กโฟลว์ แต่ฉันจะลบอินสแตนซ์ทั้งหมดของอักขระที่สงสัยได้อย่างไร

6
การจัดเรียงคอลัมน์ใหม่โดยใช้ awk
ฉันพยายามย้ายคอลัมน์ที่ 7 ของไฟล์ csv ไปยังจุดสิ้นสุดโดยใช้ awk -F '{print $1,$2,$3,$4,$5,$6,$8,$9,$10,$11,$7}',OFS= "$file" โดยที่ $ file เป็นไฟล์. csv ในไดเรกทอรี อย่างไรก็ตามผลลัพธ์คือ awk: ^ syntax error ไม่มีใครรู้วิธีแก้ไขข้อผิดพลาดนี้หรือไม่?

5
วิธีดึงข้อมูลจากไฟล์ JSON
ฉันมีช่องค้นหาคำตอบสำหรับคำถามของฉัน แต่ไม่พบหรือดีกว่าบอกว่าฉันไม่ได้รับสิ่งที่ฉันพบ ดังนั้นให้พูดคุยเกี่ยวกับสิ่งที่เป็นปัญหาของฉัน ฉันกำลังใช้ซอฟต์แวร์ควบคุมสมาร์ทโฮมกับ Raspberry Pi และเมื่อฉันพบว่าเมื่อสุดสัปดาห์นี้ด้วยการรับ pilight ฉันสามารถจับข้อมูลจากเซ็นเซอร์วัดอุณหภูมิภายนอกของฉันได้ ผลลัพธ์ของการได้รับ pilight ดูเหมือนว่า: { "message": { "id": 4095, "temperature": 409.5 }, "origin": "receiver", "protocol": "alecto_wsd17", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } { "message": { "id": 1490, "temperature": 25.1, "humidity": 40.0, "battery": 1 }, "origin": "receiver", "protocol": "alecto_ws1700", "uuid": "0000-b8-27-eb-0f3db7", "repeats": 3 } …


7
วิธีการเรียงลำดับรายการ BibTex (ตามคีย์ใด ๆ ) ในไฟล์ `.bib`
ฉันทำงานกับ LaTeX และทำเวอร์ชันกับ Git สำหรับการจัดการบรรณานุกรมฉันใช้ Mendeley ปัญหาคือทุกครั้งที่ Mendeley ซิงโครไนซ์การ.bibส่งออกมันมีลำดับที่แตกต่างกัน ความคิดของฉันคือการเรียงลำดับรายการ BibTex ใน.bibไฟล์แต่ละครั้งก่อนส่ง คุณช่วยฉันได้ทำอย่างไรในวิธีที่ฉลาด (สั้น & หวาน)? :) PS ฉันสามารถเรียกใช้รูทีนนี้ด้วยตนเองได้ ฉันไม่ต้องการการรวมคอมไพล์ ฉันต้องการให้โปรแกรม / สคริปต์เรียง.bibไฟล์

5
จะ 'วาง' / ลบตัวอักษรจากด้านหน้าของสตริงได้อย่างไร?
ฉันมีสตริงที่ฉันต้องการจัดการ สตริงเป็นH08W2345678วิธีที่ฉันจะสามารถจัดการกับมันดังนั้นการส่งออกเป็นเพียงแค่W2345678? ในทำนองเดียวกันถ้าฉันต้องการที่จะลดตัวละคร 4 ตัวสุดท้ายจากH08W2345678นั้นฉันH08W234จะทำยังไงดี?

4
ลบรายการที่ซ้ำกันออกจากไฟล์ CSV
ฉันมีไฟล์ [csv] ซึ่งมีการพิมพ์ซ้ำข้อมูลเช่นข้อมูลเดียวกันที่พิมพ์สองครั้ง ฉันได้ลองใช้uniq ของ sort โดยที่sort myfile.csv | uniq -uไม่มีการเปลี่ยนแปลงmyfile.csvและฉันได้ลองแล้วsudo sort myfile.csv | uniq -uแต่ก็ไม่แตกต่างกัน ดังนั้นปัจจุบันไฟล์ csv ของฉันมีลักษณะเช่นนี้ a a a b b c c c c c ฉันต้องการที่จะดูเหมือน a b c

3
นับบันทึกรูปแบบการจับคู่ด้วย Awk
ดังนั้นผมจึงบอกว่าจะทำอย่างไรlast > lastloggedinที่จะสร้างไฟล์ที่แสดงให้เห็นว่าการเรียนเข้าสู่ระบบล่าสุดตั้งแต่รีบูตระบบที่ผ่านมาและตอนนี้ฉันขอให้เขียนสคริปต์ Awk ซึ่งเป็นชื่อmyawkที่นับ / กำหนดวิธีการหลายสายของ มีสตริงlastloggedinCFS264 ฉันเคยทำ grep -c CFS264 lastloggedin

2
แทนที่พื้นที่ว่างค่าที่หายไปด้วยศูนย์
ฉันมีไฟล์ข้อความที่คั่นด้วยแท็บ input.txt ประมาณ 30K บรรทัดฉันต้องการตรวจสอบแต่ละแถว (s1..s30K บรรทัด) สำหรับค่าที่หายไป (เช่นพื้นที่ว่าง) และเติมค่าที่หายไปด้วยค่าศูนย์ดู out.txt input.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 4 4 s3 4 8 0 out.txt id no1 no2 no3 no4 s1 23 34 45 12 s2 0 4 4 0 s3 4 0 8 0

3
ลบอักขระตัวสุดท้ายในคำ แต่ถ้าตัวละครนั้นอยู่ในนั้น - ในทุบตี
วิธีลบตัวอักขระสุดท้ายเฉพาะเมื่อมันอยู่ที่นั่น? การป้อนข้อมูล: OpenOffice.org/m openOffice.org/ozm Pers PFG ฟิล ศ. รับผิดชอบ Roonstr./m roonstr./ozm ผลลัพธ์ที่ต้องการ: OpenOffice.org openOffice.org Pers PFG ฟิล ศ รับผิดชอบ Roonstr roonstr ฉันเข้าใจแล้วจนถึงจุดที่เหลือเท่านั้น แต่น่าเสียดายที่คำสั่ง sed ล่าสุดยังลบตัวอักษรgด้วย: $ cat filename | grep "\." | cut -d"/" -f1 | sed 's/.$//'

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.