คำถามติดแท็ก text-processing

การจัดการหรือตรวจสอบข้อความโดยโปรแกรมสคริปต์ ฯลฯ

5
/ usr / bin / ptx: คุณสามารถให้กรณีการใช้งานหรือสอง?
ฉันกำลังดูรายการของไฟล์ที่รวมอยู่ใน coreutils และฉันสามารถสร้างตัวอย่างของวิธีที่ฉันสามารถใช้คำสั่งทั้งหมดที่จัดเตรียมไว้ให้สำหรับตัวเองยกเว้น ptx คุณสามารถยกตัวอย่างการใช้ ptx หนึ่งหรือสอง (หรือสาม) ได้หรือไม่ กรณีการใช้งานที่หลากหลายยิ่งดี $ apropos ptx ptx(1) - produce a permuted index of file contents

1
รูปแบบทดแทนภายในไฟล์ที่มีเนื้อหาของไฟล์อื่น
ฉันมีไฟล์ข้อความ ( devel.xml) ฉันเพิ่มคำ REPLACETHIS ลงไปเพื่อแทนที่สตริงนี้ด้วยเนื้อหาภายในไฟล์อื่น ( temp.txt) สิ่งที่ฉันมีอยู่ใกล้ที่สุดคือ: sed -i -e "/REPLACETHIS/r temp.TXT" -e "s///" devel.txt; สิ่งนี้แทรกเนื้อหาหลังสตริงและจากนั้นลบสตริงในภายหลัง นี่เป็นวิธีที่ดีที่สุดที่จะทำ?

4
แยกเอาท์พุทยาวเป็นสองคอลัมน์
มียูทิลิตี้หรือสคริปต์ง่าย ๆ ที่จะจัดเรียงผลลัพธ์จากหนึ่งในสคริปต์ของฉันหรือไม่ ฉันมีข้อมูลในบางรูปแบบ: A aldkhasdfljhaf B klajsdfhalsdfh C salkjsdjkladdag D lseuiorlhisnflkc E sdjklfhnslkdfhn F kjhnakjshddnaskjdh แต่ถ้าสิ่งนี้กลายเป็นสองความยาวให้เขียนข้อมูลในรูปแบบต่อไปนี้ (ซึ่งยังคงเรียงตามแนวตั้ง): A aldkhasdfljhaf D lseuiorlhisnflkc B klajsdfhalsdfh E sdjklfhnslkdfhn C salkjsdjkladdag F kjhnakjshddnaskjdh จากการอ่าน manpage ฉันไม่คิดว่านี่จะเป็นสิ่งcolumnที่เหมาะสม แต่ฉันไม่แน่ใจ มันง่ายที่จะแยกในรูปแบบ: A B C D E F โดยพิมพ์เฉพาะ\nทุกบรรทัดที่สอง (สิ่งที่สคริปต์ปัจจุบันของฉันทำ) ความคิดใด ๆ ขอบคุณ!

6
วิธีการคลายบีบอัดไฟล์ข้อความธรรมดาขนาดใหญ่บีบอัดบางส่วน?
ฉันมีไฟล์ zip ขนาด 1.5 GB เนื้อหาของมันคือไฟล์ข้อความตัวอักษรขนาดใหญ่ที่น่าขัน (60 GB) และตอนนี้ฉันมีพื้นที่เหลือบนดิสก์ไม่เพียงพอที่จะดึงมันออกมาทั้งหมดหรือฉันต้องการที่จะดึงมันออกมาทั้งหมดแม้ว่าฉันจะมีก็ตาม สำหรับกรณีการใช้งานของฉันมันจะพอเพียงถ้าฉันสามารถตรวจสอบบางส่วนของเนื้อหา ดังนั้นฉันต้องการแตกไฟล์เป็นสตรีมและเข้าถึงช่วงของไฟล์ (เช่นเดียวกับที่สามารถทำได้ผ่านส่วนหัวและส่วนท้ายในไฟล์ข้อความปกติ) ไม่ว่าจะโดยหน่วยความจำ (เช่นแยกสูงสุด 100kb เริ่มต้นที่เครื่องหมาย 32GB) หรือตามบรรทัด (ให้บรรทัดข้อความธรรมดา 3700-3900) มีวิธีการที่จะบรรลุเป้าหมายนั้นหรือไม่?

18
จะอ่านที่อยู่ IP ย้อนหลังได้อย่างไร
หากเรามีสตริงนี้ ( ที่อยู่ IP ):192.168.1.1 ฉันจะได้รับ ( แบบฟอร์มการบันทึก DNS ย้อนกลับ ) จากสายนี้ดังนั้นมันจะปรากฏเช่น1.1.168.192.in-addr.arpaใช้เปลือกสคริปต์?

7
วิธีใช้ patch และ diff เพื่อรวมสองไฟล์และแก้ไขข้อขัดแย้งโดยอัตโนมัติ
ฉันได้อ่านเกี่ยวกับ diff และ patch แต่ฉันไม่สามารถหาวิธีใช้สิ่งที่ฉันต้องการ ฉันเดาว่ามันค่อนข้างง่ายดังนั้นเพื่อแสดงปัญหาของฉันให้ใช้สองไฟล์นี้: a.xml <resources> <color name="same_in_b">#AAABBB</color> <color name="not_in_b">#AAAAAA</color> <color name="in_b_but_different_val">#AAAAAA</color> <color name="not_in_b_too">#AAAAAA</color> </resources> b.xml <resources> <color name="same_in_b">#AAABBB</color> <color name="in_b_but_different_val">#BBBBBB</color> <color name="not_in_a">#AAAAAA</color> </resources> ฉันต้องการมีเอาต์พุตซึ่งมีลักษณะเช่นนี้ (ลำดับไม่สำคัญ): <resources> <color name="same_in_b">#AAABBB</color> <color name="not_in_b">#AAAAAA</color> <color name="in_b_but_different_val">#BBBBBB</color> <color name="not_in_b_too">#AAAAAA</color> <color name="not_in_a">#AAAAAA</color> </resources> การผสานควรมีบรรทัดทั้งหมดตามกฎง่าย ๆ นี้: บรรทัดใด ๆ ที่อยู่ในไฟล์เดียวเท่านั้น หากบรรทัดมีแท็กชื่อเดียวกัน แต่มีค่าต่างกันให้นำค่าจากวินาที ฉันต้องการใช้งานนี้ในสคริปต์ทุบตีดังนั้นจึงไม่จำเป็นต้องทำโดยใช้ diff …

7
วิธีเติมส่วนหัวของใบอนุญาตแบบซ้ำ ๆ สำหรับไฟล์. h และ. cpp ทั้งหมดในไดเรกทอรี
ฉันกำลังพยายามเพิ่มส่วนหัวของใบอนุญาตให้กับไฟล์ส่วนหัวและไฟล์ต้นฉบับในไดเรกทอรีโครงการโดยใช้ for loop วิธีนี้ใช้ไม่ได้มีวิธีอื่นอีกsedไหมที่ใช้?


6
ใช้คำสั่งกับไฟล์จำนวนมาก
ฉันมีโฟลเดอร์ที่มีไฟล์จำนวนมาก (xyz1, xyz2 ไปจนถึง xyz5025) และฉันต้องเรียกใช้สคริปต์ในทุก ๆ ไฟล์รับ xyz1.faa, xyz2.faa และอื่น ๆ คำสั่งสำหรับไฟล์เดียวคือ: ./transeq xyz1 xyz1.faa -table 11 มีวิธีการทำเช่นนั้นโดยอัตโนมัติหรือไม่? อาจจะเป็นคำสั่งผสมที่ต้องทำ?

7
แยกวิเคราะห์ XML เพื่อรับค่าโหนดในสคริปต์ทุบตี?
ฉันต้องการทราบวิธีการรับค่าของโหนดด้วยพา ธ ต่อไปนี้: config/global/resources/default_setup/connection/host config/global/resources/default_setup/connection/username config/global/resources/default_setup/connection/password config/global/resources/default_setup/connection/dbname จาก XML ต่อไปนี้: <?xml version="1.0"?> <config> <global> <install> <date><![CDATA[Tue, 11 Dec 2012 12:31:25 +0000]]></date> </install> <crypt> <key><![CDATA[70e75d7969b900b696785f2f81ecb430]]></key> </crypt> <disable_local_modules>false</disable_local_modules> <resources> <db> <table_prefix><![CDATA[]]></table_prefix> </db> <default_setup> <connection> <host><![CDATA[localhost]]></host> <username><![CDATA[root]]></username> <password><![CDATA[pass123]]></password> <dbname><![CDATA[testdb]]></dbname> <initStatements><![CDATA[SET NAMES utf8]]></initStatements> <model><![CDATA[mysql4]]></model> <type><![CDATA[pdo_mysql]]></type> <pdoType><![CDATA[]]></pdoType> <active>1</active> </connection> </default_setup> </resources> <session_save><![CDATA[files]]></session_save> </global> <admin> <routers> …


3
วิธีแสดงการขึ้นต่อกันที่กำหนดใน makefile เป็นแผนผัง
ปัญหา ฉันต้องการดูการอ้างอิงสำหรับหนึ่งหรือมากกว่าหนึ่งเป้าหมายของ makefile ดังนั้นฉันกำลังมองหาโปรแกรมที่สามารถแยกวิเคราะห์ makefiles แล้วจะแสดงการอ้างอิงในรูปแบบต้นไม้บางอย่าง (เยื้อง, ascii-art, ... ) หรือเป็นกราฟ (dot, ... ) คล้ายคลึงกัน มีโปรแกรมที่ทำสิ่งนี้สำหรับสถานการณ์อื่น ๆ : pactreeหรือcashreeสามารถแสดงการขึ้นต่อกันของชุดซอฟต์แวร์ในรูปแบบตามลำดับในแผนผังเช่นรูปแบบ ascii หรือเป็นdotกราฟ gcc -M source_file.c แสดงการขึ้นต่อกันของไฟล์ต้นฉบับ C เป็นกฎการสร้าง pstreeแสดงการเป็นตัวแทน ASCII ของต้นไม้กระบวนการ ความคืบหน้า ค้นหาเว็บที่ผมพบความช่วยเหลือเล็ก ๆ น้อย ๆ นั่นทำให้ฉันต้องลอง make --always-make --silent --dry-run some_target | \ grep --extended-regexp 'Considering target file|Trying rule prerequisite' …

9
ลบบรรทัดส่วนหัวพิเศษออกจากไฟล์ยกเว้นบรรทัดแรก
ฉันมีไฟล์ที่ดูเหมือนตัวอย่างของเล่นนี้ ไฟล์จริงของฉันมี 4 ล้านบรรทัดซึ่งต้องลบประมาณ 10 บรรทัด ID Data1 Data2 1 100 100 2 100 200 3 200 100 ID Data1 Data2 4 100 100 ID Data1 Data2 5 200 200 ฉันต้องการลบบรรทัดที่มีลักษณะส่วนหัวยกเว้นบรรทัดแรก ไฟล์สุดท้าย: ID Data1 Data2 1 100 100 2 100 200 3 200 100 4 100 100 5 200 200 …

3
แยกส่วนของเส้นที่มีรูปแบบเฉพาะโดยใช้ awk, sed
ฉันมีคำถามเกี่ยวกับตัวดำเนินการ awk / sed ฉันมีไฟล์ขนาดใหญ่ที่มีชุดของบรรทัดต่อไปนี้ซ้ำแล้วซ้ำอีก Expression loweWallrhoPhi : sum=-6.97168e-09 Expression leftWallrhoPhi : sum=6.97168e-09 Expression lowerWallPhi : sum=-5.12623e-12 Expression leftWallPhi : sum=5.12623e-12 Expression loweWallrhoUSf : sum=-6.936e-09 Expression leftWallrhoUSf : sum=6.97169e-09 Expression lowerWallUSf : sum=-5.1e-12 Expression leftWallUSf : sum=5.12624e-12 ฉันต้องการแยกค่าหลังจากผลรวมในแต่ละกรณีในไฟล์แยกกัน เป็นไปได้ไหมที่จะทำในครั้งเดียว?


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.