คำถามติดแท็ก text-processing

การจัดการหรือตรวจสอบข้อความโดยโปรแกรมสคริปต์ ฯลฯ

3
ทำสองสิ่งด้วยเอาต์พุตจากคำสั่ง
ฉันมีโปรแกรมtexcountที่แสดงจำนวนคำในเอกสาร LaTeX ของฉัน ฉันยังสามารถsedไพพ์ผลลัพธ์ของสิ่งนี้เพื่อสร้างบรรทัดใหม่ของ TeX และเขียนสิ่งนี้ลงในไฟล์ที่ฉันสามารถรวมไว้ในเอกสารสุดท้ายของฉัน แต่เมื่อฉันทำtexcount foo.tex | sed s/$/'\\\\'/ > wc.texเอาต์พุตบรรทัดคำสั่งของtexcountถูกระงับ ฉันจะรับเอาต์พุตของคำสั่งแรกที่จะแสดงในเทอร์มินัลและไพพ์ไปยัง sed ได้อย่างไร?


2
grep ตัวละครโดยรอบของการแข่งขัน
ฉันต้องการค้นหาและแทนที่ภายในฐานข้อมูลขนาดใหญ่และมันไม่ได้ทำในสิ่งที่ฉันคิดว่าควรจะเกิดขึ้น ฉันต้องการ grep สำหรับสตริงเป้าหมายของฉันในไฟล์แล้วดูอักขระ 8 ตัวหรือมากกว่านั้น (ฉันอาจต้องปรับตัวเลขนั้นขึ้นอยู่กับ) ฉันจะทำสิ่งนั้นได้อย่างไร เหตุผลที่ฉันไม่สามารถดูลูกตานี้ได้เพราะมีหลายร้อยถ้าไม่ตรงกัน ฉันต้องการได้รับจำนวนอักขระรอบ ๆ สตริงและจากนั้นสอดเข้าไปuniqหรือเพื่อดูว่าทำไมการค้นหาและแทนที่ของฉันจึงมีพฤติกรรมที่ไม่คาดคิด นอกจากนี้ยังสามารถมีการแข่งขันหลายรายการในบรรทัดเดียวกัน!

2
วิธีการเปลี่ยนสตริงทั้งหมดในไฟล์ python จาก snake_case เป็น camelCase ใน sed
ฉันลองรูปแบบที่น่าสนใจเช่นนี้จาก commandlinefu sed -r "s/('[a-z]+)_([a-z])([a-z]+)/\1\U\2\L\3/" แต่อย่างใดมันไม่ทำงาน มีอยู่สิ่งหนึ่งที่พวกเขาลืมตัวเลขซึ่งฉันสามารถแก้ไขได้ แต่รูปแบบนี้ใช้ได้กับขีดเส้นใต้เดียวเท่านั้น ตัวอย่างเช่นถ้าฉันมีสตริงในไฟล์ 'foo_bar_foo' มันจะแปลงเป็น 'fooBar_foo' . ซึ่งไม่ใช่สิ่งที่ฉันต้องการ (ฉันต้องการ'fooBarFoo') ฉันต้องการเปลี่ยนสตริงในไฟล์ไม่ใช่ชื่อตัวแปรหรืออย่างอื่น ตัวอย่างเช่นนี้ delta_limits=Limits(general_settings['signal_lower_limit'] ควรเป็นแบบนี้ delta_limits=Limits(general_settings['signalLowerLimit']

4
เชื่อมต่อฟิลด์ต่าง ๆ ด้วยตัวคั่นที่แตกต่างกัน
ฉันมีไฟล์คั่นด้วยแท็บดังนี้: chr1 53736473 54175786 chr1 56861276 56876438 chr1 57512145 57512200 ฉันต้องการต่อผลลัพธ์ทั้งสามฟิลด์เข้าด้วยกันดังนี้ chr1:53736473-54175786 chr1:56861276-56876438 chr1:57512145-57512200 ฉันลองด้วยpaste -d ':-' fileซึ่งดูเหมือนจะไม่ทำงาน ใครช่วยได้บ้าง จะเป็นการดีที่จะมีคำสั่ง unix ง่ายฉันรู้ว่ามันค่อนข้างง่ายกับภาษาที่สูงขึ้น

4
แทนที่หลายบรรทัดในไฟล์ข้อความด้วยรูปแบบคงที่
โอเคกำลังมองหาวิธีที่รวดเร็วในการทำสิ่งนี้ ฉันมีรายการหมายเลขบรรทัดที่ต้องเปลี่ยนแปลงในไฟล์ข้อมูลตัวอักษร รูปแบบ 16 บิตในบรรทัดนั้นสามารถเป็นอะไรก็ได้ แต่ฉันต้องเปลี่ยนเพื่อเปลี่ยนเป็นอ่านXXXXXXXXXXXXXXXXตามหมายเลขบรรทัดเท่านั้น อีกครั้งฉันมีรายการหมายเลขบรรทัดยาวฉันรู้ว่าจำเป็นต้องเปลี่ยน ไม่มีรูปแบบที่สังเกตเห็นได้สำหรับบรรทัดที่จำเป็นต้องเปลี่ยน (ฉันไม่ได้เขียนรูปแบบข้อมูล แต่ฉันรู้ว่าต้องเปลี่ยนบรรทัดใดเพื่ออ่าน X ทั้งหมด) ฉันอ่านคำตอบมากมายที่นี่และไม่มีใครจัดการเรื่องนี้ได้ หากยังไม่ชัดเจนฉันจะใช้อีกวิธีหนึ่ง ... เปลี่ยนสาย 26115, 32198, 37256, 40001, 40023 XXXXXXXXXXXXXXXในแฟ้มที่จะอ่าน ฉันมีมากกว่า 100,000 บรรทัดที่ต้องเปลี่ยนไฟล์ 1.9 ล้านบรรทัด

1
เรียกใช้คำสั่งบนหลาย ๆ ไฟล์และบันทึกผลลัพธ์สำหรับแต่ละไฟล์ในไฟล์ที่แตกต่างกันอย่างไร [ปิด]
ฉันมี vcf-file (file.vcf) และไฟล์ประชากรหลายไฟล์(HA1.txt, HA1.txt, HA2.txt,...,HA28.txt)ที่มี ID แต่ละรายการ ไฟล์ประชากรแต่ละไฟล์มีลักษณะดังนี้ (แต่ละบรรทัดเป็นหนึ่งไฟล์): $ cat HA1.txt QQ48_SD1A-37 ED19_SD1A40-3_357 TT335_SD1A-20 HH356_SD1A-7 Q029B_SD1A38 HT73_SD1A-28 HT288_SD1A-24 Q004B_SD1A-1 Q027_SD1A-4 Q096_SD1A-40 ฉันต้องการแยกความลึกของการครอบคลุมสำหรับแต่ละบุคคลในแต่ละประชากร ฉันจะรันคำสั่งนี้ได้อย่างไร: grep -v "^#" file.vcf | cut -f 10 | cut -d ':' -f2สำหรับแต่ละคนในไฟล์ประชากรและบันทึกผลลัพธ์ของประชากรแต่ละคนในไฟล์แยกกัน ผลลัพธ์ที่ฉันต้องการสำหรับประชากรแต่ละคนมีลักษณะดังนี้: . 6 4 6 . 5 . 10 . 7 . …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.