ฉันมีเอกสารข้อความที่มีข้อความมากมายซึ่งเพิ่มพื้นที่พิเศษหลังจากตัวอักษรทุกตัว!
ตัวอย่าง:
T h e b o o k a l s o h a s a n a n a l y t i c a l p u r p o s e w h i c h i s m o r e i m p o r t a n t…
สายตา:
T␣h␣e␣␣b␣o␣o␣k␣␣a␣l␣s␣o␣␣h␣a␣s␣␣a␣n␣␣a␣n␣a␣l␣y␣t␣i ␣c␣a␣l␣␣p␣u␣r␣p␣o␣s␣e␣␣w␣h␣i␣c␣h␣␣i␣s␣␣m␣o␣r␣e␣␣i␣ m␣p␣o␣r␣t␣a␣n␣t ...
โปรดทราบว่ามีช่องว่างเพิ่มเติมหลังจากตัวอักษรทุกตัวดังนั้นจึงมีช่องว่างสองคำระหว่างคำที่ต่อเนื่องกัน
มีวิธีที่ฉันจะได้รับawk
หรือsed
ลบช่องว่างเพิ่มเติมหรือไม่? (น่าเสียดายที่เอกสารข้อความนี้มีขนาดใหญ่มากและอาจใช้เวลานานมากในการดำเนินการด้วยตนเอง)
ฉันขอขอบคุณที่นี่อาจเป็นปัญหาที่ซับซ้อนมากขึ้นในการแก้ด้วยสคริปต์ทุบตีง่าย ๆ เพราะต้องมีการจดจำข้อความด้วยเช่นกัน
ฉันจะแก้ไขปัญหานี้ได้อย่างไร
echo 't h i s i s a n e x a m p l e' | sed 's/ //g'
echo 'T h i s ; i s .a n 9 8 e x a m p l e' | perl -pe 's/[a-z]\K (?=[a-z])//ig'