ฉันจะลบบรรทัดทั้งหมดที่มีอักขระแป้นพิมพ์ที่ไม่ใช่ ASCII ได้อย่างไร
ฉันลองใช้รหัสนิพจน์ทั่วไปหลายครั้ง แต่ไม่ควรทำเช่นนี้ฉันควรลองใช้รหัสนี้[^\x00-\x7F]+
แต่ไม่ได้เลือกอักขระทั้งหมด
ความคิดที่อยู่ในใจของฉันคือการใช้วิธีนี้[^a-z0-9``~!@#$%^&*()-_=+[]{}\|;:'"<>,./?]
แต่ก็ยังใช้งานไม่ได้เพราะตัวละครบางตัวไม่ได้ถูกคัดออก\
/
|
{
}
[
]
$
#
^
(
)
หากบรรทัดมีอักขระใด ๆ ที่ไม่อยู่ในรายการด้านล่างฉันต้องการลบออกหรือคั่นหน้ามัน
0123456789`~!@#$%^&*()-_=+[]{}\/|;:'"<>,.? abcdefghijklmnopqrstuvwxyz ABCDEFGHIJKLMNOPQRSTUVWXYZ
ตัวอย่างง่ายๆ: มีตัวละครเพิ่มขึ้นเช่นนี้ที่นี่: https://en.wikipedia.org/wiki/List_of_Unicode_characters
0123456789`~!@#$%^&*()-_=+[]{}\|;:'"<>,./? abcdefghijklmnopqrstuvwxyz ABCDEFGHIJKLMNOPQRSTUVWXYZ ¤©ª«¬¯°±²³´µ¶·¸¹º»¼½¾¿÷ÆIJŒœƔƕƋƕ ƜƝƢƸƾDžNJNjǽǾǼɁɀȾɎʒəɼʰʲʱʴʳʵʶʷʸˁˀˇˆ˟ˠ ˩˧Ͱͱͳʹͼͻͺ͵ͿΏΔΘΞΛΣΠΦΧΨΩΪΫάέήίΰαβδε θηκλμξπςρφχψωϊϋϏώϑϐϓϒϔϕϖϠϟϞϝϜϡϢ ϤϣϧϫϬϮϯϰϱ₠₡₢₣₤₥₦₧₨₩₪₫€₭₮₯₰₱₲ ₳₴₵₶₷₸₹₺₻₼₽₾₿⅐⅑⅒⅓⅔⅕⅖⅗⅘⅙⅚⅛⅜ ⅝⅞⅟℠℡™℣ℤ℥Ω℧ℨ℩KÅℬℭ℮ℯ⇀⇁ↀↁↂↃↄ ⇔⇕⇖⇗⇘⇙⇚⇛⇜⇝⇞⇟⇠⇡⇢⇣⇤⇥⇦⇧⇨⅀⅁⅂⅃⅄ⅅ ⅆⅇⅈⅉ⅊⅋⅌⅍ⅎ⅏ⅱⅲⅳⅴⅵⅶⅷⅸⅹⅺⅻⅼⅽ
ผลลัพธ์ที่คาดหวัง:
0123456789`~!@#$%^&*()-_=+[]{}\|;:'"<>,./? abcdefghijklmnopqrstuvwxyz ABCDEFGHIJKLMNOPQRSTUVWXYZ
[^a-z0-9``~!@#$%^&*()-_=+[]{}\|;:'"<>,./?]
จะกลายเป็น[\^a-z0-9``~!@\#\$%^&*\(\)-_=+\[\]{}\|;:'"<>,./?]
(ทางตะวันออก)
^
ในตำแหน่งแรกของคลาสอักขระหมายถึงการปฏิเสธถ้าคุณหลบหนีมันหมายความว่า ... เครื่องหมายรูปหมวกยังวงเล็บ, ไปป์และตัวละครอื่น ๆ ไม่จำเป็นต้องหลบหนี แต่เส้นประ-
จะต้องหลบหนีตามที่มัน หมายถึงช่วงของตัวละคร
[^\x00-\x7F]+
ทำงานได้ดีสำหรับฉันใน Notepad ++ มันให้ผลลัพธ์ที่คาดหวัง Npp รุ่นของคุณคืออะไร (ที่นี่ฉันมี7.5.1
) คุณตรวจสอบRegular expression
ไหม