Unicode อาจมีช่องว่าง 50 ช่อง
\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000] [\ u0009 \ u000A- \ u000D \ u0020 \ u0085 \ u00A0 \ u1680 \ u180E \ u2000- \ u200A \ u2028 \ u2029 \ u202F \ u205F \ u3000
และตัวแบ่งบรรทัดที่ 6
ไม่เพียง CRLF, LF, CR แต่ยัง NEL (U + 0085), PS (U + 2029) และ LS (U + 2028)
บางทีฉันอาจจะเข้าใจช่องว่างส่วนใหญ่และ PS ("ตัวคั่นย่อหน้า") แต่ "บรรทัดถัดไป" และ "ตัวคั่นบรรทัด" เหมาะสำหรับอะไร
ดูเหมือนทุกอย่างจะถูกคิดค้นโดยคณะกรรมการที่มีขนาดใหญ่มากซึ่งทุกคนต้องการพื้นที่ของตัวเองและผู้นำได้รับการแบ่งหนึ่งบรรทัด แต่อย่างจริงจังคุณจะจัดการกับมันอย่างไรเมื่อภาษาการเขียนโปรแกรมของคุณไม่สนับสนุน (หรือผิดเช่น Java)
Pattern.compile2010
วิธีการคืนค่า regexes ที่ทำงานตามคำจำกัดความของปีที่แล้ว พวกเขายังมีอิสระที่จะสร้างวิธีการPattern.compileLatestUTS
ที่จะระบุอย่างชัดเจนว่าความหมายจะเปลี่ยนไปตามข้อกำหนดใหม่