อักขระการเชื่อมต่อใช้เพื่อเชื่อมต่ออักขระสองตัว
ใน Java เป็นตัวละครที่เชื่อมต่อกันเป็นหนึ่งซึ่งCharacter.getType (int codepoint) / Character.getType (ถ่าน CH)ส่งกลับค่าเท่ากับCharacter.CONNECTOR_PUNCTUATION
โปรดทราบว่าใน Java ข้อมูลตัวอักษรที่อยู่บนพื้นฐานของมาตรฐาน Unicode ซึ่งระบุการเชื่อมต่อตัวละครโดยการกำหนดหมวดหมู่ทั่วไปชิ้นซึ่งเป็นนามแฝงสำหรับConnector_Punctuation
ตัวอย่างโค้ดต่อไปนี้
for (int i = Character.MIN_CODE_POINT; i <= Character.MAX_CODE_POINT; i++) {
if (Character.getType(i) == Character.CONNECTOR_PUNCTUATION
&& Character.isJavaIdentifierStart(i)) {
System.out.println("character: " + String.valueOf(Character.toChars(i))
+ ", codepoint: " + i + ", hexcode: " + Integer.toHexString(i));
}
}
พิมพ์อักขระการเชื่อมต่อที่สามารถใช้เพื่อเริ่มตัวระบุบน jdk1.6.0_45
character: _, codepoint: 95, hexcode: 5f
character: ‿, codepoint: 8255, hexcode: 203f
character: ⁀, codepoint: 8256, hexcode: 2040
character: ⁔, codepoint: 8276, hexcode: 2054
character: ・, codepoint: 12539, hexcode: 30fb
character: ︳, codepoint: 65075, hexcode: fe33
character: ︴, codepoint: 65076, hexcode: fe34
character: ﹍, codepoint: 65101, hexcode: fe4d
character: ﹎, codepoint: 65102, hexcode: fe4e
character: ﹏, codepoint: 65103, hexcode: fe4f
character: _, codepoint: 65343, hexcode: ff3f
character: ・, codepoint: 65381, hexcode: ff65
คอมไพล์ต่อไปนี้ใน jdk1.6.0_45
int _, ‿, ⁀, ⁔, ・, ︳, ︴, ﹍, ﹎, ﹏, _, ・ = 0;
เห็นได้ชัดว่าการประกาศข้างต้นล้มเหลวในการรวบรวมใน jdk1.7.0_80 & jdk1.8.0_51 สำหรับอักขระการเชื่อมต่อสองตัวต่อไปนี้ (ความเข้ากันได้แบบย้อนหลัง ... โอ๊ะโอ !!!
character: ・, codepoint: 12539, hexcode: 30fb
character: ・, codepoint: 65381, hexcode: ff65
อย่างไรก็ตามรายละเอียดนอกเหนือจากนั้นการสอบจะเน้นเฉพาะชุดอักขระภาษาละตินขั้นพื้นฐานเท่านั้น
นอกจากนี้สำหรับ identifers กฎหมายในชวาสเปคที่มีให้ที่นี่ ใช้ API คลาสตัวละครเพื่อรับรายละเอียดเพิ่มเติม