ทั่วไป
อักขระเหล่านั้นไม่ได้มีไว้สำหรับข้อความอักษรละตินปกติ แต่สำหรับการออกเสียงข้อความอักษรซิริลลิกเพื่อใช้เป็นสัญลักษณ์ทางคณิตศาสตร์ (แทนตัวแปร) หรือคล้ายกัน วิธีเดียวที่เข้ากันได้กับ Unicode ในการเข้ารหัสข้อความในอักษรละตินพื้นฐานคือการใช้อักขระส่วนใหญ่ที่ใช้สำหรับจุดประสงค์นี้ (เช่นจากบล็อกละตินพื้นฐาน Unicode)
เช่นเดียวกับมาตรฐานอื่น ๆ คุณควรคิดสองครั้งเกี่ยวกับการละเมิด Unicode ยิ่งไปกว่านั้น Unicode ยังประกอบด้วยระบบการเขียนจำนวนมากการใช้เคสและสิ่งต่าง ๆ ที่มีอยู่เพื่อให้เข้ากันได้กับมาตรฐานอื่น ๆ1ที่เข้าใจถึงแรงจูงใจของมันทั้งหมดเป็นศาสตร์ของมันเอง เรื่องสั้นสั้น ๆ เว้นแต่คุณจะรู้จริงๆว่าคุณกำลังทำอะไรอยู่มันเป็นไปได้อย่างยิ่งที่มีบางอย่างผิดปกติที่คุณไม่ได้คิดถึงจากระยะไกล
ตัวอย่างที่เฉพาะเจาะจง
การเข้าถึง
ข้อความที่เข้ารหัสไม่เพียงมีอยู่ในการแสดงผลในแบบอักษรบางแบบ นอกจากนี้ยังสามารถตีความได้เช่นโดยโปรแกรมอ่านหน้าจอ และตัวอ่านหน้าจอไม่จำเป็นต้องเดาว่า
𝓽𝓱𝓮
มีขึ้นเพื่อเป็นบทความที่ชัดเจนหรือผลิตภัณฑ์ทางคณิตศาสตร์2ของตัวแปร𝓽, 𝓱และ𝓮 - ซึ่งเป็นสิ่งที่ตัวละครเหล่านั้นถูกสร้างขึ้นมาเพื่อ พฤติกรรมที่ดีที่สุดคือการทำให้คาถาอักขระเหล่านี้เช่นพูดตามตัวอักษร:
สคริปต์ตัวหนาขนาดเล็ก t, ตัวหนาสคริปต์ขนาดเล็ก h, ตัวหนาสคริปต์ขนาดเล็ก e
ไม่ควรเพียงแค่พูดว่า“ the” แทนเพราะเมื่อนั้นมันจะไม่ถูกต้องอ่านตำราคณิตศาสตร์ที่มีสัญลักษณ์เกิดขึ้นเพื่อสร้างคำที่ออกเสียงได้ 3
ความเบา
หากข้อความของคุณแสดงผลบนเครื่องของคุณอย่างดีนี่ไม่ได้หมายความว่าข้อความนั้นจะอยู่ในเครื่องอ่าน ตัวอย่างที่ชัดเจนที่สุดคือผู้อ่านไม่มีตัวอักษรใด ๆ ที่รองรับตัวอักษรเหล่านี้หรือข้อความแสดงผลโดยซอฟต์แวร์ที่ไม่สนับสนุนแบบอักษรสำรอง เป็นที่ยอมรับกันว่าสิ่งนี้กำลังกลายเป็นเรื่องธรรมดาที่พบได้น้อยลงเรื่อย ๆ โปรดทราบว่าบางคนเช่น dyslexics ต้องการแบบอักษรพิเศษที่มีโอกาสน้อยที่จะสนับสนุนตัวละครเหล่านี้
แต่แม้ว่าเครื่องของผู้อ่านจะใช้แบบอักษรที่แตกต่างกันเท่านั้น แต่อาจทำให้ข้อความอ่านง่ายขึ้น สำหรับตัวอย่างแรกสิ่งนี้แสดงด้วยฟอนต์ที่แตกต่างกันสองแบบ:
Serif ฟรีแสดงข้อความตามที่คุณอาจต้องการให้เรนเดอร์เมื่อใช้อักขระพิเศษเพื่อจำลองข้อความกล่าวคือการจำลองลายมือด้วยการลากเส้นอย่างต่อเนื่อง อย่างไรก็ตามตัวละครเหล่านี้ถูกสร้างขึ้นเพื่อใช้เป็นสัญลักษณ์ทางคณิตศาสตร์การเชื่อมต่อซึ่งไม่สมเหตุสมผล ดังนั้นการเรนเดอร์โดยSTIXซึ่งได้รับการออกแบบมาโดยเฉพาะสำหรับจุดประสงค์ทางคณิตศาสตร์นั้นสอดคล้องกับลักษณะของตัวละครที่ต้องการใช้
ในตัวอย่างที่สองสมมติว่าคุณหรือผู้อ่านเป็นตัวเอียงว่า“ ว่าง” ด้วยเหตุผลบางอย่าง ด้วยตัวอักษรที่ดีคุณจะได้รับ4 :
เหตุผลของเรื่องนี้ก็คือว่าแคปเล็ก ๆ (บางส่วน) จำลองด้วยตัวอักษรซีริลลิและตัวเอนริลลิกบางครั้งมีลักษณะแตกต่างจากคู่ของพวกเขาตรง ดังนั้นอีกครั้งนี่เป็นพฤติกรรมที่เหมาะสม
searchability
เป็นตัวอย่างแรกพิจารณาสิ่งที่คุณต้องการให้การค้นหาที่สมเหตุสมผลทำกับอักขระ𝒲 (สคริปต์ทางคณิตศาสตร์W ) สมมติว่าการค้นหามีสองโหมดคือโหมดเริ่มต้นและโหมดที่แน่นอน (ปกติเรียกว่าตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ ) ตัวละครนี้ควรจะ:
พบเมื่อค้นหาwหรือWในโหมดเริ่มต้น - สำหรับผู้ที่ไม่ต้องการรบกวนการป้อนหรือคัดลอกวางอักขระพิเศษลงในช่องค้นหา
พบเมื่อค้นหา𝒲ในโหมดที่แน่นอน - สำหรับผู้ที่ต้องการค้นหาตำแหน่งที่กล่าวถึงตัวแปรที่เกี่ยวข้องในเอกสารทางคณิตศาสตร์³;
ไม่พบเมื่อทำการค้นหา𝓌, wหรือWในโหมดที่แน่นอนเนื่องจากการแยกการค้นหาคล้ายกับด้านบน
อย่างไรก็ตามหากคุณใช้อักขระนี้เพื่อจำลองข้อความปกติควรจะพบเมื่อค้นหาWหรือ𝒲ในโหมดที่แน่นอนซึ่งขัดแย้งกับข้างต้น
ในฐานะที่เป็นตัวอย่างที่สองพิจารณาว่าตัวอักษรซีริลลิไม่ควรที่จะพบเมื่อค้นหาตัวอักษรละตินและในทางกลับกันขณะที่พวกเขาสิ่งที่แตกต่างอย่างสิ้นเชิง อย่างไรก็ตามหากใช้อักขระซิริลลิกเพื่อจำลองตัวพิมพ์เล็กละตินคุณต้องให้สิ่งนี้เกิดขึ้นถ้าคุณไม่ต้องการให้ความสามารถในการค้นหาเสียหาย สิ่งนี้จะนำไปสู่การที่ผู้คนพบสิ่งไร้ประโยชน์มากมายหากพวกเขาค้นหาคำอักษรละตินที่หายากที่เกิดขึ้นเพื่อให้สอดคล้องกับตัวพิมพ์เล็กแบบ faux ของคำอักษรซีริลลิกยอดนิยมบางคำ (และในทางกลับกัน)
ตัวเลือกการค้นหาที่แน่นอนไม่สามารถแก้ปัญหานี้ได้เนื่องจากเป็นการสำรองไว้เพื่อวัตถุประสงค์อื่นในตัวอักษรเหล่านั้น
โดยทั่วไปแล้วมันเป็นไปไม่ได้ที่จะสร้างการค้นหา (โดยไม่มีตัวเลือกจำนวนบ้า) ที่ไม่ขาดโดยใช้ตัวอักษรพิเศษเพื่อจำลองข้อความละตินสไตล์
1 คุณรู้ไหมว่า XKCD เกี่ยวกับความล้มเหลวอย่างหลีกเลี่ยงไม่ได้ของมาตรฐานการรวม ? ยูนิโคดประสบความสำเร็จ
2 หรืออะไรก็ตามที่โอเปอเรเตอร์ว่างอยู่ในการประชุมที่เกี่ยวข้อง
3 ฉันทราบว่าปัจจุบันมีข้อความทางคณิตศาสตร์น้อยมากที่สนับสนุนการเข้ารหัสนี้หรือบางสิ่งที่เข้ากันได้กับประเด็นนี้ แต่ประเด็นก็คือว่าบางวัน ข้อความที่ดูถูกเหยียดหยาม Unicode ของคุณอาจยังอ่านอยู่
4 หากคุณไม่ได้แปลภาษามาซิโดเนียหรือเซอร์เบียเป็นภาษาท้องถิ่นซึ่งคุณจะได้รับผลลัพธ์ที่แตกต่างกัน แต่ก็ยังไม่เป็นที่ต้องการ