TL; DRกลุ่ม Unicode ขอแนะนำให้ใช้ตัวอักษรละตินหากเป็นไปได้และไม่ใช่ตัวเลขซึ่งรวมไว้เพื่อความเข้ากันได้กับการพิมพ์ตัวอักษรเอเชียตะวันออก
เรื่องเต็ม: (มีเหตุผลของการยืนยันข้างต้น)
นอกเสียจากว่าคุณกำลังพิมพ์ตัวอักษรเอเชียตะวันออกการใช้ตัวอักษรตัวเลขโรมัน (ไม่ใช่โบราณ) จากยูนิโค้ด (U + 2160 - U + 217F) เป็นแฮ็ค
อักขระเหล่านี้ได้รับการรวมเข้ากันได้กับมาตรฐาน pre-Unicode เอเชียตะวันออก อักขระเหล่านี้ยังคงอยู่ในแนวตั้งโดยที่ข้อความภาษาเอเชียตะวันออกเป็นตัวเรียงพิมพ์จากบนลงล่างในขณะที่โดยปกติข้อความในตัวอักษรละติน (เช่นชื่อ) จะถูกเขียนไปด้านข้างในบริบทนี้
หากต้องการอ้างอิงเวอร์ชันสุดท้ายของมาตรฐาน Unicode (v 7.0, chap. 22, p. 20) :
ตัวเลขโรมัน เพื่อจุดประสงค์ส่วนใหญ่ควรเขียนตัวเลขโรมันจากลำดับของตัวอักษรละตินที่เหมาะสม อย่างไรก็ตามตัวแปรตัวพิมพ์ใหญ่และตัวพิมพ์เล็กของตัวเลขโรมันถึง 12, บวก L, C, D และ M ได้รับการเข้ารหัสในบล็อก Number Forms (U + 2150 .. U + 218F) เพื่อให้เข้ากันได้กับมาตรฐานเอเชียตะวันออก ต่างจากลำดับตัวอักษรละตินสัญลักษณ์เหล่านี้จะอยู่ในแนวตั้ง นอกจากนี้ในบางพื้นที่รูปแบบวันที่กะทัดรัดใช้ตัวเลขโรมันสำหรับเดือน แต่อาจคาดหวังให้ใช้อักขระเดียว
ในทางทฤษฎีแล้วความแตกต่างระหว่างตัวเลขโรมันและตัวอักษรเป็นเรื่องของข้อความที่มีตัวอักษรเช่นตัวเอียงการเปลี่ยนแบบอักษรหรือตัวเลือกเสริม ดังที่ได้กล่าวไว้ว่า @ @ Wrzlprmft แสดงให้เห็นว่าตัวอักษรบางตัวใช้เพื่อหลีกเลี่ยงการเปลี่ยนแบบอักษรสำหรับตัวเลขโรมันแต่ละตัวในขณะที่พิมพ์ตัวอักษรได้ดี
การมีอยู่ของตัวละครสำหรับ XII และไม่ใช่สำหรับ XIII หมายความว่ามีการเข้ารหัสที่แตกต่างกันหลายประการซึ่งทำให้เกิดปัญหาในการค้นหาข้อความ: หากคุณเขียนเกี่ยวกับ Louis XII และ Louis XIII คุณอาจจะเขียน XIII เป็น X + I + ฉัน + ฉัน แต่คุณจะเขียน XII เป็นอักขระตัวเดียวหรือไม่ หรือว่า X + I + I ที่จะมีจอแสดงผลที่สอดคล้องกับ XIII? ไม่มีคำตอบที่ดีสำหรับคำถามนี้ในขณะที่ใช้ตัวอักษรตัวเลขโรมันและนั่นคือเหตุผลที่กลุ่ม Unicode แนะนำให้ใช้ตัวอักษรละตินเมื่อเป็นไปได้และไม่ใช่ตัวเลข
แก้ไข: เพิ่มTL; DR การยืนยันในจุดเริ่มต้น