ฉันเห็นคำถามนี้เกี่ยวกับข้อเสนอของเว็บไซต์วิชาการพิมพ์และทำให้ฉันไม่ทราบคำตอบ ฉันมักจะถือว่า 'สัญลักษณ์' และ 'ตัวละคร' เป็นแบบเปลี่ยนได้
หลังจากอ่านคำอธิบายในหน้ารูปแบบการเข้ารหัสอักขระ Unicodeความเข้าใจของฉันเป็นดังนี้:
- ตัวละครจะถูกกำหนดโดยพวกเขามีความหมายในภาษาร่ายมนตร์โดยพวกเขาปรากฏตัว ดังนั้นการรวมเอาสุนทรียภาพเข้าด้วยกัน
fi
ก็คือ glyph หนึ่งอัน แต่มีอักขระสองตัว
ดังนั้นความเชื่อของฉันคือ (โปรดแก้ไขให้ฉันถ้าฉันผิด) ว่าความแตกต่างในทางปฏิบัติจะเป็น:
- ตัวแยกวิเคราะห์ข้อความที่ไม่สนใจสุนทรียภาพของข้อความจะอ่านร่ายมนตร์เป็นตัวอักษรตามลำดับ ดังนั้น:
- หากคุณต้องคัดลอกและวางข้อความที่มี glyphs เป็นโปรแกรมแก้ไขข้อความธรรมดา glyphs จะถูกแปลงเป็นอักขระที่เกี่ยวข้อง (
fi
glyph glyph จะกลายเป็นf
และi
) - ระบบอัตโนมัติใด ๆ ที่ทำมาอย่างดีโดยใช้การแยกวิเคราะห์ข้อความ (เช่นซอฟต์แวร์รวบรวมข้อมูลของเครื่องมือค้นหาโปรแกรมอ่านหน้าจอตัวตรวจการสะกดคำ) จะตีความร่ายมนตร์เป็นอักขระตามลำดับ
- อักขระหนึ่งตัวสามารถมีชุดสัญลักษณ์หรือชุดสัญลักษณ์ได้หลายชุด ฉันอยากจะบอกว่าสัญลักษณ์หนึ่งอันสามารถมีตัวละครได้เพียงตัวเดียว แต่สิ่งนี้ไม่ถูกต้องเนื่องจากมีตัวอย่างในบทความที่เชื่อมโยงของชุดสัญลักษณ์ 3 ตัวและชุดสัญลักษณ์ที่ดูเหมือนว่าแต่ละตัวจะสอดคล้องกับตัวละครและชุดอักขระ ฉันไม่เห็นว่ามันจะทำงานได้อย่างไร: แน่นอนนั่นหมายความว่าจะมีความไม่แน่นอนหรือความกำกวมในการตีความร่ายมนตร์เหล่านั้นแตกต่างกันโดยนักแปล (หรือแตกต่างกันไปตามภาษาหรือตามตัวอักษร?)
- ในขณะที่เบราว์เซอร์ glyph (เช่นหนึ่งใน Illustrator) มีชุดสัญลักษณ์แบบเต็มของตัวอักษรแมปอักขระ (เช่นแมปอักขระของ Windows) มีเฉพาะอักขระไม่ใช่ glyphs ที่มีหลายอักขระเช่น ligatures (สิ่งที่ฉันไม่เคยสังเกตเห็นมาก่อน)
- หากคุณต้องคัดลอกและวางข้อความที่มี glyphs เป็นโปรแกรมแก้ไขข้อความธรรมดา glyphs จะถูกแปลงเป็นอักขระที่เกี่ยวข้อง (
ฉันรู้สึกเหมือนฉันเกือบมี แต่ฉันบางสิ่งบางอย่างที่ใดที่หนึ่งเข้าใจผิดอย่างชัดเจนตามแนว: ไม่ได้เป็นเพียง "หนึ่งในสัญลักษณ์ตัวอักษรหลายสิ่ง" แต่ยังคัดลอกและวางพฤติกรรมด้วยหนังสติ๊กไม่ได้ค่อนข้างสิ่งที่ผมคาดว่า:
- คัดลอกมัด
fi
จาก Illustrator ไปยังกล่องอินพุตนี้: วางเป็นfi
(สองอักขระ) ตามที่คาดไว้ - วางในโค้ด HTML สำหรับมัน (
fi
) - แสดงเป็นเอ็นร้อยหวายเมื่อไม่อยู่ในบล็อคโค้ด (fi - ซึ่งในฟอนต์นี้ดูไม่เหมือนมัด แต่คุณจะเห็นว่าเป็นหนึ่งถ้าคุณพยายามเลือกเพียงครึ่งเดียว ของมัน) และรหัสเมื่ออยู่ในบล็อครหัส (fi
) ตามที่คาดไว้ - คัดลอกและวางเอ็นที่ไม่ใช่โค้ด - บล็อกที่เรนเดอร์กลับเข้าไปในกล่องอินพุต: วางเป็นอักขระการมัดและแสดงผลเป็นเอ็นโดยไม่คำนึงว่าอยู่ในบล็อกโค้ดหรือไม่ (fi และ
fi
) คำในทำนองเดียวกันที่มี: mis t mis fi ts (fit misfits
) วางเป็นfi t mis fi ts (fit misfits
) อาจขึ้นอยู่กับว่าสถานที่นั้นถูกวางเข้าใจการเข้ารหัสที่ใช้หรือไม่
ฉันเข้าใจเรื่องนี้มากแค่ไหน คนที่สามารถทำให้ฉันขวา: ระบุชัดเจนนิยามของความแตกต่างระหว่างร่ายมนตร์และตัวอักษร (ถ้าฉันเป็นผิดหรือสามารถปรับปรุง) และให้ชัดเจน / ตัวอย่างถูกต้องมากขึ้นกว่าฉันในสิ่งที่หมายถึงในทางปฏิบัติ ?