คำถามติดแท็ก unicode

Unicode เป็นมาตรฐานสำหรับการนำเสนอข้อความธรรมดาของคอมพิวเตอร์ มันครอบคลุมชุดอักขระสากลมีจุดมุ่งหมายเพื่อแสดงอักขระทั้งหมดที่ใช้ในระบบการเขียนของมนุษย์ในภาษาใด ๆ ฟอร์แมตการแปลง Unicode (UTFs) กำหนดรูปแบบที่ได้มาตรฐานสำหรับการจัดเก็บและการส่งข้อความ Unicode และมาตรฐานสำหรับการประมวลผลและการจัดการข้อความ


3
วิธีการแสดง Unicode ใน terminal เสมือน Linux?
การอ่านข้อมูลใด ๆ ใน Unicode ไม่แสดงอย่างถูกต้องใน terminal Linux (หมายถึง terminal เสมือนที่เปิดขึ้นโดยไม่มี X windows) ฉันอ่านในการสนทนาที่นี่ว่าการติดตั้งโปรแกรมเช่นJFBTERMและทำงานได้ดังนั้นฉันจึงสงสัยว่าถ้าไม่มีวิธีการกำหนดค่า (consolefonts?) เทอร์มินัลให้จัดการ unicode ได้อย่างถูกต้องโดยไม่ต้องใช้ซอฟต์แวร์เพิ่มเติมใด ๆ บนเทอร์มินัล Windows (gnome-terminal, xterm ฯลฯ ) ดูเหมือนว่า: บน terminal เสมือนดูเหมือนว่านี้: บนเทอร์มินัลเสมือนด้วย JFBTERM ดูเหมือนว่า: นี่คือภาพหน้าจอของผลลัพธ์locale: นี่คือผลลัพธ์ของshowconsolefont: ไม่มีใครรู้ว่ามันเป็นไปได้ที่จะประสบความสำเร็จเหมือนกันเพียงแค่กับ terminal เสมือนเริ่มต้น?

4
Windows 10 - รหัส Alt ทำให้อักขระผิด
ฉันใช้แล็ปท็อปที่ใช้ Windows 10 ฉันลองกดAlt+ 2713เพื่อให้เป็นอักขระ "✓" แต่ฉันกลับใช้ตัวอักษร "Ö" แทน มีความคิดเกี่ยวกับสาเหตุที่อาจเป็นเช่นไร?

1
ตัวละครประเภทนี้คืออะไร (𝒲)
ฉันเพิ่งมาข้ามนี้คำตอบSci-Fi Stack แลกเปลี่ยน ดูเหมือนว่าจะเขียนด้วยตัวอักษรที่ออกแบบมาให้ดูเหมือนกับลายมือที่ล้าสมัยและอ่านยาก ดังนั้นเพื่อให้ง่ายต่อการอ่านฉันคัดลอก / วางลงใน gedit (ตัวแก้ไขข้อความที่ไม่สนับสนุนการจัดรูปแบบ - เช่น Notepad) ฉันประหลาดใจที่การจัดรูปแบบแปลก ๆ ยังคงอยู่ เมื่อตรวจสอบเพิ่มเติม (กล่าวคือ Googling ตัวละครที่ดูแปลกที่สุดโดยสังเกตว่าปีนั้นดูเหมือนจะเขียนได้ตามปกติบางส่วน) ฉันมาถึงบทสรุปว่าพวกเขาเป็นชุดของตัวอักษรที่เหมือนตัวอักษรแปลก ๆ ใน Unicode คำถามของฉันมีสองส่วน: ฉันถูกต้องเกี่ยวกับตัวละครเหล่านี้คืออะไร? ถ้าเป็นเช่นนั้นเหตุใด Unicode จึงมีอักขระพิเศษที่ดูเหมือนว่าจะให้บริการโดยไม่มีวัตถุประสงค์นอกเหนือจากแบบอักษร

4
ตัวละคร '😋' คืออะไร?
อีเมลจากเพื่อนร่วมงานมีอักขระ😋อยู่ท้ายประโยคในบริบทที่อาจมีเครื่องหมายวรรคตอนหรือยิ้มได้ ตัวละครนี้คืออะไร? มันไม่มีผลลัพธ์ของ googleและunicodelookup.comก็ไม่ได้ทำให้ฉันฉลาดขึ้นเช่นกัน มันมีความหมายไหม? ถ้าไม่เป็นเช่นนั้นจะมีคนป้อนตัวอักษรที่พิมพ์ผิดได้อย่างไร
18 unicode 

5
ตัวอักษรยูนิโค้ดเริ่มแสดงเป็นกล่องในบางแอพพลิเคชั่น
คำถามนี้มีคำตอบอยู่ที่นี่แล้ว : Windows 7 ของฉันหยุดแสดงสัญลักษณ์ Unicode (2 คำตอบ) ปิดให้บริการใน5 ปีที่ผ่านมา ฉันสังเกตเห็นว่าตัวอักษร Unicode หยุดหยุดแสดงในบางแอปพลิเคชั่นจนถึงขณะนี้ Notepad ++ และ Skype เมื่อปรากฏก่อนหน้านี้ แต่จะปรากฏเป็นกล่องแทน พวกเขาทำงานมาก่อน แต่ฉันเชื่อว่ามันพังหลังจากรีสตาร์ท ฉันสามารถพิมพ์ลงในหน้าต่างการป้อนข้อมูลของ Skype และเห็นพวกเขา แต่หลังจากส่งข้อความที่ปรากฏเป็นกล่อง ตัวอย่างเช่น: 햇반และ県จะไม่ปรากฏใน Skype หรือ notepad ++ แต่ปรากฏว่าใช้ได้ใน Chrome เมื่อฉันพิมพ์ข้อความนี้ ไม่มีการติดตั้งซอฟต์แวร์ใหม่ก่อนหรือหลังการรีสตาร์ทครั้งล่าสุดสิ่งเดียวที่เกิดขึ้นคือการอัพเดทของ Windows เอกสารใน Notepad ++ มีการตั้งค่าการเข้ารหัสเป็น UTF-8 Windows 7 x64

7
กำลังพิมพ์ตัวอักษรแปลก ๆ ¿โดยไม่มีตัวเลข?
ฉันจะพิมพ์♣ (alt + 5) และ♥ (alt + 259) และตัวละครอื่น ๆ ได้อย่างไรบนแป้นพิมพ์ที่มีแป้นตัวเลข w / oa การใช้ตัวเลข 1-9-0 ไม่เปิดใช้งานอักขระเหล่านั้น หมายเหตุฉันต้องการ TYPE และไม่ใช้โปรแกรม windows นั้นเพื่อเลือก / คัดลอก / วาง

2
วิธีการเปลี่ยนภาษาสำหรับโปรแกรมที่ไม่ใช่ Unicode ใน Windows 8
มีการตั้งค่า "ภาษาสำหรับโปรแกรมที่ไม่ใช่ Unicode" ในการตั้งค่า "ภูมิภาคและภาษา" ใน XP, Vista และ 7 ฉันติดตั้ง Windows 8 (มีปัญหาที่ไม่เกี่ยวข้องดังนั้นฉันจึงต้องเปลี่ยนกลับเป็น Windows 7) และฉันพยายามติดตั้งซอฟต์แวร์ที่ไม่ได้ใช้ Unicode แต่ Shift-JIS (ภาษาญี่ปุ่น) เห็นได้ชัดว่าตัวติดตั้งแสดงสัญลักษณ์ที่ไม่ถูกต้องและตัวติดตั้งใช้ไม่ได้ ดังนั้นฉันจึงลองเปลี่ยนการตั้งค่า "ภาษาสำหรับโปรแกรมที่ไม่ใช่ Unicode" แต่ฉันสังเกตว่าแอปเพล็ตภาษาทั้งหมดถูกสร้างใหม่ตั้งแต่ต้น เมื่อฉันเปลี่ยนกลับเป็น Windows 7 ฉันไม่สามารถแก้ไขได้จนกว่าฉันจะแก้ปัญหาอื่น ๆ และสามารถติดตั้ง 8 ได้อีกครั้ง แต่ในระหว่างนี้ไม่มีใครรู้ว่าฉันจะเปลี่ยนการตั้งค่านี้ได้ที่ไหน

4
แบบอักษร Unicode บางตัวไม่ทำงานใน Windows 7 / Firefox
ฉันต้องการที่จะแสดงอักษรอียิปต์โบราณอียิปต์โบราณ: 𓀀𓀁𓀂𓀃𓀄𓀆𓀇𓀉𓀊𓀊𓀋𓀌𓀏𓀏𓀣𓀣𓀣𓀣𓀣𓀣𓀣𓀣𓀣𓀣𓀣𓀣 เหล่านี้เป็นส่วนหนึ่งของ Unicode 5.2 TL; DR: การติดตั้งแบบอักษร Noto ใน Windows 7 หรือ Windows 8 VM ทำงานได้ตามที่คุณคาดหวังและฉันมีอักษรอียิปต์โบราณใน Firefox การติดตั้งแบบอักษร Noto บนเครื่องของฉันไม่ทำงาน ไม่มีโปรแกรมใดแสดงให้ฉันเห็นถึงการเรียงลำดับอักษรใด ๆ ยกเว้นว่าฉันเรียกแบบอักษรเป็นพิเศษ ฉันได้ลองใช้วิธีการแก้ปัญหาต่าง ๆ เช่นชื่อไฟล์บนเดสก์ท็อปเพื่อทริกเกอร์ IE โดยใช้อักขระเหล่านั้นโดยไม่มีโชค รายละเอียด: ฉันลองติดตั้งฟอนต์ Aegyptusรวมถึงฟอนต์Google Noto ผลที่ได้คือแบบอักษรใหม่ปรากฏบนระบบของฉัน (ฉันสามารถใช้พวกเขาเพื่อจัดรูปแบบข้อความใน MS Word เป็นต้น) และถ้าฉันอ้างถึงพวกเขาอย่างชัดเจนในหน้าเว็บ (เช่นโดยการตั้งค่าตระกูลฟอนต์เป็น 'aegyptus') มันปรากฏอย่างถูกต้อง: ปัญหาคือฉันไม่สามารถควบคุมแบบอักษรที่หน้าเว็บใช้และเป็นที่เข้าใจว่า Windows หรือเบราว์เซอร์ของฉันควรตรวจพบโดยอัตโนมัติว่าสัญลักษณ์ไม่ได้อยู่ในแบบอักษรและค้นหาการจับคู่ที่เหมาะสม ฉันได้ทดสอบสิ่งนี้บน vm ที่สะอาด (VM เสมือนของ …

2
อักขระ Unicode เทียบเท่ากับขีดล่างด้านบน
มีอักขระเทียบเท่ากับขีดล่าง "_" ซึ่งครองตำแหน่งด้านบนหรือไม่ เส้นประ "-" จะไม่ทำ ถ้าเป็นฉันฉันจะเรียกมันว่าคะแนนสูง แต่ฉันไม่เห็นสิ่งนี้ทุกที่
16 unicode 

1
การบันทึกไฟล์ในรูปแบบ CSV ใน Excel จะลบ BOM เสมอ
ฉันพยายามหาคำตอบ / คำอธิบายที่สมเหตุสมผล (ไม่สำเร็จ) เพื่อค้นหาว่าเหตุใด Excel จึงใช้ค่าเริ่มต้นในการลบ BOM เมื่อบันทึกไฟล์เป็นประเภท CSV โปรดยกโทษให้ฉันหากคุณพบว่าซ้ำกับคำถามนี้ สิ่งนี้จะจัดการกับการอ่านไฟล์ CSV ด้วยการเข้ารหัสที่ไม่ใช่ ASCII แต่มันไม่ครอบคลุมการบันทึกไฟล์กลับออกมา นี่คือสถานการณ์ปัจจุบันของฉัน (ซึ่งฉันกำลังจะรวบรวมเป็นเรื่องธรรมดาในบรรดาซอฟต์แวร์ที่แปลเป็นภาษาท้องถิ่นที่มีอักขระ Unicode และรูปแบบ CSV): เราส่งออกข้อมูลไปยังรูปแบบ CSV โดยใช้ UTF-16LE เพื่อให้มั่นใจว่ามีการตั้งค่า BOM (0xFFFE) เราตรวจสอบความถูกต้องหลังจากสร้างไฟล์ด้วยตัวแก้ไข Hex เพื่อให้แน่ใจว่าได้ตั้งค่าไว้อย่างถูกต้อง เปิดไฟล์ใน Excel (สำหรับตัวอย่างนี้เรากำลังส่งออกตัวอักษรญี่ปุ่น) และเป็นพยานว่า Excel จัดการโหลดไฟล์ด้วยการเข้ารหัสที่ถูกต้อง ความพยายามในการบันทึกไฟล์นี้จะแสดงข้อความเตือนให้คุณทราบว่าไฟล์นั้นอาจมีฟีเจอร์ที่ไม่สามารถใช้งานร่วมกับการเข้ารหัส Unicode แต่ถามว่าคุณต้องการบันทึกหรือไม่ หากคุณเลือกกล่องโต้ตอบบันทึกเป็นมันจะขอให้คุณบันทึกไฟล์เป็น "ข้อความ Unicode" ทันทีแทนที่จะเป็น CSV หากคุณเลือกส่วนขยาย "CSV" และบันทึกไฟล์ไฟล์นั้นจะลบ BOM (อย่างชัดเจนพร้อมกับตัวอักษรญี่ปุ่นทั้งหมด) …

3
การแสดง Unicode บน Chrome vs Firefox
การแสดงผล Unicode: Firefox กับ Chrome ระบบปฏิบัติการ: Windows XP SP3 คำถามของฉันเกี่ยวกับการแสดงผลโพสต์นี้บน Firefox กับ Chrome ฉันเห็นกล่องจำนวนมากบน Chrome ไม่มากบน Firefox Firefox: โครเมียม: ฉันจะทำอย่างไร ปรับปรุง: อัปเดต 2 เปลี่ยนแบบอักษร Sans Serif บน Chrome เป็น Arial Unicode และรีสตาร์ท อัปเดต 3 นี่คือแรงบันดาลใจจากการอ้างอิงของ @ Arjan รอยยิ้มบน Firefox (รอยยิ้มอ้างอิงคือคนที่อยู่ด้านล่าง) รอยยิ้มบน Chrome (รอยยิ้มอ้างอิงคือคนที่อยู่ด้านล่าง) ปรับปรุง: แหล่งที่มาของโพสต์ดังกล่าวข้างต้นจะแสดงดังต่อไปนี้ Firefox โครเมียม

3
ฉันจะลบ U + 200B (เว้นวรรคความกว้างเป็นศูนย์) ได้อย่างไรโดยใช้ sed
ฉันมีไฟล์ขนาดใหญ่มากที่มีช่องว่างที่มีความกว้างเป็นศูนย์กระจายอยู่ทั่ว มันต้องใช้เวลานานเกินไปในการเปิดและแก้ไขการใช้ดังนั้นฉันต้องการที่จะลบทุกกรณีของตัวละครโดยใช้vi sedปัญหาคือฉันไม่สามารถหาวิธีจับคู่ตัวละครได้! ฉันลองใช้\u200Bแล้ว\x{200b}. ความคิดใด ๆ ฉันใช้ CentOS 5 ถ้านั่นช่วยได้ทั้งหมด
15 regex  unicode  sed 

3
Windows 7 UTF-8 และ Unicode
มีคนช่วยอธิบายสิ่งที่เปลี่ยนแปลงใน Windows 7 (Pro 64 บิต) ได้ไหม รายละเอียด: ก่อนหน้านี้ฉันมี Windows XP และมีไฟล์การแปลบางส่วน (เข้ารหัส UTF-8) ในรูปแบบ CSV ฉันสามารถดูฟอนต์ทั้งใน Notepad และ Excel หลังจากอัปเกรดเป็น Windows 7 เมื่อฉันเปิดไฟล์เหล่านี้ - สิ่งที่ฉันเห็นคือกล่องสี่เหลี่ยม (แค่คุณรู้ว่าถ้าฉันเปิดมันในเบราว์เซอร์ - ฉันสามารถเห็นการแปลทั้งหมด) ถ้าฉันบันทึกไฟล์เหล่านั้นใน Unicode ทุกอย่างดูเหมือนจะไม่เป็นไร แล้วเกิดอะไรขึ้นกันแน่? เหตุใด Windows 7 ทำงานกับ Unicode และไม่ใช้ UTF-8

7
Unicode grep สำหรับ Windows [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับผู้ใช้ขั้นสูง ปิดให้บริการใน4 ปีที่แล้ว มีgrep ที่รับรู้ Unicode สำหรับ Windows 32 บิตหรือไม่
13 windows  grep  unicode 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.