คำถามติดแท็ก unicode

Unicode เป็นมาตรฐานสำหรับการนำเสนอข้อความธรรมดาของคอมพิวเตอร์ มันครอบคลุมชุดอักขระสากลมีจุดมุ่งหมายเพื่อแสดงอักขระทั้งหมดที่ใช้ในระบบการเขียนของมนุษย์ในภาษาใด ๆ ฟอร์แมตการแปลง Unicode (UTFs) กำหนดรูปแบบที่ได้มาตรฐานสำหรับการจัดเก็บและการส่งข้อความ Unicode และมาตรฐานสำหรับการประมวลผลและการจัดการข้อความ

3
เป็นกลุ่ม: วิธีการจัดการไฟล์ Unicode ด้วยข้อความในหลายภาษา (มากกว่าสองภาษา)?
ฉันต้องตั้งค่าอะไรใน Vim / gVimเพื่อให้สามารถดูไฟล์ข้อความ Unicode ที่มีข้อความในหลายภาษา คุณอาจกำหนดสมมติฐานเหล่านี้: จำนวนภาษามีมากกว่าสองภาษา บางภาษาเป็นภาษาจีนญี่ปุ่นและเกาหลี ก็พอถ้าฉันสามารถดูไฟล์เหล่านี้ใน gVim (ไม่จำเป็นต้องเป็นกลุ่ม) gVim 7.0 ทำงานบน Windows นี่คือตัวอย่างข้อความซึ่งเมื่อบันทึกใน Unicode จะเปิดได้ดีใน Notepad แต่แสดงเป็นพูดพล่อยๆใน gVim: This is English. 这是中文。 これは日本です。 한국입니다. ಇದು ಕನ್ನಡ.
9 vim  unicode 

2
อักขระยูนิโค้ดหลายตัวไม่แสดงในไซต์ใหญ่ ๆ (เช่นนี้: ⁠)
มีตัวอักษร Unicode หลายตัวที่ฉันเห็นเป็นกล่อง สิ่งนี้เกิดขึ้นใน Chrome เท่านั้น การเข้ารหัสอักขระถูกตั้งค่าเป็น UTF-8 แต่การตรวจสอบอัตโนมัติไม่ช่วยอะไร ตัวอย่าง: [⁠] คุณจะเห็นเครื่องหมายวงเล็บสองช่องเท่านั้น แต่จริงๆแล้วมี Unicode Character World Joinerอยู่ระหว่างนั้น มันเป็นพื้นที่ที่ไม่ทำลายความกว้างเป็นศูนย์ ฉันยังใส่ตัวอย่างjsfiddleอีกด้วย ฉันไม่เห็นตัวละครWorld Joinerแต่ฉันสามารถเห็นHair Spaceได้ (และเมื่อเห็นมันจริง ๆ แล้วฉันหมายถึงฉันไม่เห็นคุณเห็นไหม) สิ่งนี้จะเกิดขึ้นเมื่อผู้ใช้โพสต์อิโมติคอนสไตล์ใหม่เป็นต้น ฉันจะแก้ไขสิ่งนี้ได้อย่างไร ปรับปรุง: สิ่งนี้เกิดขึ้นได้ทุกที่ (Twitter, Facebook คุณตั้งชื่อ) ฉันไม่ได้ใช้แบบอักษรพิเศษหรือเปลี่ยนแปลงบางสิ่งที่เกี่ยวข้องกับแบบอักษรในระบบของฉัน (Windows 7, 64 บิต) ฉันผิดที่คิดว่าสิ่งนี้ควรใช้งานได้หรือไม่ อัปเดต 2: มันทำให้ฉันเสียสติ ยังมีอักขระจำนวนมากที่ไม่แสดง ตัวอย่าง (ห่อของขวัญ): 🎁 อย่างที่คุณเห็น Chrome ไม่แสดงอักขระตามค่าเริ่มต้น เมื่อฉันตั้งค่าฟอนต์เป็นสัญลักษณ์ Segoe …

2
วิธีหยุดสัญลักษณ์ร่ายมนตร์ unicode ที่แสดงเป็น“ emoji” ใน MS Word 2016
ใน Word 2010 การพิมพ์ (เช่น) Alt+ 1หรือAlt+ 4(โดยใช้ Numpad) จะสร้างสัญลักษณ์ Unicode สำหรับรูปหน้ายิ้มหรือสัญลักษณ์รูปเพชรในแบบอักษรที่เลือก - เช่น☺♦ ใน Word 2016 ตอนนี้สิ่งเหล่านี้จะถูกแทนที่ด้วยไอคอนเหมือนอิโมจิที่มีสีสัน: cnread ได้เสนอคำแนะนำที่เป็นประโยชน์ในการสร้างสัญลักษณ์โดยการพิมพ์จุด Unicode ของพวกเขา (263A สำหรับ 'White Smiling Face' และ 2666 สำหรับ 'Black Diamond Suit') และแปลงโดยใช้Alt+ Xซึ่งเป็นวิธีแก้ปัญหาที่สะดวกแม้ว่ามันจะขาดความเรียบง่าย ของวิธีการก่อนหน้า มีตัวเลือกในการบังคับให้ Word แสดงไอคอน Unicode แทนภาพตัดปะ garish หรือไม่ ไม่มีอะไรที่ชัดเจนกระโดดออกจากหน้าการตั้งค่าหรือจากตัวเลือกการแก้ไขอัตโนมัติ

2
แทรกอักขระที่มีการเน้นเสียงหลายแบบบนเค้าโครงแป้นพิมพ์ Mac แบบขยาย
ฉันไม่สามารถหาวิธีนำทั้ง Umlaut (¨) และ Grave (`) ไปใช้กับตัวอักษร 'u' ได้ ฉันจะพิมพ์หนึ่งแล้วอีกตัวอักษรจากนั้น แต่จะใช้เฉพาะสำเนียงหลังเท่านั้นโดยที่อดีตเพิ่งจะแห้ง ความคิดใด ๆ

1
ความเสียหายที่ชุดอักขระนี้คืออะไร (ISO-2022?)
ฉันมีไฟล์ข้อความจากแหล่งดั้งเดิมที่มีอักขระที่เสียหาย ตอนแรกฉันคิดว่าการทุจริตเป็นแค่ gobbledygook แต่มันปรากฏขึ้นเมื่อตรวจสอบอย่างใกล้ชิดว่าข้อความที่เสียหายบางส่วนอาจถูกสร้างขึ้นใหม่ เพื่อที่จะมุ่งเน้นความพยายามของฉันมันจะเป็นประโยชน์ในการเข้าใจสิ่งที่ดูเหมือนต้นฉบับแม้ว่าฉันจะไม่สามารถสร้างใหม่ได้อย่างเต็มที่ น่าเสียดายที่เอกสารมาจากคอลเล็กชันที่ฉันไม่สามารถแชร์ได้อย่างอิสระ แต่นี่เป็นตัวอย่าง ข้อความถูกแปลงเป็น UTF-8 แต่การแปลงล้มเหลวที่ใดที่หนึ่งดังนั้นจึงอ่านไม่ออกส่วนใหญ่ ส่วนของข้อความในเช็กสามารถมองเห็นได้ซึ่งอักขระเช็กที่เน้นเสียงถูกแทนที่ด้วยอักขระซิริลลิก (ซึ่งอาจเป็นสิ่งที่แตกต่างไปจากเดิมอย่างสิ้นเชิงก่อนการแปลง) 0001f80: 33d1 936e 6576 79d1 87d0 bd7a 656e d18c 3..nevy....zen.. 0001f90: 6368 7e58 3833 d193 7e58 3945 d19b d0b1 ch~X83..~X9E.... 0001fa0: 646f 7374 d0bd 7e58 3833 d193 6e61 7e58 dost..~X83..na~X 0001fb0: 3833 d193 7ad1 87d0 bd7a 656e 20d0 …

1
“ ภาษาสำหรับโปรแกรมที่ไม่ใช่ Unicode” และ Cyrillic Export เป็น pdf
ขอบคุณที่แสดงความคิดเห็น Szabolcs ' สำหรับคำถามนี้ฉันได้พบวิธีExportสัญลักษณ์ Cyrillic จากMathematicaเป็น PDF อย่างถูกต้อง เราเพียงแค่ต้องตั้งค่าตัวแปรทั้งระบบโดยทั่วไปเรียกว่าระบบโลคัล (หรือภาษาสำหรับแอปพลิเคชันที่ไม่ใช่ Unicode ) เป็นภาษาอังกฤษแบบสหรัฐอเมริกาตามที่อธิบายไว้ที่นี่ : เปิดตัวเลือกภูมิภาคและภาษาในแผงควบคุม ในขั้นสูงแท็บภายใต้ภาษาสำหรับโปรแกรมที่ไม่ใช่ Unicodeเลือกภาษาอังกฤษ (สหรัฐอเมริกา) วิธีการนี้มีข้อ จำกัด ในการใช้งานน้อย: เฉพาะผู้ดูแลระบบเท่านั้นที่มีความสามารถในการตั้งค่าระบบภาษา การตั้งค่าโลแคลของระบบจำเป็นต้องรีบูตระบบ สามารถตั้งค่าระบบได้ครั้งละหนึ่งระบบเท่านั้น น่าเสียดายที่การตั้งค่านี้ไม่เพียงส่งผลกระทบต่อMathematicaเท่านั้นแต่ทุกโปรแกรมที่ไม่ใช่ Unicode ที่ใช้ในคอมพิวเตอร์รวมถึงส่วนประกอบบางอย่างของ Windows เอง เป็นผลให้โปรแกรมเหล่านี้ทำงานไม่ถูกต้องและในบางกรณีการเปลี่ยนแปลงตัวเลือกนี้ยังสามารถทำให้เกิดBSOD ตัวอย่างเช่นตัวแปลบรรทัดคำสั่งcmd.exeบน Windows ที่แปลเป็นภาษาท้องถิ่นหลังจากตั้งค่าระบบภายในเป็นภาษาอังกฤษแล้วจะมีลักษณะดังนี้: สำหรับ Windows Server 2003 และ Windows XP Microsoft ได้พัฒนาMicrosoft AppLocale Utilityซึ่งมีวัตถุประสงค์เพื่ออนุญาตให้เรียกใช้แอพพลิเคชั่นที่ไม่ใช่ยูนิโค้ดโดยไม่ต้องเปลี่ยนภาษาของระบบ (ขอบคุณโปรแกรมเมอร์ Windowsสำหรับการอ้างอิง) แต่ฉันไม่สามารถทำงานให้กับMathematicaได้ เป็นไปได้ไหมที่จะตั้งค่าตำแหน่งที่ตั้งของระบบสำหรับMathematicaเพื่อรับ Cyrillic ที่ถูกต้องExportเป็น …

2
ทำให้หมายเลขที่คัดลอกจาก Excel เป็น Word ใช้เครื่องหมายลบแทนเครื่องหมายขีดคั่นเพื่อหลีกเลี่ยงการตัดคำ
เมื่อคุณคัดลอกจำนวนลบจาก Excel ไปยัง Word จะใช้เครื่องหมายยัติภังค์ / เครื่องหมายลบ (Unicode -) แทนเครื่องหมายลบ (Unicode −) ที่เหมาะสม สิ่งนี้ทำให้ข้อความห่อหลังเครื่องหมายขีดกลาง (คุณไม่สามารถบังคับให้คอลัมน์ที่สองทำสิ่งที่คนแรกทำ): ฉันต้องการ Excel เพื่อคัดลอกอักขระที่เหมาะสม ฉันจะแก้ไขสิ่งนี้ให้ดีได้อย่างไร? ฉันถูกตราหน้าให้ค้นหาและแทนที่ทุกครั้งที่ฉันวางบางสิ่งจาก Excel หรือไม่ แก้ไข: ฉันคิดว่าคำตอบที่เป็นไปได้อาจมาจากการเปลี่ยนรูปแบบเริ่มต้นใน Excel แต่อาจจะเป็นเพียงแค่บางที

3
ข้อความ Unicode หายไปเมื่อบันทึกเป็น ANSI
เมื่อฉันบันทึกไฟล์ข้อความโดยใช้แผ่นจดบันทึกด้วย ANSI ฉันทำข้อมูลทั้งหมดหายเพราะมันกลายเป็นเครื่องหมายคำถาม มีวิธีการแปลงเป็น Unicode เพื่อดึงข้อความหรือไม่

1
วิธีการใส่ Unicode ใน Cmd / Batch?
ดังนั้นฉันกำลังพยายามทำเมนูชุดที่ดี แต่ทุกครั้งที่ฉันพยายามใช้บรรทัดแฟนซีของยูนิโค้ดฉันเพิ่งได้รับตัวอักษรแบบสุ่ม มีวิธีการใส่ Unicode ใน cmd และหรือ batch file หรือไม่
2 batch  unicode 


1
Excel 2010 บันทึกเป็นเว็บเพจ - ต้องการอักขระภาษาญี่ปุ่นในไฟล์ HTML แทน Unicode
สำหรับวัตถุประสงค์ในการเขียนโปรแกรม (Objective-C) ฉันต้องส่งออกอักขระภาษาญี่ปุ่นเป็นไฟล์ HTML จาก Excel ดังนั้นฉันจึงสามารถวิเคราะห์ข้อมูลในโครงการของฉัน ฉันใช้ Excel 2010 ตัวอย่างเช่น: เมื่อฉันเปิดไฟล์ HTML ที่บันทึกไว้ทั้งหมดที่ฉันเห็นคือกลุ่มของอักขระ Unicode แทนที่ตัวอักษรญี่ปุ่นจริง ๆ มีวิธีที่ฉันสามารถ: เปลี่ยนการตั้งค่าที่ใดที่หนึ่งใน Excel เพื่อให้แน่ใจว่ามีการบันทึกสัญลักษณ์ / อักขระจริงในไฟล์ HTML แทนหมายเลข Unicode แปลงไฟล์ HTML ที่บันทึกไว้เพื่อให้อักขระ Unicode ทั้งหมดถูกแปลงเป็นสัญลักษณ์จริง ความช่วยเหลือใด ๆ ชื่นชม!

1
คอลัมน์เรียง MS Excel ที่มีอักขระที่ไม่ใช่ลาติน
เป็นไปได้ไหมที่จะเรียงคอลัมน์ที่มีสตริงข้อความใน Excel เมื่อสคริปต์ไม่ใช่ละตินเช่น Cyrillic ถ้าเป็นเช่นนั้นได้อย่างไร +------------------------------------------------+------------------------------------------------+ | CORRECT ORDER | A-Z SORT IN EXCEL | +------------------------------------------------+------------------------------------------------+ | 3M – Шинэ Зеланд | 3M – Шинэ Зеланд | | Бристол Майэрз – Энэтхэг | Koника Минолта – Австрали | | Бупа Эрүүл мэндийн даатгал – Tайланд | Maэрск Шипинг – Шинэ …

0
การแสดงออก Unicode กับ SquidGuard
ฉันใช้ SquidGuard 1.4 กับ Squid3 มันทำงานได้อย่างมีเสน่ห์และฉันสามารถบล็อกไซต์สำหรับผู้ใหญ่ด้วยไฟล์ expression DB ที่มีรูปแบบภาษาอังกฤษ (^|[-\?+=/_])(bondage|boobs?|busty?|hardcore|porno?|sex|xxx+)([-\?+=/_]|$) คำถามของฉันคือฉันจะกรองไซต์สำหรับผู้ใหญ่ในภาษาอาหรับโดยใช้นิพจน์ Unicode เพื่อบล็อกคำเช่น "سكس" หรืออะไรก็ได้
1 unicode  squid  arabic 

0
วิธีการเมานต์ nfs ด้วยการสนับสนุน utf8 บนอูบุนตู?
ในระยะสั้นฉันมีเซิร์ฟเวอร์ Ubuntu 16.04 สองเครื่อง en_US.utf-8ทั้งสองของพวกเขาจะใช้ ตอนนี้ฉันทำตามบทช่วยสอนนี้เพื่อติดตั้ง nfs จากเซิร์ฟเวอร์หนึ่งไปยังเซิร์ฟเวอร์อื่น ฉันทำมันสำเร็จแล้ว แต่ยังมีปัญหาอยู่ บางไฟล์มีชื่อไฟล์ที่มีอักขระ utf-8 ซึ่งไม่สามารถแปลงได้อย่างถูกต้อง ตัวอย่างเช่นถ้าฉันจะคัดลอกไฟล์ชื่อจากลูกค้าไปยังเซิร์ฟเวอร์ก็จะกลายเป็น雷侯.txt??.txt ดังนั้นฉันจะทำให้มันทำงานอย่างไร
1 ubuntu  mount  unicode  nfs  utf-8 

1
ฉันจะบอกได้อย่างไรว่าการเข้ารหัสชื่อไฟล์กำลังใช้งานอยู่?
ฉันมีบางไฟล์ที่มีชื่อภาษารัสเซีย (ซิริลลิก) เมื่อฉันเปิดใน Windows Explorer ชื่อจะแสดงอย่างถูกต้อง เมื่อฉันแสดงรายการไว้ใน Command shell (cmd) พวกเขาจะแสดงเป็น "?????" ตัวละคร มีวิธีบอกการเข้ารหัสที่ใช้ในชื่อไฟล์หรือไม่? หนึ่งในหน้ารหัส? (ฉันลองรหัสซิริลลิกทั่วไปหน้า 866 และ 1251 โดยใช้chcpคำสั่งโดยไม่มีโชค) Unicode (ฉันลอง 65001 ไม่มีโชค)? อื่น ๆ อีก? ฉันไม่สนใจวิธีการของคำตอบเป็นพิเศษ (ทั้งหมดต่อไปนี้เป็นที่ยอมรับได้: โปรแกรมฟรีแวร์, สคริปต์ Perl, สคริปต์ Powershell, หน้าเว็บที่ทำให้ฉันอัปโหลดไฟล์) ระบบ: Windows XP SP3

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.