คำถามติดแท็ก unicode

Unicode เป็นมาตรฐานสำหรับการนำเสนอข้อความธรรมดาของคอมพิวเตอร์ มันครอบคลุมชุดอักขระสากลมีจุดมุ่งหมายเพื่อแสดงอักขระทั้งหมดที่ใช้ในระบบการเขียนของมนุษย์ในภาษาใด ๆ ฟอร์แมตการแปลง Unicode (UTFs) กำหนดรูปแบบที่ได้มาตรฐานสำหรับการจัดเก็บและการส่งข้อความ Unicode และมาตรฐานสำหรับการประมวลผลและการจัดการข้อความ

2
มีวิธีการแสดงค่าสถานะ Unicode ด้วยการติดตั้งแบบอักษรที่ระบุหรือไม่ ถ้าเป็นเช่นนั้น
ดังนั้นฉันจึงสงสัยเกี่ยวกับสัญลักษณ์ตัวบ่งชี้ภูมิภาคและการใช้งานในระบบโทรศัพท์มือถือ ในทางทฤษฎีแล้วมันควรจะเป็นไปได้ที่จะสร้างแบบอักษรสำหรับคอมพิวเตอร์ที่แสดงค่าสถานะจริงแทนที่จะเป็นตัวยึดตำแหน่งใช่ไหม บทความ Wikipedia ดังกล่าวข้างต้นควรมีกรณีทดสอบเพียงพอ ฉันต้องการมีคู่เช่น🇩🇪, 🇬🇧หรือ🇱🇻แยกวิเคราะห์และแทนที่ด้วยธงที่เหมาะสมของพวกเขา จนถึงตอนนี้ฉันไม่พบสิ่งใดที่ดูเหมือนสิ่งที่ฉันพยายามจะบรรลุ
13 fonts  unicode 

1
iconv กำลังสร้าง UTF-16 พร้อม BOM
ได้รับแรงบันดาลใจจากคำถามนี้ฉันสามารถใช้iconvคำสั่งเพื่อสร้างเอาต์พุต UTF-16 ด้วย BOM และด้วย endianness ที่ระบุได้หรือไม่ iconvข้อความคำสั่งแปลงจากการเข้ารหัสหนึ่งไปยังอีก ตัวอย่างเช่น: echo hello | iconv -f ascii -t utf-16 สร้าง UTF-16 "hello\n"เป็นตัวแทนของ UTF-16 ไฟล์บ่อย แต่ไม่เคยเริ่มต้นด้วยการสั่งซื้อมาร์คไบต์ (BOM) ซึ่งเป็นการเข้ารหัส 2 U+FEFFไบต์ของอักขระ คุณสามารถกำหนด endianness ของไฟล์ UTF-16 กับ BOM โดยการตรวจสอบว่าทั้งสองไบต์แรกหรือFE FFFF FE iconvคำสั่งมีหลายตัวเลือกสำหรับการสร้าง UTF-16 เอาท์พุท: $ iconv --list | grep -i utf-16 UTF-16// UTF-16BE// UTF-16LE// คำสั่งนี้: …
11 unicode 

3
ดู codecoints unicode สำหรับตัวอักษรทั้งหมดในไฟล์ที่ทุบตี
ฉันต้องจัดการกับไฟล์ที่มีอักขระควบคุมที่มองไม่เห็นจำนวนมากเช่น "จากขวาไปซ้าย" หรือ "ไม่มีความกว้างเป็นศูนย์" ช่องว่างต่างจากพื้นที่ปกติเป็นต้นและฉันมีปัญหาในการจัดการกับสิ่งนั้น ตอนนี้ฉันต้องการที่จะดูตัวอักษรทั้งหมดในไฟล์ที่กำหนดตัวอักษรตัวอักษร(ฉันอยากจะพูดว่า "จากซ้ายไปขวา" แต่ฉันโชคไม่ดีที่เกี่ยวข้องกับภาษาจากขวาไปซ้าย)เป็น codepoints unicode โดยใช้เพียง เครื่องมือทุบตีพื้นฐาน (เช่นvi, less, cat... ) เป็นไปได้ไหม? ฉันรู้ว่าฉันสามารถแสดงไฟล์ในฐานสิบหกโดยhexdumpแต่ฉันจะต้องคำนวณ codepoints อีกครั้ง ฉันต้องการเห็น codepoints ของ unicode จริงๆดังนั้นฉันจึงสามารถ google พวกเขาและค้นหาว่าเกิดอะไรขึ้น แก้ไข: ฉันจะเพิ่มที่ฉันไม่ต้องการแปลงเป็นรหัสที่แตกต่างกัน (เพราะนั่นคือสิ่งที่ฉันกำลังหาออนไลน์) ฉันมีไฟล์ใน UTF8 และนั่นก็ใช้ได้ ฉันแค่อยากรู้ codepoints ที่แน่นอนของตัวอักษรทั้งหมด
11 linux  unicode 

3
ค้นหารหัส Alt สำหรับตัวละครใด ๆ
บางครั้งรหัส alt ที่ฉันพบบนอินเทอร์เน็ตไม่ทำงานบนพีซีของฉันตัวอย่างเช่น Pi alt code ( Alt+ 227) พ่น throw isntead of π ดังนั้นฉันต้องใช้ตัวละครในคลิปบอร์ด (หรือในไฟล์หรือที่ใดก็ได้) และแปลงเป็นรหัส Alt ที่เข้ากันได้กับระบบของฉัน เป็นไปได้ไหม

4
การแก้ไขแบบถาวรสำหรับอักขระ Unicode ไม่แสดงอย่างถูกต้อง (เป็นกล่อง)
โปรดอ่านข้อความทั้งหมดก่อนที่จะตอบกลับ ก่อนอื่นฉันรู้วิธีแก้ไขปัญหาชั่วคราว ฉันกำลังมองหาการแก้ไขอย่างถาวร ฉันทำงานกับไฟล์ภาษาต่างประเทศมากมาย น่าเสียดายที่บางครั้งอักขระ Unicode ทั้งหมดใน Windows Explorer, Notepad และสถานที่อื่น ๆ (แสดงผลโดย Windows, อาจเป็น GDI) แสดงไม่ถูกต้อง พวกเขาแสดงเป็นบล็อกสี่เหลี่ยมซึ่งก่อนหน้านี้พวกเขาได้แสดงอย่างถูกต้อง มีวิธีการนับไม่ถ้วนเพื่อแก้ไขปัญหาชั่วคราว แต่อีกครั้งฉันต้องการวิธีในการแก้ไขปัญหาอย่างถาวร สิ่งที่ฉันได้ลอง: "ซ่อนแบบอักษรตามการตั้งค่าภาษา" โง่ ๆ การตั้งค่านี้ใช้เฉพาะกับแบบอักษรที่คุณเห็นในโฟลเดอร์แบบอักษรและแบบอักษรแบบเลื่อนลง ไม่ปิดใช้งานแบบอักษรต่างประเทศ (ใช้งานไม่ได้หรือถ้าเป็นแบบชั่วคราว) การลบไฟล์แคชฟอนต์และรีบูตเครื่อง (ใช้งาน .. โดยปกติจะเป็นการแก้ปัญหาชั่วคราว) เปลี่ยนสถานที่ของฉันแล้วกลับมา (บางครั้งใช้งานได้แก้ปัญหาชั่วคราว) รีบูทพีซีของฉันและรับโชค (โอกาส 50-50 วิธีแก้ปัญหาชั่วคราว) การเปลี่ยนคีย์บอร์ดของฉัน / การเพิ่มคีย์บอร์ดต่างประเทศ (โซลูชันชั่วคราวที่ดูเหมือนว่าใช้งานได้เพียงครั้งเดียว) การติดตั้ง Windows ใหม่ (วิธีแก้ปัญหาชั่วคราวบางครั้งใช้เวลาสองสามเดือนแม้ว่าฉันได้ทำเช่นนี้ 7 ครั้งในคอมพิวเตอร์ 3 เครื่อง) สิ่งที่ฉันไม่ได้ลอง: …

1
อักขระ Unicode ในเซิร์ฟเวอร์ Ubuntu
ฉันเพิ่งย้ายจาก Ubuntu Desktop 13.04 ไปยัง Ubuntu Server 13.10 และตอนนี้ระบบไฟล์ของฉันดูเหมือนจะไม่รองรับอักขระ Unicode ฉันใช้ rsync เพื่อสำรองข้อมูล / ซิงค์ไฟล์และแสดงตัวอักษรที่เหมาะสม แต่ต้องการลบชื่อไฟล์ที่ไม่ตรงกันและสร้างเวอร์ชันที่ใช้ Escape ตัวอย่างเช่น: root@ubuntu-server:~# rsync -avh --progress --delete --dry-run --exclude \$RECYCLE.BIN /media/source/ /media/target/ deleting Tiësto - Ten Seconds Before Sunrise.mp3 Ti\#353sto - Ten Seconds Before Sunrise.mp3 นอกจากนี้ถ้าฉันคัดลอกไฟล์ Unicode ไปยังระบบไฟล์มันจะแสดงเป็น: drwxr-xr-x 3 root root 4096 Jan …

1
GNU sed (สำหรับ Windows) สามารถจัดการ Unicode ได้หรือไม่ ถ้าเป็นเช่นนั้นมันเป็นปัญหาของโค้ดเพจ / โลแคลหรือสวิตช์?
ฉันใช้ GNU SED เปิดและปิดเป็นเวลาสองปีแล้ว มันหมุนฉันออกไปเล็กน้อย แต่ก็ทำได้ดี ... สำหรับชุดถ่านไบต์เดียว! ตอนนี้ฉันแล้วสังเกตการอ้างอิงถึง GNU SED ว่าเป็น Unicode-aware แต่สิ่งที่ใกล้เคียงที่สุดที่ฉันเคยเห็นคือโหมด "binary" .. และไบนารีไม่ใช่ Unicode GSED สามารถประมวลผลไฟล์ข้อความ Unicode ที่ความละเอียด CodePoint รวมถึงและโดยเฉพาะ \ r \ n (Windows) ... และถ้าทำได้สามารถคาดหวังว่า UTF-8, UTF-16 หรืออะไร? และ SED ตรวจจับการเข้ารหัสอย่างไร
10 windows  encoding  unicode  sed  gnu 

7
Robocopy unilog output ไม่มีความหมาย
ฉันพยายามรับ robocopy ใน Windows 7 เพื่อสร้างบันทึก Unicode เนื่องจากฉันมีไฟล์ที่มีอักขระ Unicode คำสั่งที่ฉันใช้: robocopy C:\mysource D:\mydest /mir /unilog:backup.log /tee ไฟล์งานคัดลอกและเอาท์พุทบนหน้าจอถูกต้องไฟล์บันทึกตัวเองเพียงแค่มีความหมายซึ่ง สิ่งนี้ไม่ว่าฉันจะใช้พรอมต์คำสั่งหรือ PowerShell สิ่งที่ช่วยให้? ฉันกำลังทำอะไรผิดหรือเปล่า?
10 unicode  robocopy 

3
รับ gvim เพื่อแสดงยูนิโค้ด
จะรับ GVim ได้อย่างไร (ข้อ 7.3 ใน Windows XP หากมีความสำคัญ) จะแสดงอักขระ Unicode ได้อย่างไร บางสิ่งบางอย่างตามแนวของ http://vimcasts.org/episodes/show-invisibles/ (ค้นหาlistcharsเพื่อดูสามเหลี่ยมเล็ก ๆ ที่ฉันพยายามจะหา) ฉันกำลังใช้ set encoding, set fileencoding, and set fileencodings, ทั้งหมดไปยัง utf-8 ถ้าเป็นเช่นนั้น ฉันรู้ว่ามันต้องเป็นอะไรที่เรียบง่าย แต่อย่างไรก็ตามฉันติดอยู่ที่นี่ ช่วยด้วย.

2
เปลี่ยนการเข้ารหัสเริ่มต้นของ Firefox สำหรับไฟล์ข้อความ
ไฟล์ข้อความไม่รวมข้อมูลการเข้ารหัสอักขระดังนั้น Firefox จึงไม่มีทางรู้ว่าไฟล์ใดถูกต้อง ผ่านเมนูView→ Text encodingฉันสามารถเลือกการเข้ารหัสที่เหมาะสม ฉันพบว่าตัวเองทำสิ่งนี้ทุกครั้งที่ฉันเปิดไฟล์ข้อความเนื่องจากมันถูกตั้งเป็นWesternโดยค่าเริ่มต้นเสมอ แต่ไฟล์ข้อความของฉันจะเป็นUnicodeเสมอ(UTF-8) มีวิธีการตั้งค่าการเข้ารหัสเริ่มต้นเป็น Unicode แทนที่จะเป็น Western หรือไม่?

4
ไม่สามารถใช้รหัส Alt สำหรับการแทรกอักขระ Unicode ได้อีก
ฉันใช้รหัส Altสำหรับจุดไข่ปลา 8230 ในขณะนี้ในหลายแอปพลิเคชัน ไม่กี่วันที่ผ่านมามันหยุดทำงานและ&จะปรากฏขึ้นแทน…เมื่อกดAlt+ 8+ 2+ 3+ 0(บน numpad) สิ่งนี้เกิดขึ้นทั้งบนเดสก์ท็อปและแล็ปท็อปของฉัน (ที่ฉันใช้กับFn) ทั้งสองทำงานบน 64bit-Win-7 พร้อมโค้ดเพจ 850 และทั้งคู่อาจเพิ่งอัพเดต Windows และ Opera 12 อะไรเป็นสาเหตุที่ทำให้วิธีการป้อนข้อมูลนี้ถูกปิดการใช้งานและฉันจะเปลี่ยนกลับได้อย่างไร? โดยวิธีการที่ฉันเพิ่งพบว่าAlt+ 0+ 1+ 3+ 3ทำงาน นอกจากนี้ผมพบว่าAlt+ 8+ 2+ 3+ 0ยังคงทำงานใน WordPad หรือ MsWord10 แต่ไม่อยู่ในโรงละครโอเปร่าหรือ Notepad ++ - มีรหัสตัวอักษรที่จะแปลโมดูลัส 256 ก่อนที่จะแทรก

1
ls ของ Ubuntu สามารถแสดงอักขระยูนิโค้ดได้ แต่ทรีไม่สามารถทำได้แม้แต่กับ tree --charset unicode
อูบุนตู 10.04 ของlsสามารถแสดงตัวอักษร Unicode แต่treeไม่สามารถแม้จะมีหรือtree --charset unicode utf8มีวิธีแก้ไขไหม echoสามารถตีความอักขระยกเว้นยกเว้นcat list.txt | echo -eจะไม่ทำงาน ( list.txtมาจาก tree > list.txt) อัปเดต: tree -H www.somewhere.comสามารถส่งออก Unicode (ควรเป็น UTF-8) แต่ตอนนี้ดูเหมือนว่านี่เป็นวิธีเดียวเท่านั้น - เป็นหน้าเว็บ $ ls -R .: list2.txt list.txt 久未在遊行場合露面的前總統李登輝.txt 遊行 ./遊行: 大家2.txt 大家.txt $ tree --charset unicode . |-- list2.txt |-- list.txt |-- \344\271\205\346\234\252\345\234\250\351\201\212\350\241\214\345\240\264\345\220\210\351\234\262\351\235\242\347\232\204\345\211\215\347\270\275\347\265\261\346\235\216\347\231\273\350\274\235.txt …
10 ubuntu  bash  unicode  ls  tree 

3
รับช่วง Unicode ที่รองรับจากไฟล์ Font * .ttf บน Ubuntu
ฉันมีแบบอักษรบางส่วนในรูปแบบ 'ttf' บนเครื่อง Ubuntu ของฉัน ฉันต้องการทราบเมตาดาต้าของแบบอักษรเหล่านั้นเกี่ยวกับช่วง Unicode และ Codepages ที่ไม่ใช่แบบ Unicode ซึ่งเป็นแบบอักษรที่สนับสนุน ฉันจะทำมันได้อย่างไร เพิ่ม 1: ลืมที่จะพูดถึงว่าฉันต้องการได้รับข้อมูลเหล่านั้นสำหรับแบบอักษรหลายร้อยแบบดังนั้นฉันจึงต้องการเทอร์มินัลเทอร์มินัลบางชนิดที่สามารถทำให้เป็นอัตโนมัติ

3
เหตุใดจึงมีอักขระที่มีความกว้างคงที่แยกต่างหากสำหรับ 0-9 ในภาษาญี่ปุ่นเปรียบเทียบกับ 0-9 ทั่วไป
ญี่ปุ่น (日本語) -0123456789 ASCII ทั่วไปสำหรับทุกที่อื่น - 0 1 2 3 4 5 6 7 8 9 ทำไมต้องสร้างชุดอักขระแยกต่างหากสำหรับตัวเลขเดียวกัน
9 unicode  ascii 

5
กำลังป้อนอักขระ Unicode ใน Google Chrome หรือไม่
บางครั้งฉันต้องการป้อนอักขระ Unicode เช่นลูกศรขวา (→) ปัจจุบันวิธีเดียวที่ฉันรู้ก็คือการใช้แอปพลิเคชั่นUnicode Inputแต่มันก็ยุ่งยากพอ ๆ กับยูทิลิตี้ Windows Character Map ฉันจะพิมพ์อักขระ Unicode ผ่านแป้นพิมพ์โดยตรงได้อย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.