คำถามติดแท็ก unicode

Unicode เป็นมาตรฐานอุตสาหกรรมคอมพิวเตอร์สำหรับการเข้ารหัสการแสดงและการจัดการข้อความที่สอดคล้องกันในระบบการเขียนส่วนใหญ่ของโลก

1
หน้าจอ GNU ไม่ได้สะท้อนเสียงอักษรที่ถูกต้อง
เมื่อฉันทำเช่นนี้ใน terminal ของฉัน: echo -e "\xF0\x9f\x8d\xba" ฉันได้รับเหยือกเบียร์เย็น ๆ ในเครื่อง:: อย่างไรก็ตามเมื่อฉันเริ่มหน้าจอและลองแบบเดียวกันฉันจะได้ a ฉันจะได้รับเหยือกเบียร์ที่ดีได้อย่างไร นี่คือ. screenrc ของฉัน: nethack on startup_message off defscrollback 3000 hardstatus on hardstatus alwayslastline hardstatus string "%{.bW}%-w%{.rW}%n %t%{-}%+w %=%{..G} %H %{..Y} %m/%d %c" termcapinfo xterm 'bc@:bs@' ignorecase on maptimeout 0 vbell off defutf8 on defencoding utf8 การรันหน้าจอด้วย-Uตัวเลือกก็ไม่ได้ช่วยอะไร

2
vim สามารถแสดงอักขระ ASCII เท่านั้นและถือว่าไบต์อื่นเป็นข้อมูลไบนารีได้หรือไม่
ฉันรู้อยู่แล้วว่าvim -bขึ้นอยู่กับสถานที่ที่ใช้มันจะแสดงอักขระหลายไบต์ (เช่น UTF-8) เป็นตัวอักษรเดียว ฉันvimจะขอให้แสดงเฉพาะอักขระที่พิมพ์ได้ของ ASCII และจัดการกับส่วนที่เหลือเป็นข้อมูลไบนารีไม่ว่าจะเป็นชุดอักขระหรือไม่

2
ฉันจะทำให้สัญลักษณ์ unicode และฟอนต์ truetype ทำงานใน xterm / uxterm ได้อย่างไร
ฉันต้องการใช้แบบอักษร truetype ใน xterm / uxterm (รุ่น 278) แต่ฉันพบปัญหากับสัญลักษณ์ unicode (ตัวอย่างเช่นéแสดงผลได้ดีดังนั้นฉันเดาว่าไม่ใช่ utf8 หรือปัญหา locale): $ echo -e "\xE2\x98\xA0" ให้สแควร์แทน☠ด้วยการกำหนดค่าต่อไปนี้: UXTerm*faceName: Liberation Mono UXTerm*faceSize: 9 XTerm*faceName: Liberation Mono XTerm*faceSize: 9 เมื่อฉันปิดใช้งานฟอนต์ truetype โดยใช้เมนูคลิกขวาสัญลักษณ์จะแสดงผลได้ดีโดยใช้ฟอนต์เริ่มต้นที่ไม่ดีเลย ฉันลอง uxrvt และมีปัญหาเดียวกันเมื่อฉันมีตัวอักษรไม่มากพอ แต่ก็ใช้งานได้ดีเมื่อฉันเพิ่มมัน อย่างไรก็ตาม uxrvt ทำให้ฉันมีปัญหาอื่น ๆ มากมายเช่นเดียวกับเทอร์มินัลจำลองอื่น ๆ ที่ฉันลอง ใครมีความคิดบ้างไหม?
12 fonts  xterm  unicode  ttf 

2
วิธีการพิมพ์ Unicode glyph ชื่อสำหรับสายป้อน?
ฉันต้องการที่จะสามารถทำงานได้ unicode-names 'abç' และดูชื่ออักขระ Unicode ที่เกี่ยวข้อง: LATIN SMALL LETTER A LATIN SMALL LETTER B LATIN SMALL LETTER C WITH CEDILLA การพิมพ์สตริงเป็นชุดของชื่อสัญลักษณ์ Unicode จะเป็นประโยชน์ในหลายกรณี: แยกแยะอักขระที่สับสนได้ง่ายเช่น "i" และ "í" อธิบายว่าสตริงตัวอักษรประกอบด้วยอะไรจริง (ตัวอย่างเช่นอักขระที่ไม่สามารถพิมพ์หรือไม่ได้กำหนดอักขระความกว้างเป็นศูนย์)

1
mutt: วิธีการแสดงตัวอักษรอิโมจิอย่างถูกต้อง?
ฉันต้องการที่จะเห็นตัวอักษรอิโมจิอย่างถูกต้องใน mutt แต่เช่น💗แสดงเป็น ^ J ในเพจเจอร์ของ mutt วิ่ง :set pager=view และการเปิดข้อความใหม่จะแสดงตัวอักษรอย่างถูกต้องด้วย vim อีเมลที่เป็นปัญหานั้นเข้ารหัสด้วย PGP แต่ฉันคิดว่าฉันจะได้รับอีเมลฉบับเดียวกันกับที่ไม่ได้เข้ารหัส ( https://groups.google.com/forum/#!topic/comp.mail.mutt/50_MpyYkXR4 ) ฉันยังพบโพสต์นี้ ( /programming/23526353/how-to-get-ncurses-to-output-astral-plane-unicode-characters ) ซึ่งอธิบายถึงปัญหาที่เป็นไปได้ที่ฉันพบ แต่อย่างที่ฉันบอกว่าเสียงเรียกเข้านั้นแสดงตัวอักษรได้ดีในหน้าต่างเทอร์มินัลเดียวกัน ยิ่งไปกว่านั้นฉันใช้ glibc 2.19 และฉันไม่เห็นว่าแอปพลิเคชันทั้งสองนี้สามารถใช้เวอร์ชัน glibc ที่แตกต่างกันในระบบเดียวกันได้อย่างไร มีวิธีรับเพจเจอร์ในตัว mutt เพื่อแสดงเหล่านี้อย่างถูกต้องหรือไม่ แก้ไข: ดังนั้นฉันลืมที่จะรวมทุกอย่างที่เกี่ยวข้องนอกเหนือจาก 'mutt' และ 'vim' ... ฉันใช้ Debian เสถียรกับแพคเกจ mutt-patched $ uname -r 3.16.0-4-amd64 $ lsb_release -a …
11 vim  mutt  unicode 

4
รองรับการเข้ารหัส utf-8 ด้วย lpr
ในขณะที่พยายามส่งไฟล์ข้อความไปยังเครื่องพิมพ์ผ่านlprจากxtermเนื้อหาที่ได้รับความเสียหายเกินกว่าการรับรู้สาเหตุของการที่ถูกโยงไปถึงการเข้ารหัสไฟล์ในที่สุด หากฉันประมวลผลข้อความด้วยiconv(เช่น, iconv -f utf-8 -t ascii//TRANSLIT) แสดงว่าไฟล์ถูกพิมพ์ตามปกติ ข้อเสนอแนะของฉันมาข้ามก็คือการตั้งค่ารูปแบบเอกสาร (เช่นlpr -o document-format=text/utf8) lpr: Unsupported document-format "text/utf8"แต่ผลตอบแทนนี้ข้อผิดพลาด ฉันสามารถนามแฝงlprคำสั่งเพื่อรวมการประมวลผลโดยiconvแต่มีวิธีทั่วไปมากขึ้นสำหรับการสนับสนุน utf-8 พื้นเมืองในระบบCUPS/ lpr? แก้ไข:ระบบปฏิบัติการของฉันคือ Debian 8 และตัวจัดการหน้าต่างของฉันคือopenbox(ไม่มีสภาพแวดล้อมบนเดสก์ท็อป) ฉันสามารถพิมพ์ไฟล์นี้โดยไม่มีปัญหาจาก MacOS X รวมถึงจากระบบ Debian7 / Gnome3 จากระบบปัจจุบันของฉันฉันควรชี้ให้เห็นว่าแม้หลังจากเปลี่ยนการเข้ารหัสอักขระจาก UTF-8 เป็น ASCII แล้วอักขระบรรทัดใหม่จะไม่ได้รับการเคารพlprดังนั้นบรรทัดจะถูกต่อกันเข้าด้วยกันและพิมพ์จนกว่าจะถึงระยะขอบกระดาษ หลังจากการบันทึกและการทับศัพท์ด้วยiconvบน MacOS X การพิมพ์ยังคงใช้งานได้ตามปกติ

2
สัญลักษณ์ทางคณิตศาสตร์ UTF8 และรูปแบบแป้นพิมพ์ / อินพุต
ฉันต้องการที่จะใช้สัญลักษณ์ทางคณิตศาสตร์ UTF8 เมื่อพิมพ์หนึ่งรายการ , รายการอื่น ฉันได้พบสิ่งที่เรียกว่าComposeKey น่าเสียดายที่มันไม่ครอบคลุมโอเมก้า, ทีต้า, ลูกศรขวาเป็นต้น ฉันใช้ KDE ฉันได้ลองใช้ทางลัดระดับโลก แต่ดูเหมือนจะไม่ทำงาน วิธีการตั้งค่าการพิมพ์สัญลักษณ์ utf8 (เช่น: Θ, Ω, ∃, ∀, ⇒, →) ด้วยการใช้แป้นพิมพ์ร่วมกัน (เช่น Meta + S)?

3
อักขระ 'ä' ในชื่อผู้ใช้ทำให้เกิดข้อบกพร่องในระบบ linux หรือไม่
ฉันต้องการใช้ชื่อจริงของฉันเป็นชื่อผู้ใช้ แต่มีอักขระ 'ä' ฉันพบกระทู้นี้ ตอนนี้ฉันเข้าใจแล้วทำไมตัวละครบางตัวถึงถูกปิดใช้งาน แต่สิ่งที่เกี่ยวกับ 'ä'? ตัวละครตัวนี้สามารถทำให้เกิดปัญหาใด ๆ ? ทำไมตัวอักษรยูนิโค้ดบางตัว (ü, õ, ö, ä) ถูกปิดใช้งานเมื่อใช้ในชื่อเต็ม?
11 users  unicode 

2
ระบุการเข้ารหัสด้วย libreoffice --convert-to csv
ไฟล์ Excel สามารถแปลงเป็น CSV โดยใช้: $ libreoffice --convert-to csv --headless --outdir dir file.xlsx ทุกอย่างดูเหมือนจะทำงานได้ดี อย่างไรก็ตามการเข้ารหัสนั้นถูกตั้งค่าไว้ที่สิ่งที่สกปรก แทนที่จะเป็น UTF-8 mdash (-) ที่ฉันได้รับถ้าฉันทำ "บันทึกเป็น" ด้วยตนเองจาก LibreOffice Calc มันให้ฉัน \ 227 ( ) การใช้ไฟล์ใน CSV ทำให้ฉัน "ข้อความที่ไม่ใช่ ASCII แบบขยาย ASCII, มีบรรทัดที่ยาวมาก" ดังนั้นสองคำถาม: เกิดอะไรขึ้นที่นี่ ฉันจะบอกให้ libreoffice เปลี่ยนเป็น UTF-8 ได้อย่างไร ไฟล์เฉพาะที่ฉันพยายามที่จะแปลงเป็นที่นี่

2
จะทราบได้อย่างไรว่ามีการกำหนดยูนิโคด codepoints ไว้ในไฟล์ TTF อย่างไร
ฉันต้องทำให้กระบวนการตรวจสอบว่าอักขระ Unicode มีร่ายมนตร์ที่กำหนดไว้โดยอัตโนมัติสำหรับพวกเขาในไฟล์ True Type Font ฉันจะทำเช่นนั้นได้อย่างไร ฉันไม่สามารถหาข้อมูลเกี่ยวกับวิธีทำให้ตัวเลขที่ฉันดูเหมือนจะได้รับเมื่อฉันเปิดไฟล์. ttf ในโปรแกรมแก้ไขข้อความ
11 fonts  unicode  ttf 

4
ฉันจะระบุตัวละครที่แปลกได้อย่างไร
ฉันพยายามระบุตัวละครแปลก ๆ ที่ฉันพบในไฟล์ที่ฉันทำงานด้วย: $ cat file � $ od file 0000000 005353 0000002 $ od -c file 0000000 353 \n 0000002 $ od -x file 0000000 0aeb 0000002 ไฟล์กำลังใช้การเข้ารหัส ISO-8859 และไม่สามารถแปลงเป็น UTF-8 ได้: $ iconv -f ISO-8859 -t UTF-8 file iconv: conversion from `ISO-8859' is not supported Try `iconv --help' …

3
วิธีแปลงไฟล์ UTF-8 txt ไปเป็นตัวพิมพ์ใหญ่ทั้งหมดใน bash?
ฉันมีไฟล์ UTF-8 .txt บางไฟล์ซึ่งฉันต้องการแปลงเป็นตัวพิมพ์ใหญ่ทั้งหมด หากเป็นเพียง ASCII ฉันสามารถใช้: tr [:lower:] [:upper:] แต่เนื่องจากฉันทำงานกับกำกับกำกับและเนื้อหามันจึงไม่ทำงาน ฉันเดาว่าอาจใช้งานได้หากฉันตั้งค่าภาษาที่เหมาะสม แต่ฉันต้องการให้สคริปต์นี้พกพาได้
10 locale  unicode  text  tr 

1
Emacs: วิธีแทรก 'λ' แทน 'lambda' ในโหมด Scheme ได้อย่างไร?
นานมาแล้วฉันได้พบกับฟังก์ชั่นแก้ไขข้อความที่แทนที่คำว่า 'แลมบ์ดา' ด้วยตัวอักษร 'λ' ฉันต้องการทำสิ่งนี้ใน emacs การตั้งค่าของฉัน: ฉันต้องการเปิดใช้งานฟังก์ชั่นนี้ในบางโหมดเท่านั้น (เปิดใช้งานสำหรับโหมด Scheme แต่ปิดเช่น C-mode) ที่ทำงานฉันยังคงใช้ emacs รุ่นเก่ากว่าดังนั้นโซลูชันควรทำงานกับ emacs22 และ emacs23 ฉันควรดำเนินการอย่างไร
10 emacs  unicode 

2
บรรทัด `uniq 'ของฉันหรือ` sort -u' หายไปไหนด้วยอักขระ Unicode บางตัว
เกิดอะไรขึ้นในข้อมูลโค้ดต่อไปนี้ ฉันไม่ได้รับผลลัพธ์ที่คาดหวัง ฉันคิดว่ามันเป็นข้อผิดพลาด แต่มันเกิดขึ้นสำหรับ 2 โปรแกรมที่แตกต่างกัน (uniq และ sort) ดังนั้นฉันสงสัยว่ามันเป็นบางสิ่งที่ต้องทำกับ ... อืมฉันไม่รู้ว่า ... ดังนั้นคำถาม ตัวอย่าง 3 (4 จาก) แรกทำงานได้ แต่ 4 ล้มเหลว! ฉันคาดว่าจะมีพฤติกรรมแบบเดียวกันสำหรับตัวละครทุกตัว กล่าวคือ เพื่อพิมพ์ 2 บรรทัด (จากอินพุต 3 บรรทัด) ... แต่ในกรณีที่ 4 ฉันได้รับเพียง 1 บรรทัด (สำหรับทั้งคู่sort -uและuniq); สอง lins ที่เหมือนกันเพิ่งหายไป! ฉันได้แปลงเอาท์พุท '\ n' เป็นพื้นที่เพื่อความกะทัดรัด ฉันใช้uniqและเรียงลำดับจาก (GNU coreutils) 7.4 ... …

3
ตรวจจับว่า Unicode เทอร์มินัลของฉันรองรับเท่าไรผ่านหน้าจอ
นี่คือปัญหา: ฉันต้องการที่จะแยกแยะว่าเทอร์มินัลของฉันมีความสามารถในการยูนิโค้ดได้หรือไม่เพื่อที่จะใช้ตัวละครบางตัวหรือไม่ก็เหมือนกับที่มองไม่เห็นซึ่งบางครั้งใช้สีและขีดเส้นใต้ แรงบันดาลใจเกิดขึ้นเพราะเทอร์มินัลเสมือนชนิดใดก็ได้ที่ฉันได้รับแบบอักษรที่ดี แต่ฉันเข้าใจว่าคอนโซล Linux พื้นฐานมีชุดอักขระเป็น 256 หรือ 512 สัญลักษณ์พร้อมกันดังนั้นคุณจึงไม่สามารถคาดหวังการสนับสนุนฟอนต์เต็มรูปแบบได้ ตอนแรกฉันคิดว่าฉันสามารถใช้$TERMหรือ tty ได้ แต่นี่ก็เป็นเรื่องที่จับได้: ฉันใช้ byobu ด้วยเช่นกันดังนั้นจึง$TERMเป็น "screen.linux" เสมอ ผลลัพธ์ของ tty ก็ไม่ได้บอกอะไรมาก: /dev/pts/<some number>ทั้งใน "ของจริง" และเงื่อนไขเสมือน $BYOBU_TTYก็ไม่มีประโยชน์เช่นกันเพราะอาจเป็นเช่นนั้น/dev/tty1และเมื่อเปิดเซสชันในCtrl+ Alt+ F1อักขระจะไม่แสดง แต่เมื่อแนบกับเซสชันเดียวกันจากเทอม X บางรายการพวกเขาจะแสดงอย่างถูกต้องและยังคง$BYOBU_TTYไม่เปลี่ยนแปลง นอกจากนี้ฉันต้องการที่จะตรวจจับสิ่งนี้โดยไม่คิดว่า byobu อยู่ที่นั่นหรือไม่ นอกจากนี้โลแคลจะแสดงในทุกกรณี en_US.UTF-8 แต่อย่างใดสายตา (เพื่อชื่อเครื่องมือโดยเฉพาะอย่างยิ่งฉันเห็นการตรวจสอบนี้) แม้ใน byobu ใช้ผลลัพธ์ที่แตกต่างกันขึ้นอยู่กับ terminal ที่ฉันแนบกับเซสชัน byobu ฉันมีปัญหากับ google เนื่องจากเทอร์มินัลและ tty ดูเหมือนข้อความค้นหาทั่วไปเกินไป …
10 linux  terminal  tty  unicode 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.