คำถามติดแท็ก utf-8

สำหรับการสนทนาเกี่ยวกับรูปแบบการแปลง UCS ด้วย 8 บิต (UTF8) มันเป็นตารางการเข้ารหัสที่แสดงถึงตัวละครทั้งหมดในชุดอักขระ Unicode

4
ฉันจะ excel ได้อย่างไรเพื่อไม่ให้ยุ่งกับการจัดรูปแบบของไฟล์. csv
ฉันมีสองปัญหาเกี่ยวกับไฟล์ csv ที่เกิดขึ้นเมื่อฉันลองแก้ไขใน Excel ฉันมีคอลัมน์ ISBN ที่จัดรูปแบบทางวิทยาศาสตร์ใหม่ทุกครั้งที่บันทึกไฟล์ การเข้ารหัสไฟล์นั้นเปลี่ยนจาก UTF-8 เป็น ANSI เมื่อฉันเปิดไฟล์ มันน่าผิดหวังและเสียเวลามากจริงๆ มีวิธีใดบ้างที่ฉันสามารถบังคับให้ Excel ออกจากรูปแบบไฟล์เพียงอย่างเดียวได้?

2
ความสามารถในการพกพาแบบโลแคล UTF-8 (และ ssh)
ฉันใช้เวลาส่วนใหญ่sshกับเครื่องต่าง ๆ ซึ่งทั้งหมดนี้แตกต่างกันไป (บางอันฝังอยู่ใช้งานกับ Linux บางตัวใช้งาน BSD และ c) บนเครื่องของฉันเองฉันใช้ OS X ซึ่งแน่นอนว่ามี userland ที่ใช้ BSD ภาษาของฉันบนเครื่องเหล่านั้นถูกตั้งค่าเป็น en_GB.UTF-8 ซึ่งเป็นหนึ่งในตัวเลือกที่ใช้ได้: % echo `sw_vers` ProductName: Mac OS X ProductVersion: 10.8.2 BuildVersion: 12C60 % locale -a | grep -i 'en_gb.utf' en_GB.UTF-8 ระบบ Linux ที่มีความสามารถมากกว่าที่ฉันใช้ดูเหมือนจะมีตัวเลือกที่เทียบเท่า แต่ฉันทราบว่าบน Linux ชื่อนั้นแตกต่างกันเล็กน้อย: % lsb_release -d Description: Debian GNU/Linux …
9 linux  shell  utf-8  locale  bsd 

3
วิธีค้นหาไฟล์ทั้งหมดในไดเรกทอรีที่มี UTF-8 BOM (เครื่องหมายคำสั่งซื้อ)
บน Windows ฉันต้องค้นหาไฟล์ทั้งหมดในไดเรกทอรีที่มี UTF-8 BOM (เครื่องหมายคำสั่งแบบไบต์) เครื่องมือใดที่สามารถทำได้และอย่างไร มันอาจเป็นสคริปต์ PowerShell คุณลักษณะการค้นหาขั้นสูงของโปรแกรมแก้ไขข้อความหรืออะไรก็ตาม
8 windows  search  utf-8 

1
มีวิธีบังคับให้การทำธุรกรรมไฟล์ทั้งหมดที่มีระบบไฟล์เป็นไปตามมาตรฐาน UTF8 หรือ UTF16 หรือไม่?
สิ่งที่ฉันต้องการคือการระบุว่าสำหรับไดเรกทอรีทุกการสร้าง / แก้ไขไฟล์ภายในไดเรกทอรีดังกล่าวจะถูกตรวจสอบโดยเคอร์เนลและหากชื่อไฟล์มีอักขระที่ไม่สนับสนุนกระบวนการที่กระทำผิดจะได้รับข้อผิดพลาด "สิทธิ์ถูกปฏิเสธ" ฉันกำลังคิดเกี่ยวกับการเขียนโปรแกรมควบคุมฟิวส์ที่ปฏิเสธชื่อไฟล์ที่ไม่สอดคล้อง แต่ดูเหมือนจะไม่เป็นประโยชน์ ฉันไม่ได้มองหาวิธีแก้ปัญหาที่แนะนำสิ่งต่าง ๆ เช่น cronjob หรือแจ้งให้ทราบว่าทำความสะอาดตัวละครที่ไม่พึงประสงค์หลังจากข้อเท็จจริง ฉันกำลังมองหาสิ่งที่ป้องกันไว้ล่วงหน้า

1
อะไรคือสาเหตุของอักขระพิเศษ 3 ตัวหลังจากการแปลงเป็น UTF-8
หนึ่งในขั้นตอนการทำงานของเราเกี่ยวข้องกับการบันทึกแผ่นงาน MS Excel เป็น CSV แล้วใช้ UltraEdit เพื่อแปลง CSV เป็น UTF-8 ก่อนที่จะนำเข้าลงในระบบเซิร์ฟเวอร์ ปัญหาคือหลังจากการแปลงเป็น UTF-8 ไฟล์จะมีตัวอักษรไร้สาระ 3 ตัวเสมอเมื่อเริ่มต้นไฟล์:  ENTITY_ID; FIELD2, FIELD3, FIELD4; (ฯลฯ ) value1; value2; value3; value4; (etc) ข้อสังเกต: อย่างที่คุณเห็นมี 3 ตัวอักษรที่มีเสียงรบกวนและทำให้เซิร์ฟเวอร์ปฏิเสธการนำเข้า CSV เนื่องจากคอลัมน์แรกไม่มีชื่อ "ENTITY_ID" ตัวละครเหมือนกันเสมอ ตัวละครเหล่านี้จะไม่แสดงหลังจากการแปลง แต่เมื่อเราปิดและเปิดไฟล์ใน UltraEdit อีกครั้งเราจะเห็นตัวอักษร อักขระเหล่านี้จะปรากฏเฉพาะใน UltraEdit Windows Notepad หรือ Notepad ++ ไม่แสดงขึ้นมา การใช้ …

2
ฉันจะแปลงอักขระพิเศษ UTF-8 เป็น Bash ได้อย่างไร
ฉันกำลังเขียนสคริปต์ที่แยกและบันทึกไฟล์แนบ JPEG จากอีเมลและส่งต่อไปยัง imagemagick อย่างไรก็ตามฉันอาศัยอยู่ในเยอรมนีและตัวละครพิเศษในข้อความอีเมล์ / หัวเรื่องเป็น "ö", "ä", "ü" และ "ß" เป็นเรื่องธรรมดา ฉันกำลังแยกหัวเรื่องด้วย formail: SUBJECT=$(formail -zxSubject: <"$file") และผลลัพธ์ใน: = UTF-8? Q? Meine_G = c3 = bcte? = ("Meine Güte") หรือแย่กว่านั้น = UTF-8? B? U2Now7ZuZSBHcsO8w59lIQ ==? = ("SchöneGrüße!") ฉันพยายามใช้ส่วนหนึ่งของหัวเรื่องเป็นชื่อไฟล์และเป็นคำอธิบายประกอบแบบข้อความของ imagemagick ซึ่งเห็นได้ชัดว่าใช้งานไม่ได้ ฉันจะแปลงข้อความ UTF-8 นี้เป็นข้อความด้วยอักขระพิเศษใน bash ได้อย่างไร ขอบคุณล่วงหน้า! มาร์คัส
6 bash  email  utf-8 

1
ปัญหาการเข้ารหัสชื่อไฟล์
ฉันไปที่หัวข้อนี้ แต่ไม่สามารถหาสิ่งที่ฉันกำลังมองหา ... "ดีใจ" ต่อไปนี้สำหรับฉัน: ฉันมีไฟล์ของฉันเก็บไว้ในฮาร์ดดิสก์ NTFS-USB เนื่องจากปัญหาพื้นที่ฉันย้ายพวกเขาไปยังระบบ ext3 .... อย่างใดชื่อไฟล์ (เนื้อหายังคง ok เท่าที่ฉันเห็น) การเข้ารหัสเมาไฟล์ของฉัน ดูเหมือนตอนนี้: Kküken <--- should have an "ü" Jäger <--- should be an "ä" Zwölf <--- should be an "ö" fünfte <-- should be an "ü" etc .... นี่เป็นเพียงตัวอย่าง แต่ให้คำถามแรกของฉัน ทำไม "ü" ถึงสองตัวแตกต่างกัน? (บางทีฉันอาจพลาดก่อนที่ฉันจะพลาดและตอนนี้ฉันมีการผสมเลเยอร์การเข้ารหัส x ที่แตกต่างกันหรือไม่? …
4 linux  ntfs  encoding  ext3  utf-8 

2
ssh backspace ลบหนึ่งอักขระแทนสองตัว (สัญลักษณ์ utf-8)
ฉันกำลังเข้าถึงคอมพิวเตอร์ระยะไกลโดยใช้ ssh และใช้คำสั่ง bash เพื่อใส่สัญลักษณ์โดยใช้สตรีมอินพุตมาตรฐาน: อ่านการทดสอบ echo $ test การป้อนตัวอักษรภาษาอังกฤษและใช้ backspace เพื่อลบออกจากนั้นจึงป้อนตัวอักษรอื่น ๆ แล้ววนซ้ำขั้นตอนนี้ทุกครั้ง แต่มันกลายเป็นหายนะเมื่อฉันใช้สัญลักษณ์ utf-8 อื่น ๆ เช่นสัญลักษณ์รัสเซียซึ่งต้องใช้ 2 ไบต์แทน 1 เช่นที่คนอังกฤษใช้ เช่นฉันใส่: абвгдежз หลังจากนั้นฉันใช้ backspace 8 ครั้งแล้วใส่สัญลักษณ์อื่น ๆ : привет และกดปุ่ม Enter แต่แทนที่จะเป็นผลลัพธ์ที่จะเท่ากับข้อมูลล่าสุดของฉันฉันได้รับต่อไปนี้: абвгпривет ซึ่งหมายความว่า 8 backspace ลบเพียง 4 สัญลักษณ์ ฉันใช้ Linux linux ubuntu 12.04 พยายามใช้คอนโซลที่แตกต่าง: หนึ่งมาตรฐานเทอร์มินอล ตัวเลือก …
2 bash  ubuntu  encoding  utf-8  ssh 

2
ยูทิลิตี้สำหรับการแปลงไฟล์ที่เข้ารหัส Shift-JIS เป็นไฟล์ที่เข้ารหัส UTF-8 [ปิด]
ลูกค้าของฉันมีไฟล์ข้อความภาษาญี่ปุ่นจำนวนมากซึ่งมีการเข้ารหัสใน Shift-JIS พวกเขาต้องการยูทิลิตี้ที่สามารถแปลงไฟล์เหล่านี้เป็น UTF-8 เครื่องมือจะเสนอตัวเลือกบรรทัดคำสั่งและตัวเลือกแบบโต้ตอบ คุณมีข้อเสนอแนะใด?

1
วิธีนำเข้า (และดูอย่างถูกต้อง) ไฟล์ CSV เข้ารหัส UTF-8 ภาษาจีนพร้อม Excel 2011 บน Mac OS X
ฉันมีไฟล์ CSV ซึ่งฉันสามารถเปิดและดูคอลัมน์ด้วยตัวอักษรจีนตามปกติด้วย TextMate อย่างไรก็ตามเมื่อฉันพยายามนำเข้าไฟล์นี้ลงใน Excel 2011 เขตข้อมูลจะมาพร้อมกับแบบอักษรที่อ่านไม่ได้ เมื่อฉันคัดลอกและวางสิ่งนี้ลงในซอฟต์แวร์ข้อความอย่างเดียว (TextMate อีกครั้งหรือแม้กระทั่งกล่องข้อความนี้) ฉันเห็นว่ามันแสดงอย่างถูกต้อง บางทีปัญหาของฉันจะได้รับการแก้ไขถ้าฉันสามารถเลือกแบบอักษรที่เหมาะสมใน Excel ฉันไม่แน่ใจ เมื่อฉันพูดภาษาจีนไม่ได้ฉันก็ไม่รู้จะเลือกยังไง ฉันขอความช่วยเหลือจากผู้พูดภาษาจีนที่นั่นฉันจำเป็นต้อง: ติดตั้งแบบอักษรพิเศษหรือไม่ เลือกแบบอักษรที่เหมาะสม (ซึ่งอาจมีอยู่ในคอมพิวเตอร์ของฉัน)? ติดตั้งความสามารถในการป้อนข้อมูลภาษาจีนให้กับระบบปฏิบัติการของฉันหรือไม่

0
วิธีถอดไฟล์ด้วยอักขระพิเศษ UTF-8 ใน Windows
ฉันต้องการแยกไฟล์ TAR ที่มีอักขระพิเศษ UTF-8 และเมื่อเปิดด้วย WinRAR และ PeaZip แสดงชื่อไฟล์เช่นคำถามเครื่องหมายและเมื่อแยกมันด้วย WinRAR และ 7-Zip เปลี่ยนชื่อไฟล์เป็นขีดแทนชื่อไฟล์ UTF-8 ดังนั้นจึงมี วิธีที่จะแยกมันออกด้วยการสนับสนุนชื่อไฟล์ UTF-8

0
วิธีการเมานต์ nfs ด้วยการสนับสนุน utf8 บนอูบุนตู?
ในระยะสั้นฉันมีเซิร์ฟเวอร์ Ubuntu 16.04 สองเครื่อง en_US.utf-8ทั้งสองของพวกเขาจะใช้ ตอนนี้ฉันทำตามบทช่วยสอนนี้เพื่อติดตั้ง nfs จากเซิร์ฟเวอร์หนึ่งไปยังเซิร์ฟเวอร์อื่น ฉันทำมันสำเร็จแล้ว แต่ยังมีปัญหาอยู่ บางไฟล์มีชื่อไฟล์ที่มีอักขระ utf-8 ซึ่งไม่สามารถแปลงได้อย่างถูกต้อง ตัวอย่างเช่นถ้าฉันจะคัดลอกไฟล์ชื่อจากลูกค้าไปยังเซิร์ฟเวอร์ก็จะกลายเป็น雷侯.txt??.txt ดังนั้นฉันจะทำให้มันทำงานอย่างไร
1 ubuntu  mount  unicode  nfs  utf-8 

2
UTF-8 ไม่ได้รับการยอมรับในกระบวนการชุดงาน SQL ผ่าน Putty
ฉันมีไฟล์. sql พร้อมคำสั่ง "แทรกลงใน" SQL แบบง่าย ๆ ซึ่งถูกแทรกลงในตารางที่เรียกว่าKünstler insert into Künstler (name) values ('Mariah Carey'); insert into Künstler (name) values ('Michael Jackson'); อย่างไรก็ตามเมื่อรันไฟล์ผ่าน Putty เพื่อรันคำสั่งเหล่านี้แต่ละบรรทัดจะพบกับข้อผิดพลาด During SQL processing it returned: SQL0007N The following on "insert into K" mark "▒" is invalid. ดูเหมือนว่าอักขระ umlaut เยอรมันจะถูกแปลงเป็น '▒' ฉันได้เปิดใช้งาน UTF-8 บน Putty และคำสั่งจะทำงานหากป้อนด้วยตนเอง …

2
การเปลี่ยนรูปแบบของเซลล์
ฉันมีแผ่นงาน Excel ที่หนึ่งในเซลล์มีสตริง "\ xab \ xcd \ xef" เป็นต้นดูเหมือนว่า Excel จะใช้สิ่งนี้เป็นสตริง ASCII "\ xab \ xcd \ xef" ฉันจะทำให้ Excel ถือว่าเป็นสตริงไบนารีด้วยไบต์ 0xab 0xcd 0xef เพื่อให้ฉันสามารถแปลงเป็น UTF-8 ได้อย่างไร

1
วิธีง่ายๆในการเพิ่มอักขระ UTF-8 ไว้ในไฟล์ข้อความโดยใช้ cmd คืออะไร
สิ่งที่ต้องการ: echo \ufeff > output.csv type input.csv >> output.csv \ufeffUTF-8 BOM อยู่ที่ไหนและinput.csvเป็นไฟล์ข้อความ UTF-8 ฉันจะระบุอักขระ UTF-8 เป็น cmd ได้อย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.