คำถามติดแท็ก utf-8

UTF-8 เป็นการเข้ารหัสอักขระที่อธิบายจุดโค้ด Unicode แต่ละจุดโดยใช้ลำดับไบต์หนึ่งถึงสี่ไบต์ มันเข้ากันได้ย้อนหลังกับ ASCII ในขณะที่ยังรองรับการแสดงจุดรหัส Unicode ทั้งหมด

16
UTF-8 ตลอดทาง
ฉันกำลังตั้งค่าเซิร์ฟเวอร์ใหม่และต้องการรองรับ UTF-8 อย่างเต็มที่ในเว็บแอปพลิเคชันของฉัน ฉันเคยลองสิ่งนี้ในอดีตบนเซิร์ฟเวอร์ที่มีอยู่และดูเหมือนจะจบลงเสมอเมื่อต้องย้อนกลับไปใช้ ISO-8859-1 ฉันต้องตั้งค่าการเข้ารหัส / ชุดอักขระที่ไหน ฉันรู้ว่าฉันต้องกำหนดค่า Apache, MySQL และ PHP ให้ทำเช่นนี้ - มีรายการตรวจสอบมาตรฐานบางอย่างที่ฉันสามารถติดตามได้หรืออาจแก้ไขปัญหาที่เกิดความไม่ตรงกันหรือไม่ นี่เป็นเซิร์ฟเวอร์ Linux ตัวใหม่ที่รัน MySQL 5, PHP, 5 และ Apache 2
1191 php  mysql  linux  apache  utf-8 



30
Excel เป็น CSV พร้อมการเข้ารหัส UTF8 [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน4 เดือนที่ผ่านมา ฉันมีไฟล์ Excel ที่มีอักขระภาษาสเปน (ตัวหนอนเป็นต้น) ที่ฉันต้องแปลงเป็นไฟล์ CSV เพื่อใช้เป็นไฟล์นำเข้า อย่างไรก็ตามเมื่อฉันบันทึกเป็น CSV มันจะรวมตัวอักษรสเปน "พิเศษ" ที่ไม่ใช่ตัวอักษร ASCII ดูเหมือนว่าจะทำเช่นนี้ด้วยเครื่องหมายคำพูดซ้ายและขวาและเครื่องหมายขีดกลางยาวที่ปรากฏว่ามาจากผู้ใช้ดั้งเดิมที่สร้างไฟล์ Excel ใน Mac เนื่องจาก CSV เป็นเพียงไฟล์ข้อความฉันแน่ใจว่ามันสามารถจัดการการเข้ารหัส UTF8 ได้ดังนั้นฉันจึงเดาว่ามันเป็นข้อ จำกัด ของ Excel แต่ฉันกำลังมองหาวิธีที่จะได้รับจาก Excel เป็น CSV และเก็บอักขระที่ไม่ใช่ ASCII ครบถ้วน
607 excel  encoding  csv  utf-8 

7
ทำไม Perl สมัยใหม่หลีกเลี่ยง UTF-8 โดยค่าเริ่มต้น
ฉันสงสัยว่าทำไมโซลูชั่นที่ทันสมัยที่สุดที่สร้างโดยใช้ Perl ไม่เปิดใช้งานUTF-8โดยค่าเริ่มต้น ฉันเข้าใจว่ามีปัญหาแบบดั้งเดิมสำหรับสคริปต์ Perl หลักซึ่งอาจทำให้เกิดปัญหา แต่จากมุมมองของฉันใน 21 เซนต์ศตวรรษโครงการขนาดใหญ่ใหม่ (หรือโครงการที่มีมุมมองขนาดใหญ่) ควรทำให้ซอฟต์แวร์ UTF-8 ของพวกเขาพิสูจน์จากรอยขีดข่วน ยังฉันไม่เห็นมันเกิดขึ้น ยกตัวอย่างเช่นMooseช่วยให้เข้มงวดและคำเตือน แต่ไม่Unicode โมเดิร์น :: Perlช่วยลดสำเร็จรูปสำเร็จรูป แต่ไม่มี UTF-8 จัดการ ทำไม? มีเหตุผลบางอย่างที่จะหลีกเลี่ยง UTF-8 ในโครงการ Perl ที่ทันสมัยในปี 2011 หรือไม่? ความคิดเห็น @tchrist ยาวเกินไปดังนั้นฉันจึงเพิ่มที่นี่ ดูเหมือนว่าฉันไม่ได้ทำให้ตัวเองชัดเจน ให้ฉันลองเพิ่มบางสิ่ง tchristและฉันเห็นว่าสถานการณ์ค่อนข้างคล้ายคลึงกัน แต่ข้อสรุปของเรานั้นสมบูรณ์ในทางตรงกันข้าม ฉันเห็นด้วยสถานการณ์ของ Unicode นั้นซับซ้อน แต่นี่เป็นเหตุผลว่าทำไมเรา (ผู้ใช้ Perl และ coders) ต้องการเลเยอร์ (หรือ pragma) ซึ่งทำให้การจัดการ UTF-8 …
557 perl  unicode  utf-8 

17
วิธีที่ดีที่สุดในการแปลงไฟล์ข้อความระหว่างชุดตัวละคร?
เครื่องมือหรือวิธีที่เร็วที่สุดและง่ายที่สุดในการแปลงไฟล์ข้อความระหว่างชุดอักขระคืออะไร โดยเฉพาะฉันต้องแปลงจาก UTF-8 เป็น ISO-8859-15 และในทางกลับกัน ทุกอย่างเป็นไปได้: หนึ่งใน liners ในภาษาสคริปต์ที่คุณชื่นชอบ, เครื่องมือบรรทัดคำสั่งหรือยูทิลิตี้อื่น ๆ สำหรับ OS, เว็บไซต์, ฯลฯ ทางออกที่ดีที่สุด: บน Linux / UNIX / OS X / cygwin: Gnu iconvแนะนำโดยTroels อาร์วินดีที่สุดคือใช้เป็นตัวกรอง ดูเหมือนว่าจะมีอยู่ทั่วไป ตัวอย่าง: $ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt ในฐานะที่เป็นแหลมออกโดยเบนมีการแปลงออนไลน์โดยใช้ iconv Gnu Recode ( คู่มือ ) แนะนำโดยCheekysoftจะแปลงหนึ่งหรือหลายไฟล์ในสถานที่ ตัวอย่าง: $ …


12
UTF-8, UTF-16 และ UTF-32
ความแตกต่างระหว่าง UTF-8, UTF-16 และ UTF-32 คืออะไร ฉันเข้าใจว่าพวกเขาจะเก็บ Unicode ทั้งหมดและแต่ละตัวใช้จำนวนไบต์ที่แตกต่างกันเพื่อแสดงอักขระ มีข้อได้เปรียบในการเลือกอย่างใดอย่างหนึ่งหรือไม่?
487 unicode  utf-8  utf-16  utf  utf-32 

12
การบันทึกข้อความ utf-8 ใน json.dumps เป็น UTF8 ไม่ใช่เป็น \ u escape sequence
รหัสตัวอย่าง: >>> import json >>> json_string = json.dumps("ברי צקלה") >>> print json_string "\u05d1\u05e8\u05d9 \u05e6\u05e7\u05dc\u05d4" ปัญหา: มันไม่ใช่มนุษย์ที่อ่านได้ ผู้ใช้ (สมาร์ท) ของฉันต้องการยืนยันหรือแก้ไขไฟล์ข้อความด้วยการทิ้ง JSON (และฉันไม่ต้องการใช้ XML) มีวิธีการทำให้เป็นอันดับวัตถุในสตริง UTF-8 JSON (แทน \uXXXX)?
474 python  json  unicode  utf-8  escaping 

27
เป็นไปได้หรือไม่ที่จะบังคับให้ Excel รับรู้ไฟล์ UTF-8 CSV โดยอัตโนมัติ
ฉันกำลังพัฒนาส่วนหนึ่งของแอปพลิเคชันที่รับผิดชอบในการส่งออกข้อมูลบางส่วนไปเป็นไฟล์ CSV แอปพลิเคชันใช้ UTF-8 เสมอเนื่องจากมีหลายภาษาในทุกระดับ แต่การเปิดไฟล์ CSV ดังกล่าว (ที่มีเครื่องหมายการออกเสียงเช่นตัวอักษรซีริลลิ, ตัวอักษรกรีก) ใน Excel Г„/Г¤, Г–/Г¶ไม่บรรลุผลที่คาดว่าจะแสดงสิ่งที่ต้องการ และฉันไม่รู้วิธีบังคับให้ Excel เข้าใจว่าไฟล์ CSV แบบเปิดถูกเข้ารหัสใน UTF-8 ฉันยังพยายามระบุ UTF-8 BOM EF BB BFแต่ Excel ไม่สนใจสิ่งนั้น มีวิธีแก้ปัญหาหรือไม่? PS เครื่องมือใดที่อาจมีพฤติกรรมเช่นเดียวกับ Excel UPDATE ฉันต้องบอกว่าฉันสับสนกับการตั้งคำถามของชุมชน เมื่อฉันถามคำถามนี้ฉันขอวิธีเปิดไฟล์ UTF-8 CSV ใน Excel โดยไม่มีปัญหาใด ๆ สำหรับผู้ใช้อย่างคล่องแคล่วและโปร่งใส แต่ผมใช้สูตรที่ไม่ถูกต้องขอให้ทำมันโดยอัตโนมัติ มันสับสนมากและขัดแย้งกับ VBA แมโครอัตโนมัติ มีสองคำตอบสำหรับคำถามนี้ที่ฉันขอขอบคุณมากที่สุด: คำตอบแรกโดย Alex https://stackoverflow.com/a/6002338/166589และฉันยอมรับคำตอบนี้แล้ว …
455 excel  csv  utf-8 


9
Unicode, UTF-8, UTF-16 คืออะไร
พื้นฐานของ Unicode คืออะไรและทำไมต้องใช้ UTF-8 หรือ UTF-16 ฉันได้ค้นคว้าสิ่งนี้บน Google และค้นหาที่นี่เช่นกัน แต่มันก็ไม่ชัดเจนสำหรับฉัน ใน VSS เมื่อทำการเปรียบเทียบไฟล์บางครั้งมีข้อความแจ้งว่าไฟล์ทั้งสองมีความแตกต่างของ UTF ทำไมถึงเป็นเช่นนี้? โปรดอธิบายด้วยคำศัพท์ง่ายๆ

14
วิธีทำให้ UTF-8 ทำงานบน Java webapps ได้อย่างไร
ฉันต้องการให้ UTF-8 ทำงานใน Java webapp ของฉัน (servlets + JSP, ไม่ใช้เฟรมเวิร์ก) เพื่อสนับสนุนäöåฯลฯ สำหรับข้อความภาษาฟินแลนด์ปกติและตัวอักษร Cyrillic เช่นЦжФกรณีพิเศษ การตั้งค่าของฉันมีดังต่อไปนี้: สภาพแวดล้อมการพัฒนา: Windows XP สภาพแวดล้อมการผลิต: Debian ฐานข้อมูลที่ใช้: MySQL 5.x ผู้ใช้ส่วนใหญ่ใช้ Firefox2 แต่ยังใช้ Opera 9.x, FF3, IE7 และ Google Chrome เพื่อเข้าถึงเว็บไซต์ ทำอย่างไรจึงจะได้สิ่งนี้?
367 java  mysql  tomcat  encoding  utf-8 

16
การตั้งค่าการเข้ารหัสอักขระ Java เริ่มต้น
ฉันจะตั้งค่าการเข้ารหัสอักขระเริ่มต้นที่ใช้โดย JVM (1.5.x) โดยทางโปรแกรมได้อย่างไร ฉันเคยอ่านที่-Dfile.encoding=whateverเคยเป็นวิธีที่จะไปสำหรับ JVM เก่า ฉันไม่มีความหรูหราด้วยเหตุผลที่ฉันจะไม่เข้าไป ฉันเหนื่อย: System.setProperty("file.encoding", "UTF-8"); และคุณสมบัติได้รับการตั้งค่า แต่ดูเหมือนจะไม่ทำให้การgetBytesโทรครั้งสุดท้ายด้านล่างใช้ UTF8: System.setProperty("file.encoding", "UTF-8"); byte inbytes[] = new byte[1024]; FileInputStream fis = new FileInputStream("response.txt"); fis.read(inbytes); FileOutputStream fos = new FileOutputStream("response-2.txt"); String in = new String(inbytes, "UTF8"); fos.write(in.getBytes());

3
อะไรคือความแตกต่างระหว่างชุดอักขระ utf8mb4 และ utf8 ใน MySQL?
ความแตกต่างระหว่างคืออะไรutf8mb4และutf8ชุดอักขระในMySQL ? ฉันรู้แล้วเกี่ยวกับการเข้ารหัสASCII , UTF-8 , UTF-16และUTF-32 ; แต่ฉันอยากจะรู้ว่าอะไรที่แตกต่างของutf8mb4กลุ่มการเข้ารหัสด้วยการเข้ารหัสประเภทอื่น ๆ ที่กำหนดไว้ในเซิร์ฟเวอร์ MySQL มีประโยชน์ / ข้อเสนอพิเศษในการใช้utf8mb4มากกว่าutf8หรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.