คำถามติดแท็ก utf-8

UTF-8 เป็นการเข้ารหัสอักขระที่อธิบายจุดโค้ด Unicode แต่ละจุดโดยใช้ลำดับไบต์หนึ่งถึงสี่ไบต์ มันเข้ากันได้ย้อนหลังกับ ASCII ในขณะที่ยังรองรับการแสดงจุดรหัส Unicode ทั้งหมด

4
ตั้งค่าการเข้ารหัสไฟล์เป็น UTF8 ด้วย BOM ใน Sublime Text 3
เมื่อฉันเปิดไฟล์ใน Sublime Text 3 ที่ด้านล่างฉันมีตัวเลือกให้ตั้งค่าการเข้ารหัสอักขระดังที่แสดงในภาพหน้าจอ มีตัวเลือกในการตั้งค่าเป็นUTF-8ซึ่งหลังจากทำการวิจัยบางอย่างหมายถึง UTF-8 ไม่มี BOM แต่ฉันต้องการตั้งค่าเป็นUTF-8 ด้วย BOMดังที่แสดงด้านล่าง: ฉันจะทำสิ่งนี้จากภายใน ST3 ได้อย่างไร?

13
Java เทียบเท่ากับ encodeURIComponent ของ JavaScript ที่สร้างเอาต์พุตที่เหมือนกัน?
ฉันได้ทดลองใช้โค้ด Java หลายบิตโดยพยายามสร้างสิ่งที่จะเข้ารหัสสตริงที่มีเครื่องหมายคำพูดช่องว่างและอักขระ Unicode "แปลกใหม่" และสร้างเอาต์พุตที่เหมือนกับฟังก์ชันencodeURIComponentของ JavaScript สตริงการทดสอบการทรมานของฉันคือ"A" B ± " หากฉันป้อนคำสั่ง JavaScript ต่อไปนี้ใน Firebug: encodeURIComponent('"A" B ± "'); - จากนั้นฉันจะได้รับ: "%22A%22%20B%20%C2%B1%20%22" นี่คือโปรแกรม Java ทดสอบเล็กน้อยของฉัน: import java.io.UnsupportedEncodingException; import java.net.URLEncoder; public class EncodingTest { public static void main(String[] args) throws UnsupportedEncodingException { String s = "\"A\" B ± \""; System.out.println("URLEncoder.encode returns …

6
การเข้ารหัสอักขระ JSON - UTF-8 ได้รับการสนับสนุนอย่างดีจากเบราว์เซอร์หรือฉันควรใช้ลำดับการหลีกเลี่ยงตัวเลข
ฉันกำลังเขียนเว็บเซอร์ที่ใช้ json เพื่อแสดงถึงทรัพยากรและฉันรู้สึกติดขัดเล็กน้อยเกี่ยวกับวิธีที่ดีที่สุดในการเข้ารหัส json การอ่าน json rfc ( http://www.ietf.org/rfc/rfc4627.txt ) เป็นที่ชัดเจนว่าการเข้ารหัสที่ต้องการคือ utf-8 แต่ rfc ยังอธิบายกลไกการหลีกเลี่ยงสตริงสำหรับการระบุอักขระ ฉันคิดว่าโดยทั่วไปจะใช้เพื่อหลีกเลี่ยงอักขระที่ไม่ใช่ ascii ดังนั้นจึงทำให้ utf-8 เป็นผลลัพธ์ที่ถูกต้อง ascii สมมติว่าฉันมีสตริง json ที่มีอักขระ Unicode (จุดรหัส) ที่ไม่ใช่ ascii บริการเว็บของฉันควรเข้ารหัสเพียง utf-8 แล้วส่งคืนหรือควรหลีกเลี่ยงอักขระที่ไม่ใช่ ascii ทั้งหมดและส่งคืน ascii บริสุทธิ์ ฉันต้องการให้เบราว์เซอร์สามารถเรียกใช้ผลลัพธ์โดยใช้ jsonp หรือ eval มีผลต่อการตัดสินใจหรือไม่? ฉันขาดความรู้เกี่ยวกับการรองรับจาวาสคริปต์ของเบราว์เซอร์ต่างๆสำหรับ utf-8 แก้ไข: ฉันต้องการชี้แจงว่าความกังวลหลักของฉันเกี่ยวกับวิธีการเข้ารหัสผลลัพธ์นั้นเกี่ยวกับการจัดการผลลัพธ์ของเบราว์เซอร์จริงๆ สิ่งที่ฉันอ่านระบุว่าเบราว์เซอร์อาจไวต่อการเข้ารหัสเมื่อใช้ JSONP โดยเฉพาะ ฉันไม่พบข้อมูลที่ดีเกี่ยวกับเรื่องนี้ดังนั้นฉันจะต้องเริ่มทำการทดสอบเพื่อดูว่าเกิดอะไรขึ้น ตามหลักการแล้วฉันต้องการหลีกเลี่ยงอักขระเพียงไม่กี่ตัวที่จำเป็นและเพียงแค่ utf-8 …

5
ดีจริงข้อมูลการทดสอบ UTF-8 ไม่ดี [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน3 ปีที่ผ่านมา ปรับปรุงคำถามนี้ ดังนั้นเราจึงมีเอกสารโกง XSSเพื่อทดสอบการกรอง XSS ของเรา - แต่นอกเหนือจากหน้าตัวอย่างที่ไม่เป็นอันตรายฉันไม่พบข้อมูลการทดสอบที่ชั่วร้ายหรือผิดรูปแบบเพื่อให้แน่ใจว่ารหัส UTF-8 ของฉันสามารถจัดการข้อมูลที่ผิดพลาดได้ จะหาข้อมูลดีๆมาทดสอบได้ที่ไหน หรือลำดับตัวอักษรที่ยุ่งยากคืออะไร?
89 unicode  utf-8 

13
บันทึกไฟล์ทั้งหมดในโครงการ Visual Studio เป็น UTF-8
ฉันสงสัยว่าเป็นไปได้ไหมที่จะบันทึกไฟล์ทั้งหมดในโครงการ Visual Studio 2008 ลงในการเข้ารหัสอักขระเฉพาะ ฉันได้รับโซลูชันที่มีการเข้ารหัสแบบผสมและฉันต้องการทำให้มันเหมือนกันทั้งหมด (UTF-8 พร้อมลายเซ็น) ฉันรู้วิธีบันทึกไฟล์เดียว แต่ไฟล์ทั้งหมดในโปรเจ็กต์ล่ะ

13
<0xEF, 0xBB, 0xBF> อักขระที่แสดงในไฟล์ จะลบออกได้อย่างไร?
ฉันกำลังบีบอัดไฟล์ JavaScript และคอมเพรสเซอร์บ่นว่าไฟล์ของฉันมีอักขระอยู่ในนั้น ฉันจะค้นหาอักขระเหล่านี้และลบออกได้อย่างไร
87 file  unicode  utf-8  utf 

6
การใช้ 'use utf8;' ให้ฉัน 'ตัวอักษรกว้างในการพิมพ์'
หากฉันเรียกใช้โปรแกรม Perl ต่อไปนี้: perl -e 'use utf8; print "鸡\n";' ฉันได้รับคำเตือนนี้: Wide character in print at -e line 1. ถ้าฉันเรียกใช้โปรแกรม Perl นี้: perl -e 'print "鸡\n";' ฉันไม่ได้รับคำเตือน ฉันคิดว่าuse utf8จำเป็นต้องใช้อักขระ UTF-8 ในสคริปต์ Perl เหตุใดจึงไม่ได้ผลและฉันจะแก้ไขได้อย่างไร ฉันใช้ Perl 5.16.2 ฉันมีปัญหาเดียวกันหากสิ่งนี้อยู่ในไฟล์แทนที่จะเป็นซับในบรรทัดคำสั่ง
86 perl  unicode  utf-8 

1
WebClientDownloadString ส่งผลให้อักขระที่ยุ่งเหยิงเนื่องจากปัญหาการเข้ารหัส แต่เบราว์เซอร์ไม่เป็นไร
รหัสต่อไปนี้: var text = (new WebClient()).DownloadString("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&amp;start=0&amp;max_results=20")); ส่งผลให้ตัวแปรtextมีสตริงเหนือสิ่งอื่นใด "$ κ $ -Minkowski สเปซฟิลด์สเกลาร์และปัญหาความไม่แปรเปลี่ยนของลอเรนซ์" อย่างไรก็ตามเมื่อฉันไปที่ URL นั้นใน Firefox ฉันจะได้รับ $ κ $ -Minkowski สเปซฟิลด์สเกลาร์และปัญหาความไม่แปรเปลี่ยนของลอเรนซ์ ซึ่งถูกต้องจริง ฉันยังพยายาม var data = (new WebClient()).DownloadData("http://export.arxiv.org/api/query?search_query=au:Freidel_L*&amp;start=0&amp;max_results=20"); var text = System.Text.UTF8Encoding.Default.GetString(data); แต่สิ่งนี้ทำให้เกิดปัญหาเดียวกัน ฉันไม่แน่ใจว่าความผิดอยู่ที่นี่ ฟีดโกหกเกี่ยวกับการเข้ารหัส UTF8 หรือไม่และเบราว์เซอร์ฉลาดพอที่จะคิดออก แต่ไม่WebClient? ฟีดมีการเข้ารหัส UTF8 อย่างถูกต้อง แต่WebClientล้มเหลวด้วยวิธีอื่นหรือไม่ ฉันจะทำอย่างไรเพื่อลดปัญหานี้

1
วิธีแก้ไข 'ไม่พบไฟล์แผนที่อักขระ `UTF-8'
ฉันกำลังตั้งค่าคอนเทนเนอร์ UBI rhel8 ฉันต้องการรันคำสั่งนี้: localedef -f UTF-8 -i en_US en_US.UTF-8 ซึ่งล้มเหลวด้วย: character map file `UTF-8' not found: No such file or directory cannot read character map directory `/usr/share/i18n/charmaps': No such file or directory
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.