คำถามติดแท็ก character-encoding

การเข้ารหัสอักขระหมายถึงวิธีแสดงอักขระเป็นชุดของไบต์ การเข้ารหัสอักขระสำหรับเว็บถูกกำหนดในมาตรฐานการเข้ารหัส

4
มีชุดไฟล์“ Lorem ipsums” สำหรับทดสอบปัญหาการเข้ารหัสอักขระหรือไม่
สำหรับการจัดวางเรามีข้อความ "Lorem ipsum" ที่มีชื่อเสียงเพื่อทดสอบว่ามีลักษณะอย่างไร สิ่งที่ฉันกำลังมองหาคือชุดไฟล์ที่มีข้อความที่เข้ารหัสด้วยการเข้ารหัสต่างๆที่ฉันสามารถใช้ในการทดสอบ JUnit เพื่อทดสอบวิธีการบางอย่างที่จัดการกับการเข้ารหัสอักขระเมื่ออ่านไฟล์ข้อความ ตัวอย่าง: มีISO 8859-1ไฟล์Windows-1252ทดสอบที่เข้ารหัสและไฟล์ทดสอบที่เข้ารหัส ของ Windows 1252 จะเรียกความแตกต่างในภูมิภาค 80 16 - 9F 16 กล่าวอีกนัยหนึ่งคือต้องมีอักขระอย่างน้อยหนึ่งตัวของภูมิภาคนี้เพื่อแยกความแตกต่างจาก ISO 8859-1 ชุดไฟล์ทดสอบที่ดีที่สุดอาจเป็นที่ที่ไฟล์ทดสอบสำหรับการเข้ารหัสแต่ละรายการมีอักขระทั้งหมดเพียงครั้งเดียว แต่บางทีฉันอาจไม่รู้ถึง sth - เราทุกคนชอบสิ่งที่เข้ารหัสนี้ใช่มั้ย? :-) มีชุดไฟล์ทดสอบสำหรับปัญหาการเข้ารหัสอักขระหรือไม่?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.