สำหรับการจัดวางเรามีข้อความ "Lorem ipsum" ที่มีชื่อเสียงเพื่อทดสอบว่ามีลักษณะอย่างไร
สิ่งที่ฉันกำลังมองหาคือชุดไฟล์ที่มีข้อความที่เข้ารหัสด้วยการเข้ารหัสต่างๆที่ฉันสามารถใช้ในการทดสอบ JUnit เพื่อทดสอบวิธีการบางอย่างที่จัดการกับการเข้ารหัสอักขระเมื่ออ่านไฟล์ข้อความ
ตัวอย่าง:มีISO 8859-1
ไฟล์Windows-1252
ทดสอบที่เข้ารหัสและไฟล์ทดสอบที่เข้ารหัส ของ Windows 1252 จะเรียกความแตกต่างในภูมิภาค 80 16 - 9F 16 กล่าวอีกนัยหนึ่งคือต้องมีอักขระอย่างน้อยหนึ่งตัวของภูมิภาคนี้เพื่อแยกความแตกต่างจาก ISO 8859-1
ชุดไฟล์ทดสอบที่ดีที่สุดอาจเป็นที่ที่ไฟล์ทดสอบสำหรับการเข้ารหัสแต่ละรายการมีอักขระทั้งหมดเพียงครั้งเดียว แต่บางทีฉันอาจไม่รู้ถึง sth - เราทุกคนชอบสิ่งที่เข้ารหัสนี้ใช่มั้ย? :-)
มีชุดไฟล์ทดสอบสำหรับปัญหาการเข้ารหัสอักขระหรือไม่?