คำถามติดแท็ก text-encoding

8
เหตุใดจึงมีการเข้ารหัส Unicode หลายตัว
ฉันคิดว่า Unicode ได้รับการออกแบบมาเพื่อแก้ไขปัญหาทั้งหมดของการเข้ารหัสที่แตกต่างกันมากมายเนื่องจากพื้นที่ที่อยู่ขนาดเล็ก (8 บิต) ในการพยายามก่อนหน้าส่วนใหญ่ (ASCII ฯลฯ ) ทำไมจึงมีการเข้ารหัส Unicode จำนวนมาก แม้แต่รุ่นเดียวกัน (เป็นหลัก) หลายรุ่นเช่น UTF-8, UTF-16 เป็นต้น

4
ทำไม UTF-8 ถึงเสียหลายบิตในการเข้ารหัส
ตามบทความ Wikipedia , UTF-8 มีรูปแบบนี้: รหัสแรกรหัสล่าสุดไบต์ไบต์ 1 ไบต์ 2 ไบต์ 3 ไบต์ 4 จุดจุดที่ใช้ U + 0000 U + 007F 1 0xxxxxxx U + 0080 U + 07FF 2 110xxxxx 10xxxxxx U + 0800 U + FFFF 3 1110xxxx 10xxxxxx 10xxxxxx U + 10000 U + 1FFFFF 4 11110xxx 10xxxxxx …

4
ฉันสามารถใช้การเข้ารหัสชนิดใดเพื่อทำให้สตริงสั้นลงได้
ฉันสนใจในการเข้ารหัสสตริงที่ฉันมีและฉันอยากรู้ว่ามีการเข้ารหัสประเภทใดบ้างที่สามารถใช้ได้ซึ่งจะรวมเฉพาะอักขระอัลฟ่าและตัวเลขและควรลดจำนวนอักขระที่ต้องใช้เพื่อเป็นตัวแทนสตริง จนถึงตอนนี้ฉันได้ดูการใช้การเข้ารหัส Base64 เพื่อทำสิ่งนี้ แต่ดูเหมือนว่าจะทำให้สตริงของฉันยาวขึ้นและบางครั้งก็รวมถึง==สิ่งที่ฉันต้องการหลีกเลี่ยง ตัวอย่าง: ชื่อทดสอบ | 120101 กลายเป็น dGVzdCBuYW1lfDEyMDEwMQ == ซึ่งเพิ่มจาก 16 ถึง 24 อักขระและรวมถึงตัวอักษรและตัวเลขที่ไม่ใช่ ไม่มีใครรู้ว่าการเข้ารหัสชนิดอื่นที่ฉันสามารถใช้เพื่อให้บรรลุความต้องการของฉันได้หรือไม่? คะแนนโบนัสหากมันอยู่ภายในกรอบ. NET หรือมีห้องสมุดบุคคลที่สามที่จะทำการเข้ารหัส
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.