ข้อความธรรมดาเป็นไบนารี
เมื่อคุณเขียนH
ลงในฮาร์ดไดรฟ์หัวเขียนไม่ได้แกะสลักเส้นแนวตั้งสองเส้นและเส้นแนวนอนเข้าไปในแผ่นเสียงมันเข้ารหัสบิตแม่เหล็ก01001000
1ลงในแผ่นเสียง
จากนั้นควรจะเห็นได้ชัดว่าการจัดเก็บข้อมูลข้อความล้วนใช้พื้นที่จำนวนเท่ากันกับการจัดเก็บข้อมูลไบนารี
แต่ธรรมดาเป็นเพียงหนึ่งใน2รูปแบบไบนารีโดยเฉพาะอย่างยิ่ง
ข้อความธรรมดาสามารถแปลงกลับเป็นรูปแบบไบนารีอื่น ๆ การแปลงสภาพทั่วไปอย่างหนึ่งคือการบีบอัดซึ่งโดยทั่วไปแล้วจะส่งผลให้เกิดการแทนแบบกะทัดรัดมากขึ้นหมายถึงบิตที่น้อยกว่าที่ใช้เพื่อแสดงข้อมูลเดียวกัน
คุณอาจใช้รูปแบบไบนารีที่แตกต่างกันเพื่อแสดงข้อมูลเดียวกันทั้งนี้ขึ้นอยู่กับสิ่งที่คุณใช้ข้อความธรรมดาเพื่อเป็นตัวแทน นี่อาจใช้พื้นที่มากขึ้นก็อาจใช้น้อย
ตัวอย่างเช่นตัวเลข5
และ1234567
สามารถแทนด้วยข้อความธรรมดาโดยใช้อักขระตัวเลขส่งผลให้ลำดับบิตเหล่านี้บนดิสก์3 :
00110101 00000000
00110001 00110010 00110011 00110100 00110101 00110110 00110111 00000000
หรือคุณสามารถใช้ส่วนประกอบ 32 บิตสอง :
00000000 00000000 00000000 00000101
00000000 00010010 11010110 10000111
ซึ่งเป็นตัวแทนที่มีขนาดกะทัดรัดน้อยแต่เป็นตัวแทนของขนาดกะทัดรัดมากขึ้น5
1234567
และมีตัวแทนจำนวนอื่น ๆ ที่ไม่มีขีด จำกัด อย่างแท้จริงซึ่งจะมีระดับความกะทัดรัดและความยืดหยุ่นที่แตกต่างกันถึงแม้ว่าในทางปฏิบัติจะน้อยกว่าการใช้ตัวแทนจำนวนมากจริง ๆ
1สมมติว่า UTF-8 ลำดับที่แน่นอนของบิตสำหรับอักขระขึ้นอยู่กับการเข้ารหัสเฉพาะที่คุณใช้
2หรือจริงๆหลายรูปแบบที่กำหนดต่างๆการเข้ารหัส
3หากคุณสงสัยว่าศูนย์ทั้งแปดนั้นคืออะไรคุณต้องมีวิธีรู้ระยะเวลาของข้อมูล ตัวเลือกโดยทั่วไปต้มลงไปที่เครื่องหมาย (ฉันใช้สิ่งนี้ผ่านทาง null ไบต์) พื้นที่ที่จัดเก็บความยาว (Pascal ใช้ไบต์เพื่อเก็บความยาวของสตริง) หรือขนาดคงที่ (ใช้ในส่วนเติมเต็มสอง ตัวอย่าง).