รหัส Huffman สำหรับการกระจายความน่าจะเป็นเป็นรหัสคำนำหน้าด้วยขั้นต่ำถัวเฉลี่ยถ่วงน้ำหนักความยาว codeword ที่คือความยาวของ TH codword มันเป็นทฤษฎีบทที่รู้จักกันดีว่าความยาวเฉลี่ยต่อสัญลักษณ์ของรหัส Huffman อยู่ระหว่างและ , ที่คือเอนโทรปีของ Shannon ของการแจกแจงความน่าจะเป็น
ตัวอย่างที่ไม่ดีของบัญญัติซึ่งความยาวเฉลี่ยเกินกว่าเอนโทรปีของแชนนอนเกือบ 1 คือการแจกแจงความน่าจะเป็นเช่นโดยที่เอนโทรปีมีค่าเกือบ 0 และความยาว codeword เฉลี่ยคือ 1 ระหว่างเอนโทรปีและความยาว codeword เกือบ1
แต่จะเกิดอะไรขึ้นเมื่อมีการจำกัดความน่าจะเป็นที่ใหญ่ที่สุดในการแจกแจงความน่าจะเป็น ตัวอย่างเช่นสมมติว่าความน่าจะเป็นทั้งหมดน้อยกว่า . ช่องว่างที่ใหญ่ที่สุดที่ฉันสามารถหาได้ในกรณีนี้คือการแจกแจงความน่าจะเป็นเช่นซึ่งเอนโทรปีมีค่ามากกว่า 1 เล็กน้อยและความยาว codeword เฉลี่ยน้อยกว่า 1.5 เล็กน้อยทำให้ช่องว่างใกล้เข้ามา. นี่เป็นสิ่งที่ดีที่สุดที่คุณสามารถทำได้หรือไม่? คุณสามารถให้ขอบเขตบนของช่องว่างที่น้อยกว่า 1 สำหรับกรณีนี้ได้หรือไม่?
ทีนี้ลองพิจารณากรณีที่ความน่าจะเป็นทั้งหมดเล็กมาก สมมติว่าคุณเลือกกระจายความน่าจะมากกว่าตัวอักษรแต่ละคนมีความน่าจะเป็น M ในกรณีนี้ช่องว่างที่ใหญ่ที่สุดเกิดขึ้นหากคุณเลือก 2 ที่นี่คุณจะได้ช่องว่างประมาณ
คำถามนี้ได้รับแรงบันดาลใจจากนี้คำถาม TCS Stackexchange