เอนโทรปีของแชนนอนเป็นปริมาณที่สร้างความพึงพอใจให้กับชุดของความสัมพันธ์
ในระยะสั้นลอการิทึมจะทำให้มันเติบโตเป็นเส้นตรงกับขนาดของระบบและ "ทำตัวเหมือนข้อมูล"
วิธีแรกที่เอนโทรปีของการโยนเหรียญครั้งคือคูณเอนโทรปีของการโยนเหรียญ:nn
- ∑i = 12n12nเข้าสู่ระบบ( 1)2n) =- ∑i = 12n12nไม่มีบันทึก( 1)2)=n(−∑i=1212log(12))=n.
หรือเพื่อดูว่ามันทำงานอย่างไรเมื่อโยนสองเหรียญที่แตกต่างกัน (อาจไม่ยุติธรรม - โดยมีหัวที่มีความน่าจะเป็นและก้อยสำหรับเหรียญแรกและและเป็นครั้งที่สอง)
ดังนั้นคุณสมบัติของลอการิทึม (ลอการิทึมของผลิตภัณฑ์คือผลรวม ของลอการิทึม) มีความสำคัญp1p2q1q2−∑i=12∑j=12piqjlog(piqj)=−∑i=12∑j=12piqj(log(pi)+log(qj) )
= - ∑i=12∑j=12piqjlog(pi)−∑i=12∑j=12piqjlog(qj)=−∑i=12pilog(pi)−∑j=12qjlog(qj)
แต่Rényiเอนโทรปีมีคุณสมบัตินี้ (มันเป็นเอนโทรปี parametrized ด้วยจำนวนจริงซึ่งกลายเป็นนอนส์เอนโทรปีสำหรับ )αα→1
อย่างไรก็ตามนี่คือคุณสมบัติที่สอง - เอนโทรปีของแชนนอนนั้นเป็นสิ่งพิเศษเนื่องจากเกี่ยวข้องกับข้อมูล ที่จะได้รับความรู้สึกที่ใช้งานง่ายบางอย่างที่คุณสามารถดู
เป็นค่าเฉลี่ยของp)H=∑ipilog(1pi)
log(1/p)
เราสามารถเรียกข้อมูล ทำไม? เพราะถ้าเหตุการณ์ทั้งหมดเกิดขึ้นกับความน่าจะเป็นหมายความว่ามีเหตุการณ์เพื่อบอกว่าเหตุการณ์ใดเกิดขึ้นเราต้องใช้บิต (แต่ละบิตเพิ่มจำนวนเหตุการณ์ที่เราสามารถแยกได้เป็นสองเท่า)log(1/p)p1/plog(1/p)
คุณอาจรู้สึกกังวล "ตกลงถ้าเหตุการณ์ทั้งหมดมีความน่าจะเป็นแบบเดียวกันมันก็สมเหตุสมผลที่จะใช้เป็นตัวชี้วัดของข้อมูล แต่ถ้าไม่ใช่เหตุการณ์นั้นทำไมข้อมูลเฉลี่ยถึงสมเหตุสมผล?" - และมันเป็นเรื่องธรรมชาติlog(1/p)
แต่มันกลับกลายเป็นว่ามันทำให้รู้สึก - แหล่งที่มานอนส์เข้ารหัสทฤษฎีบทบอกว่าสตริงที่มีตัวอักษร uncorrelted กับความน่าจะเป็นความยาวไม่สามารถบีบอัด (โดยเฉลี่ย) สตริงไบนารีสั้นกว่าH และในความเป็นจริงเราสามารถใช้Huffman การเข้ารหัสในการบีบอัดสตริงและได้รับมากใกล้เคียงกับH{pi}inn Hn Hn H
ดูสิ่งนี้ด้วย: