คุณภาพคืออะไรเอนโทรปี


15

คำถามนี้ให้คำจำกัดความเชิงปริมาณของเอนโทรปีข้ามในแง่ของสูตร

ฉันกำลังมองหาความหมายที่คาดการณ์เพิ่มเติมวิกิพีเดียพูดว่า:

ในทฤษฎีสารสนเทศ, การข้ามเอนโทรปีระหว่างการแจกแจงความน่าจะเป็นสองครั้งเป็นการวัดจำนวนเฉลี่ยของบิตที่จำเป็นในการระบุเหตุการณ์จากชุดของความเป็นไปได้, หากใช้การเข้ารหัสแบบแผนบนพื้นฐานของการแจกแจงความน่าจะเป็นที่กำหนด .

ฉันได้เน้นส่วนที่ทำให้ฉันมีปัญหาในการทำความเข้าใจนี้ ฉันต้องการคำจำกัดความที่ดีซึ่งไม่จำเป็นต้องมีความเข้าใจในเอนโทรปี


1
คุณกำลังขอคำจำกัดความของcross -entropy ที่ในเวลาเดียวกันจะกำหนดเอนโทรปีของตัวเอง และอย่างสังหรณ์ดังนั้น ... หากคุณมีปัญหาในการทำความเข้าใจแนวคิดของเอนโทรปีมันจะเป็นความคิดที่ดีที่จะเข้าใจแนวคิดพื้นฐานก่อนแล้วจึงขยายส่วนใดส่วนหนึ่ง
Alecos Papadopoulos

1
โดยส่วนตัวฉันมีความเข้าใจพื้นฐานเกี่ยวกับเอนโทรปี (แม้ว่าจะใช้เวลาเกือบ 12 เดือนแล้วตั้งแต่ฉันสมัคร) แต่การแสดงออกเชิงปริมาณของเอนโทรปีควรจะพอดีในย่อหน้าสั้น ๆ และการข้ามเอนโทรปีควรจะใช้อีกหนึ่ง ดังนั้นฉันรู้สึกว่าคำตอบที่ดีอาจรวมถึงทั้งสองอย่างเพื่อให้ผู้อ่านไม่จำเป็นต้องอ้างอิงที่อื่นเพื่อทำความเข้าใจ
Lyndon White

ดูโพสต์ที่เกี่ยวข้อง: stats.stackexchange.com/questions/66186/… และ stats.stackexchange.com/questions/188903/…
kjetil b halvorsen

คำตอบ:


23

plog2(1/p)บิต (ทำไม? ดูคำตอบของฉันเรื่อง "บทบาทของลอการิทึมในเอนโทรปีนอนส์คืออะไร?" )

ipilog2(1pi),
ที่อยู่, แชนนอนเอนโทรปีของการกระจายความน่าจะเป็นต้นฉบับ

PQ

ipicode_length(i)=ipilog2(1qi),
ipilog2(1pi)

ยกตัวอย่างเช่นลองพิจารณาตัวอักษรสี่ตัวอักษร (A, B, C, D) แต่ด้วย A และ B ที่มีความถี่และ C และ D เท่ากันจะไม่ปรากฏเลย ความน่าจะเป็นก็คือP=(12,12,0,0)

ถ้าเราต้องการเข้ารหัสอย่างเหมาะสมเราจะเข้ารหัส A เป็น 0 และ B เป็น 1 ดังนั้นเราจึงได้รับข้อความที่เข้ารหัสหนึ่งบิตต่อตัวอักษรหนึ่งตัว (และมันก็คือเอนโทรปีของการแจกแจงความน่าจะเป็นของแชนนอน)

PQ=(14,14,14,14)


คำอธิบายที่ดีขอบคุณ อย่างไรก็ตามนิยามของวิกิพีเดียคือ sum_i [p_i * log (q_i)] การใช้ 1 / q_i ของคุณให้จำนวนสถานะที่เป็นไปได้ดังนั้น log_2 จะแปลงเป็นจำนวนบิตที่จำเป็นในการเข้ารหัสสัญลักษณ์เดียว แต่หน้าวิกิพีเดียอธิบายบางสิ่งที่แตกต่างอย่างละเอียด
redcalx

4
@locster ใน Wikipedia มีเครื่องหมายลบหน้าผลรวมซึ่งเท่ากับการมี 1/Qผม, เช่น เข้าสู่ระบบ(1/Qผม)=-เข้าสู่ระบบ(Qผม).
Piotr Migdal
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.