วิกิพีเดียจะกำหนดข้ามเอนโทรปีของการแจกแจงแบบแยกส่วนและให้เป็น
ใครเป็นคนแรกที่เริ่มใช้ปริมาณนี้ และใครเป็นคนคิดค้นคำนี้ ฉันดูใน:
JE Shore และ RW Johnson "หลักการที่ได้มาจากหลักการของเอนโทรปีสูงสุดและหลักการของการข้ามเอนโทรปีขั้นต่ำ" ทฤษฎีข้อมูลธุรกรรม IEEE บนฉบับที่ หมายเลข 26 1, pp. 26-37, ม.ค. 1980
ฉันทำตามคำแนะนำของพวกเขา
A. Wehrl, "คุณสมบัติทั่วไปของเอนโทรปี" ความคิดเห็นเกี่ยวกับฟิสิกส์ยุคใหม่ 50, ไม่ 2, pp. 221-260, เม.ย. 1978
ใครไม่เคยใช้คำ
ไม่เช่นนั้น
S. Kullback และ R. Leibler, "ข้อมูลและความพอเพียง" พงศาวดารของสถิติทางคณิตศาสตร์, ฉบับที่ 22, ไม่มี 1, pp. 79-86, 1951
ฉันมองเข้าไป
TM Cover และ JA Thomas องค์ประกอบของข้อมูลทฤษฎี (ซีรี่ส์ Wiley ในการสื่อสารโทรคมนาคมและการประมวลผลสัญญาณ) Wiley-Interscience, 2006
และ
I. ดี "เอนโทรปีสูงสุดสำหรับการกำหนดสมมติฐานโดยเฉพาะอย่างยิ่งสำหรับตารางฉุกเฉินหลายมิติ" พงศาวดารของสถิติคณิตศาสตร์ฉบับที่ 19 หมายเลข 34 3, pp. 911-934, 1963
แต่เอกสารทั้งสองกำหนด cross-entropy ให้ตรงกันกับ KL-divergence
กระดาษต้นฉบับ
CE Shannon, "ทฤษฎีคณิตศาสตร์แห่งการสื่อสาร," วารสารเทคนิคระบบกระดิ่ง, ฉบับที่ 27, 2491
ไม่ได้กล่าวถึงเอนโทรปีของการข้าม (และมีคำจำกัดความที่แปลกของ "เอนโทรปีสัมพัทธ์": "อัตราส่วนของเอนโทรปีของแหล่งข้อมูลต่อค่าสูงสุดที่อาจมีในขณะที่ยังคง จำกัด อยู่ที่สัญลักษณ์เดียวกัน")
ในที่สุดฉันดูหนังสือและเอกสารเก่า ๆ ของ Tribus
ไม่มีใครรู้ว่าสิ่งที่เรียกว่าสมการข้างต้นและผู้ที่คิดค้นมันหรือมีการนำเสนอที่ดีของมัน?