Cross entropy นั้นเหมือนกับ KL divergence บวกกับเอนโทรปีของการกระจายเป้าหมาย KL เท่ากับศูนย์เมื่อทั้งสองการแจกแจงเหมือนกันซึ่งดูเหมือนง่ายสำหรับฉันมากกว่าเอนโทรปีของการกระจายเป้าหมายซึ่งเป็นสิ่งที่เอนโทรปีของการจับคู่ข้ามตรงกัน
ฉันไม่ได้บอกว่ามีข้อมูลเพิ่มเติมในอีกเรื่องหนึ่งยกเว้นว่ามุมมองของมนุษย์อาจพบว่าศูนย์ใช้งานง่ายกว่าเชิงบวก แน่นอนหนึ่งมักจะใช้วิธีการประเมินเพื่อดูว่าการจัดหมวดหมู่เกิดขึ้นได้ดีเพียงใด แต่ทางเลือกของเอนโทรปีในประวัติศาสตร์ KL คืออะไร?