Kullback-Leibler divergence มีคุณสมบัติที่ดีเพียงไม่กี่อย่างหนึ่งในนั้นคือประเภทของผู้ที่เกลียดชังที่มีมวลที่ไม่เป็นโมฆะและมีมวลเป็นโมฆะ สิ่งนี้อาจดูเหมือนบั๊ก แต่จริงๆแล้วเป็นคุณลักษณะในบางสถานการณ์KL[q;p]q(x)p(x)
หากคุณกำลังพยายามที่จะหาการประมาณความซับซ้อน (ยาก) การกระจายโดย (ซูฮก) การกระจายตัวอย่าง
คุณต้องการที่จะแน่ใจจริงๆหรือว่า𝑥ใด ๆ ที่ไม่น่าจะเป็นมากที่จะได้มาจากนอกจากนี้ยังจะไม่น่าจะเป็นมากที่จะได้มาจาก(𝑥) KL นั้นมีคุณสมบัตินี้แสดงได้อย่างง่ายดาย: มีในอินทิกรัลและ เมื่อ𝑞 (𝑥) มีขนาดเล็ก แต่ไม่เป็นไร แต่เมื่อมีขนาดเล็กสิ่งนี้จะเติบโตอย่างรวดเร็วหากไม่เล็ก ดังนั้นหากคุณเลือกเพื่อย่อp(x)q(x)p(x)q(x)q(x)log[q(x)/p(x)]p(x)p(x)q(x)q(x)KL[q;p]มันเป็นไปไม่ได้มากที่จะกำหนดมวลจำนวนมากในภูมิภาคที่ใกล้ศูนย์q(x)p(x)
The Jensen-Shannon divergence ไม่มีคุณสมบัตินี้ มันทำงานได้ดีทั้งเมื่อและมีขนาดเล็ก ซึ่งหมายความว่ามันจะไม่ลงโทษเท่ากระจายจากการที่คุณสามารถลิ้มลองค่าที่เป็นไปไม่ได้ใน(𝑥)p(x)q(x)q(x)p(x)