KL มีความหมายลึกเมื่อคุณมองเห็นชุดของฟันเป็นท่อร่วมในเมตริกซ์ฟิชเชอร์มันจะให้ระยะทางมาตราส่วนระหว่างการกระจาย "ปิด" สองครั้ง อย่างเป็นทางการ:
ds2=2KL(p(x,θ),p(x,θ+dθ))
บรรทัดต่อไปนี้อยู่ที่นี่เพื่ออธิบายรายละเอียดความหมายของสูตรทางคณิตศาสตร์ las
ความหมายของตัวชี้วัดฟิชเชอร์
พิจารณาครอบครัว parametrized ของการกระจายความน่าจะเป็น (กำหนดโดยความหนาแน่นใน ) ที่เป็นตัวแปรสุ่มและ theta เป็นพารามิเตอร์ใน P คุณอาจทราบว่าเมทริกซ์ข้อมูลการฟิชเชอร์คือR n x R p F = ( F ฉันj )D=(f(x,θ))RnxRpF=(Fij)
Fij=E[d(logf(x,θ))/dθid(logf(x,θ))/dθj]
ด้วยสัญกรณ์นี้คือ riemannian manifold และเป็นเมตริกซ์ Riemannian (ความสนใจของตัวชี้วัดนี้ได้รับจากทฤษฎีบทขอบเขตล่าง Rao Cramer)F ( θ )DF(θ)
คุณอาจพูดว่า ... ตกลงทางคณิตศาสตร์ที่เป็นนามธรรม แต่ KL อยู่ที่ไหน
มันไม่ได้เป็นนามธรรมทางคณิตศาสตร์ถ้าคุณสามารถจินตนาการความหนาแน่น parametrized ของคุณเป็นเส้นโค้ง (แทนที่จะเป็นส่วนย่อยของพื้นที่ของมิติที่ไม่มีที่สิ้นสุด) และเชื่อมต่อกับความโค้งของเส้นโค้งนั้น ... (ดู กระดาษน้ำเชื้อของ Bradley Efron http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176343282 )F 11p=1F11
คำตอบทางเรขาคณิตเพื่อเป็นส่วนหนึ่งของจุด / ในคำถามของคุณ:ระยะทางกำลังสองระหว่างการแจกแจงสองแบบ (ปิด)และบนนานา (คิดว่า ระยะทางธรณีวิทยาบนโลกของสองจุดที่อยู่ใกล้มันเกี่ยวข้องกับความโค้งของโลก) ได้รับจากสมการกำลังสอง: p ( x , θ ) p ( x , θ + d θ )ds2p(x,θ)p(x,θ+dθ)
ds2=∑Fijdθidθj
และเป็นที่รู้กันว่าเป็นสองเท่าของ Kullback Leibler Divergence:
ds2=2KL(p(x,θ),p(x,θ+dθ))
หากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับเรื่องนี้ฉันขอแนะนำให้อ่านกระดาษจาก Amari
http://projecteuclid.org/DPubS?service=UI&version=1.0&verb=Display&handle=euclid.aos/1176345779
(ฉันคิดว่ายังมีหนังสือจาก Amari เกี่ยวกับ เรขาคณิต riemannian ในสถิติ แต่ฉันจำชื่อไม่ได้)