ความแตกต่างระหว่างระยะทาง Bhattacharyya และ KL divergence


33

ฉันกำลังมองหาคำอธิบายที่ใช้งานง่ายสำหรับคำถามต่อไปนี้:

ในสถิติและทฤษฎีข้อมูลความแตกต่างระหว่างระยะทาง Bhattacharyya และความแตกต่างของ KL เป็นมาตรการของความแตกต่างระหว่างการแจกแจงความน่าจะเป็นแบบแยกสองอันคืออะไร

พวกเขาไม่มีความสัมพันธ์อย่างแท้จริงและวัดระยะห่างระหว่างการแจกแจงความน่าจะเป็นสองแบบในลักษณะที่แตกต่างกันโดยสิ้นเชิงหรือไม่?

คำตอบ:


36

ค่าสัมประสิทธิ์ Bhattacharyyaถูกกำหนดให้เป็นและสามารถกลายเป็นระยะเป็นซึ่งเรียกว่าระยะ Hellinger การเชื่อมต่อระหว่างระยะทาง Hellingerนี้กับความแตกต่าง Kullback-Leiblerคือ d H ( P , Q ) d H ( P , Q ) = { 1 - D B ( P , Q ) } 1 / 2

DB(พี,Q)=พี(x)Q(x)dx
dH(พี,Q)
dH(พี,Q)={1-DB(พี,Q)}1/2
dKL(พีQ)2dH2(พี,Q)=2{1-DB(พี,Q)}.

อย่างไรก็ตามนี่ไม่ใช่คำถาม: ถ้าระยะทาง Bhattacharyyaถูกกำหนดเป็น

dB(พี,Q)=def-เข้าสู่ระบบDB(พี,Q),
จากนั้น
dB(p,q)=logDB(p,q)=logp(x)q(x)dx=deflogh(x)dx=logh(x)p(x)p(x)dxlog{h(x)p(x)}p(x)dx=12log{h2(x)p2(x)}p(x)dx=12log{q(x)p(x)}p(x)dx=12dKL(pq)
ดังนั้นความไม่เท่าเทียมกันระหว่าง ระยะทางสองระยะคือ
dKL(pq)2dB(p,q).
ใคร ๆ ก็สงสัยว่าความไม่เท่าเทียมนี้เกิดขึ้นจากคนแรก มันเป็นสิ่งที่ตรงกันข้าม: ตั้งแต่
log(x)1x0x1,
ป้อนคำอธิบายรูปภาพที่นี่

เรามีการสั่งซื้อที่สมบูรณ์

dKL(pq)2dB(p,q)2dH(p,q)2.

2
ยอดเยี่ยม! คำอธิบายนี้ควรเป็นสิ่งที่ฉันกำลังมองหาอย่างกระตือรือร้น คำถามสุดท้ายเพียงคำถามเดียว: ในกรณีใด (หรือ P และ Q ชนิดใด) ความไม่เท่าเทียมจะกลายเป็นความเท่าเทียมกัน?
JewelSue

1
ระบุว่าฟังก์ชั่นเป็นอย่างเคร่งครัดนูนผมจะถือว่าเป็นเพียงกรณีเพื่อความเท่าเทียมกันคือเมื่ออัตราส่วนเป็นค่าคงที่ในxlog()p(x)/q(x)x
ซีอาน

5
และกรณีเฉพาะเมื่อเป็นค่าคงที่ในคือเมื่อ Q p(x)/q(x)xp=q
ซีอาน

8

ฉันไม่ทราบถึงความสัมพันธ์ที่ชัดเจนระหว่างทั้งสอง แต่ตัดสินใจที่จะกระตุ้นพวกเขาอย่างรวดเร็วเพื่อดูสิ่งที่ฉันสามารถหาได้ ดังนั้นนี่ไม่ใช่คำตอบที่มากนัก แต่เป็นประเด็นที่น่าสนใจมากกว่า

เพื่อความง่ายเรามาหาการแจกแจงแบบแยก เราสามารถเขียนระยะทาง BC เป็น

dBC(p,q)=lnx(p(x)q(x))12

และ KL แตกต่างดังนี้

dKL(p,q)=xp(x)lnp(x)q(x)

ตอนนี้เราไม่สามารถดันล็อกภายในผลรวมกับระยะทางดังนั้นให้ลองดึงล็อกไปด้านนอกของ divergenceด้านนอก:BCKL

dKL(p,q)=lnx(q(x)p(x))p(x)

ลองพิจารณาพฤติกรรมของพวกเขาเมื่อถูกกำหนดให้มีการแจกแจงแบบสม่ำเสมอเหนือความเป็นไปได้ :pn

dKL(p,q)=lnnln(xq(x))1ndBC(p,q)=ln1nlnxq(x)

ทางด้านซ้ายเรามีบันทึกของบางสิ่งบางอย่างที่คล้ายกันในรูปแบบกับค่าเฉลี่ยเรขาคณิต ด้านขวาเรามีสิ่งที่คล้ายกับการเข้าสู่ระบบของมัชฌิมเลขคณิต อย่างที่ฉันพูดนี่ไม่ใช่คำตอบมากนัก แต่ฉันคิดว่ามันให้สัญชาตญาณเรียบร้อยว่าระยะทาง BC และความแตกต่าง KL ตอบสนองต่อการเบี่ยงเบนระหว่างและอย่างไรpq

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.