ข้อดีของระยะทางของ Jeffries Matusita


11

ตามกระดาษที่ฉันกำลังอ่านมีการใช้ระยะทางของ Jeffries และ Matusita แต่ฉันไม่สามารถหาข้อมูลได้มากนักยกเว้นสูตรด้านล่าง

JMD (x, y) =(xi2yi2)22

มันคล้ายกับระยะทางแบบยุคลิดยกเว้นสแควร์รูท

E (x, y) =(xiyi)22

ระยะทาง JM นั้นเชื่อถือได้มากกว่าระยะทางแบบยุคลิดในแง่ของการจำแนกประเภท ทุกคนสามารถอธิบายได้หรือไม่ว่าทำไมความแตกต่างนี้ทำให้ระยะทาง JM ดีขึ้น?


1
ฉันไม่พบการอ้างอิงที่เชื่อถือได้ซึ่งใช้สูตรนี้สำหรับระยะทาง Jeffries-Matusita สูตรที่ฉันค้นหานั้นมีพื้นฐานมาจากเมทริกซ์ความแปรปรวนร่วมสำหรับสองคลาสและดูเหมือนจะไม่มีความสัมพันธ์กับที่ระบุในที่นี้ แต่ดูเหมือนว่าอาจมีสิ่งที่แตกต่างกันสองชื่อ (หรือมากกว่า) คุณสามารถให้การอ้างอิงหรือ (ยิ่งดีกว่า) ลิงค์? BTW,และนับโดยบังเอิญหรือไม่? (ถ้าเป็นเช่นนั้นมีการตีความสูตรของคุณตามธรรมชาติ)y ฉันxiyi
whuber

1
@whuber: บางทีและอาจจะอยู่ในและy p ( x ) q ( x )xyp(x)q(x)
user603

@ user603 ใช่ฉันคิดว่าคุณได้รับแล้ว ตอนนี้การเชื่อมต่อกับ KL แตกต่างและการวัด Battacharyya ชัดเจน
whuber

คำตอบ:


14

ความแตกต่างที่สำคัญบางประการซึ่งอยู่ก่อนหน้าคำอธิบายที่ยาวกว่านี้คือ:

  1. Crucially: ระยะทาง Jeffries-Matusita นำไปใช้กับการแจกแจงมากกว่าเวกเตอร์ทั่วไป
  2. สูตรระยะทาง JM ที่คุณอ้างอิงด้านบนใช้กับเวกเตอร์ที่เป็นตัวแทนของการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง (เช่นเวกเตอร์ที่รวมเป็น 1)
  3. ซึ่งแตกต่างจากระยะทางแบบยุคลิด, ระยะทาง JM สามารถกำหนดให้เป็นแบบกระจายใด ๆ ที่ระยะทาง Bhattacharrya สามารถกำหนดได้
  4. ระยะทาง JM ได้ผ่านระยะทาง Bhattacharrya การตีความความน่าจะเป็น

เจฟฟรีส์ - Matusita ระยะทางซึ่งดูเหมือนว่าจะได้รับความนิยมในวรรณคดีการสำรวจระยะไกลโดยเฉพาะคือการเปลี่ยนแปลงของระยะทาง Bhattacharrya (วัดที่เป็นที่นิยมของความแตกต่างระหว่างสองกระจายแสดงที่นี่เป็น ) จากระยะไปยังช่วงที่กำหนด : [ 0 , inf )bp,q[0,inf)[0,2]

JMp,q=2(1exp(b(p,q))

ข้อได้เปรียบในทางปฏิบัติของระยะทาง JM ตามรายงานนี้คือมาตรการนี้ "มีแนวโน้มที่จะระงับค่าการแยกสูงในขณะที่เน้นค่าการแยกต่ำมาก"

ระยะทาง Bhattacharrya วัดความแตกต่างของการแจกแจงสองและในความต่อเนื่องทางนามธรรมต่อไปนี้: ถ้าการกระจายและถูกบันทึกโดยฮิสโทแกรมแสดงด้วยเวกเตอร์ความยาวของหน่วย (โดยที่องค์ประกอบ th คือจำนวนที่ถูกทำให้เป็นมาตรฐานสำหรับ th ของถังขยะ ) สิ่งนี้จะกลายเป็น: และดังนั้นระยะทาง JM สำหรับสองฮิสโทแกรมคือ: ซึ่งสังเกตว่าสำหรับฮิสโตแกรมที่ทำให้เป็นมาตรฐานQ ( P , Q ) = - LN pq

b(p,q)=lnp(x)q(x)dx
pqiiN
b(p,q)=lni=1Npiqi
JMp,q=2(1i=1Npiqi)
ipi=1เหมือนกับสูตรที่คุณให้ไว้ด้านบน:
JMp,q=i=1N(piqi)2=i=1N(pi2piqi+qi)=2(1i=1Npiqi)

+1 ขอบคุณมากสำหรับการกระโดดเข้ามาและใช้ความพยายามอย่างดีในการอธิบายสถานการณ์
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.