Hellinger Distance คืออะไรและควรใช้เมื่อใด


19

ฉันสนใจที่จะรู้ว่าสิ่งที่เกิดขึ้นจริงในระยะทาง Hellinger (ในแง่ง่าย) นอกจากนี้ฉันยังสนใจที่จะทราบว่าปัญหาประเภทใดบ้างที่เราสามารถใช้ Hellinger Distance ประโยชน์ของการใช้ Hellinger Distance คืออะไร


9
ระยะทางของ Hellinger นั้นเป็นความน่าจะเป็นแบบอะนาล็อกของระยะทางแบบยุคลิด คุณสมบัติเด่นคือสมมาตรเป็นตัวชี้วัด คุณสมบัติทางคณิตศาสตร์ดังกล่าวมีประโยชน์หากคุณกำลังเขียนกระดาษและคุณต้องการฟังก์ชันระยะทางที่มีคุณสมบัติบางอย่างเพื่อให้การพิสูจน์ของคุณเป็นไปได้ ในแอปพลิเคชันบางคนอาจพบว่าตัวชี้วัดตัวหนึ่งให้ผลลัพธ์ที่ดีกว่าหรือดีกว่าตัวอื่นสำหรับงานบางอย่าง เช่นระยะทาง Wassersteinเป็นความโกรธในเครือข่ายผู้ไม่
หวังดี

ขอบคุณสำหรับความคิดเห็น ฉันเจอคำถามนี้ซึ่งคล้ายกับคำถามที่ฉันมีตอนนี้ datascience.stackexchange.com/questions/22324/…โปรดแจ้งให้เราทราบว่าทำไมคำตอบที่บอกว่า Hellinger Distance เหมาะสม
Smith Volka

2
อาจเห็นภาพหัวข้อในพื้นที่เมตริก คุณสมบัติที่ดีอีกประการหนึ่งคือระยะทาง Hellinger นั้น จำกัด สำหรับการกระจายด้วยการสนับสนุนที่แตกต่างกัน เป็นการดีที่คุณจะถามคำถามเหล่านี้ ฉันแนะนำให้ลองใช้ตัวชี้วัดที่แตกต่างกันสำหรับตัวคุณเองและสังเกตผลลัพธ์
Emre

ขอบคุณ มันเป็นลิงค์ที่ดี ช่วยได้มาก แต่ระยะทางของ Hellinger จำกัด เฉพาะหัวข้อที่มาจากการจัดสรร Dirichlet Allocation (LDA) ตามที่กล่าวไว้ในลิงก์หรือไม่
สมิ ธ Volka

1
ไม่ไม่มีการเชื่อมต่อกับ LDA โดยธรรมชาติ
เอ็ม

คำตอบ:


7

ระยะทาง Hellingerเป็นตัวชี้วัดในการวัดความแตกต่างระหว่างการแจกแจงความน่าจะเป็นสองแบบ มันเป็นเรื่องที่น่าจะเป็นอะนาล็อกของระยะทางยุคลิด

PQ

h(P,Q)=12PQ2

มันจะมีประโยชน์เมื่อทำการหาปริมาณความแตกต่างระหว่างการแจกแจงความน่าจะเป็นสองแบบ ตัวอย่างเช่นหากคุณประเมินการกระจายสำหรับผู้ใช้และผู้ใช้ที่ไม่ใช่ผู้ใช้บริการ หากระยะทาง Hellinger มีขนาดเล็กระหว่างกลุ่มสำหรับคุณลักษณะบางอย่างคุณสมบัติเหล่านั้นจะไม่เป็นประโยชน์ทางสถิติสำหรับการแบ่งส่วน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.