ความแตกต่างของ KL ระหว่าง Gaussians หลายตัวแปร


46

ฉันมีปัญหาในการรับสูตร divergence ของ KL โดยสมมติว่ามีการแจกแจงปกติหลายตัวแปรสองตัว ฉันทำคดี univariate ค่อนข้างง่าย อย่างไรก็ตามมันก็ค่อนข้างนานแล้วที่ฉันเอาสถิติทางคณิตศาสตร์มาก่อน ฉันแน่ใจว่าฉันแค่คิดถึงบางสิ่งที่เรียบง่าย

นี่คือสิ่งที่ฉันมี ...

สมมติว่าทั้งและเป็นไฟล์ PDF ของการแจกแจงแบบปกติที่มีค่าเฉลี่ยและและความแปรปรวนและตามลำดับ ระยะทาง Kullback-Leibler จากถึงคือ:pμ 1 μ 2 Σ 1 Σ 2 q pqμ1μ2Σ1Σ2qp

[log(p(x))log(q(x))] p(x) dxซึ่งสองบรรทัดฐานหลายตัวแปรคือ:

12[เข้าสู่ระบบ|Σ2||Σ1|-d+TR(Σ2-1Σ1)+(μ2-μ1)TΣ2-1(μ2-μ1)]

ทำตามตรรกะเดียวกันกับข้อพิสูจน์นี้ฉันไปถึงที่นี่ก่อนที่ฉันจะติดขัด:

=[d2เข้าสู่ระบบ|Σ2||Σ1|+12((x-μ2)TΣ2-1(x-μ2)-(x-μ1)TΣ2-1(x-μ1))]×พี(x)dx

=E[d2เข้าสู่ระบบ|Σ2||Σ1|+12((x-μ2)TΣ2-1(x-μ2)-(x-μ1)TΣ2-1(x-μ1))]

ฉันคิดว่าฉันต้องใช้เคล็ดลับการติดตามแต่ฉันไม่แน่ใจว่าจะทำอย่างไรหลังจากนั้น คำแนะนำที่เป็นประโยชน์ใด ๆ ที่จะนำฉันกลับไปในเส้นทางที่ถูกต้องจะได้รับการชื่นชม!


1
stanford.edu/~jduchi/projects/general_notes.pdf ส่วนสุดท้ายยังให้กำเนิด
user3540823

คำตอบ:


47

เริ่มจากที่คุณเริ่มด้วยการแก้ไขเล็กน้อยเราสามารถเขียน

KL=[12เข้าสู่ระบบ|Σ2||Σ1|-12(x-μ1)TΣ1-1(x-μ1)+12(x-μ2)TΣ2-1(x-μ2)]×พี(x)dx=12เข้าสู่ระบบ|Σ2||Σ1|-12TR {E[(x-μ1)(x-μ1)T] Σ1-1}+12E[(x-μ2)TΣ2-1(x-μ2)]=12เข้าสู่ระบบ|Σ2||Σ1|-12TR {ผมd}+12(μ1-μ2)TΣ2-1(μ1-μ2)+12TR{Σ2-1Σ1}=12[เข้าสู่ระบบ|Σ2||Σ1|-d+TR{Σ2-1Σ1}+(μ2-μ1)TΣ2-1(μ2-μ1)].

โปรดทราบว่าฉันได้ใช้คู่ของคุณสมบัติจากมาตรา 8.2 ของตำราเมทริกซ์


ฉันเห็นว่าคุณถอด D ที่ฉันมีอยู่เดิม คุณจะไม่มีเทอม D หลังจากจดบันทึกเกาส์เซียนในไม่กี่ขั้นตอนแรกหรือไม่?
dmartin

พิจารณาปัจจัยการปรับ ,ของความหนาแน่นปกติหลายตัวแปร เมื่อคำนวณความแตกต่างของล็อกคำจะหายไป ไม่มีเทอมสำหรับดีเทอร์มิแนนต์ - อย่างง่ายคือซึ่งแยกออกมา (2π)-d/2|Σk|-1/2k=1,2(2π)-d/2d1/2
ramhiser

ไม่มีปัญหาเลย. ดีใจที่ฉันสามารถช่วย
ramhiser

สวัสดีคุณคิดยังไงกับขั้นตอนสุดท้าย? คุณเปลี่ยนเครื่องหมายของเป็นอย่างไร μ1-μ2μ2-μ1
acidghost

1
@acidghost อย่างใดอย่างหนึ่งทำงานได้เพราะเราสามารถแยกออกมาเป็นเชิงลบจากทั้งสองด้าน การคูณลบสองตัวให้ผลเป็นบวก
ramhiser
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.