Kullback – Leibler ความแตกต่างระหว่างการแจกแจงแกมม่าสองครั้ง


15

การเลือกเพื่อกำหนดพารามิเตอร์การแจกแจงแกมม่าΓ(b,c)โดย pdf g(x;b,c)=1Γ(c)xc1bcex/b Kullback-Leibler divergence ระหว่างΓ(bq,cq)และΓ(bp,cp)ได้รับจาก [1] เป็น

KLGa(Q,Q;พี,พี)=(Q-1)Ψ(Q)-เข้าสู่ระบบbqcqlogΓ(cq)+logΓ(cp)+cplogbp(cp1)(Ψ(cq)+logbq)+bqcqbp

ฉันคาดเดาว่าΨ(x):=Γ(x)/Γ(x)เป็นฟังก์ชันไดแกมมา

สิ่งนี้ถูกกำหนดโดยไม่มีการสืบทอด ฉันไม่พบการอ้างอิงใด ๆ ที่ทำให้เกิดสิ่งนี้ ความช่วยเหลือใด ๆ การอ้างอิงที่ดีก็เพียงพอแล้ว ส่วนที่ยากคือการรวมlogxกับไฟล์ gamma pdf

[1] WD Penny, KL-Divergences จากความหนาแน่นปกติ, แกมม่า,ดิริชเล็ตและ Wishartมีให้ที่: www.fil.ion.ucl.ac.uk/~wpenny/publications/densities.ps


2
การหาอนุพันธ์ของ pdf เทียบกับจะcแนะนำตัวประกอบของlog(x)คุณกำลังมองหานั่นคือสาเหตุที่ digamma ปรากฏขึ้น
whuber

หากคุณเกิดขึ้นกับ Pierre Baldi และ Laurent Itti (2010)“ ของบิตและ wows: ทฤษฎี Bayesian ของความประหลาดใจกับการใช้งานให้ความสนใจ” Neural Networks 23: 649-666 คุณจะพบสมการ 73 ให้แตกต่าง KL ระหว่างแกมม่า pdf สอง แต่ดูเหมือนว่าสูตรจะพิมพ์ผิดพลาด
นายคลาริเน็ต

ฉันกำลังมองหาวิธีการแก้ปัญหาเดียวกันและพบนี้หนึ่งจะเป็นประโยชน์
Yi Yang

คำตอบ:


15

KL แตกต่างกันคือความแตกต่างของอินทิกรัลของแบบฟอร์ม

$$ \ eqalign {I (a, b, c, d) & = \ int_0 ^ {\ infty} \ log \ left (\ frac {erac {e ^ {- x / a} x ^ {b-1}} {a ^ b \ Gamma (b)} \ right) \ frac {e ^ {- x / c} x ^ {d-1}} {c ^ d \ Gamma (d)} dx \

& = - \ frac {1} {a} \ int_0 ^ \ infty \ frac {x ^ de ^ {- x / c}} {c ^ d \ Gamma (d)} \, dx - \ log (a ^ b \ Gamma (b)) \ ​​int_0 ^ \ infty \ frac {e ^ {- x / c} x ^ {d-1}} {c ^ d \ Gamma (d)} \, dx \ & \ quad + (b- 1) \ int_0 ^ \ infty \ log (x) \ frac {e ^ {- x / c} x ^ {d-1}} {c ^ d \ Gamma (d)} \, dx \

& = - \ frac {cd} {a} - \ log (a ^ b \ Gamma (b)) + (b-1) \ int_0 ^ \ infty \ log (x) \ frac {e ^ {- x / c } x ^ {d-1}} {c ^ d \ Gamma (d)} \, dx} $$

เราแค่ต้องจัดการกับอินทิกรัลขวามือซึ่งได้มาจากการสังเกต

dΓ(d)=d0อี-x/xd-1ddx=d0อี-x/(x/)d-1dx=0อี-x/xd-1dเข้าสู่ระบบxdx=0เข้าสู่ระบบ(x)อี-x/xd-1ddx-เข้าสู่ระบบ()Γ(d).

จากไหน

-1Γ(d)0เข้าสู่ระบบ(x)อี-x/(x/)d-1dx=(-1)Γ'(d)Γ(d)+(-1)เข้าสู่ระบบ().

เสียบเข้ากับอัตราผลตอบแทนก่อนหน้า

I(a,b,c,d)=cdalog(abΓ(b))+(b1)Γ(d)Γ(d)+(b1)log(c).

KL แตกต่างกันระหว่างและΓ ( a , b )เท่ากับI ( c , d , c , d ) - ฉัน( a , b , c , d )ซึ่งตรงไปตรงมาเพื่อประกอบΓ(c,d)Γ(a,b)I(c,d,c,d)I(a,b,c,d)


รายละเอียดการใช้งาน

ฟังก์ชันแกมมาเติบโตอย่างรวดเร็วดังนั้นเพื่อหลีกเลี่ยงการโอเวอร์โฟลว์อย่าคำนวณ Gamma และใช้ลอการิทึมของมัน: แทนที่จะใช้ฟังก์ชั่น log-Gamma ที่จะพบในแพลตฟอร์มการคำนวณทางสถิติใด ๆ (รวมถึง Excel สำหรับเรื่องนั้น)

อัตราส่วนเป็นอนุพันธ์ของลอการิทึมΓ ,โดยทั่วไปเรียกว่าψ ,Γ(d)/Γ(d)Γ,ψ, digammaฟังก์ชั่น หากยังไม่ได้มีให้คุณมีวิธีที่ค่อนข้างง่ายที่จะใกล้เคียงกับมันตามที่อธิบายไว้ในบทความวิกิพีเดีย

ที่นี่เพื่อแสดงให้เห็นเป็นโดยตรงRการดำเนินงานของสูตรในแง่ของฉันสิ่งนี้ไม่ใช้โอกาสในการทำให้ผลลัพธ์เชิงพีชคณิตง่ายขึ้นซึ่งจะทำให้มีประสิทธิภาพมากขึ้นเล็กน้อย (โดยกำจัดการคำนวณซ้ำซ้อนของψ )Iψ

#
# `b` and `d` are Gamma shape parameters and
# `a` and `c` are scale parameters.
# (All, therefore, must be positive.)
#
KL.gamma <- function(a,b,c,d) {
  i <- function(a,b,c,d)
    - c * d / a - b * log(a) - lgamma(b) + (b-1)*(psigamma(d) + log(c))
  i(c,d,c,d) - i(a,b,c,d)
}
print(KL.gamma(1/114186.3, 202, 1/119237.3, 195), digits=12)

2
คำตอบที่ดี. ขอบคุณ! ฉันเชื่อว่ามีข้อผิดพลาดเข้าสู่ระบบ แต่ในความเท่าเทียมกันที่สี่ นอกจากนี้แกมมาไฟล์ PDF ของคุณควรมีปัจจัยเพิ่มเติมเป็น 'c' ในตัวหาร คุณต้องการให้ฉันแก้ไขหรือไม่
Ian Langmore

dx/xc

2
ฉันทำการแก้ไข
Ian Langmore

10

การแจกแจงแกมมาอยู่ในตระกูลเอ็กซ์โพเนนเชียลเนื่องจากความหนาแน่นของมันสามารถแสดงเป็น:

f(xθ)=exp(η(θ)T(x)g(θ)+h(x))

Looking at the Gamma density function, its log-normalizer is

g(θ)=log(Γ(c))+clog(b)
with natural parameters
θ=[c11b]

All distributions in the exponential family have KL divergence:

KL(q;p)=g(θp)g(θq)(θpθq)g(θq).

There's a really nice proof of that in:

Frank Nielsen, École Polytechnique, and Richard Nock, Entropies and cross-entropies of exponential families.


Didn't know this. Just a quick question - the g(.) function, does it have to be the same for θp as for θq? So for example, would the above formula be valid for KL divergence of normal pdf from gamma pdf?
probabilityislogic

1
Yes, this formula is for two distributions in the same exponential family.
Neil G
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.