คุณเปรียบเทียบกระบวนการแบบเกาส์สองกระบวนการได้อย่างไร


14

Kullback-Leibler แตกต่างเป็นตัวชี้วัดเพื่อเปรียบเทียบฟังก์ชั่นความหนาแน่นสองน่าจะเป็น แต่สิ่งที่ตัวชี้วัดที่ใช้ในการเปรียบเทียบสองของ GP Xและ ?Y


d(X,Y)=E[supt|X(t)Y(t)|]
Zen

@ เซน: ถ้าคุณมีเวลาฉันสนใจที่จะรู้เพิ่มเติมเกี่ยวกับการวัดระยะทางนี้
Neil G

สวัสดีนีล ฉันไม่รู้อะไรเกี่ยวกับมันมากนัก โปรดดูคำตอบของฉันร้อง
เซน

คำตอบ:


8

หมายเหตุว่าการกระจายของ Gaussian กระบวนการXRเป็นส่วนขยายของหลายตัวแปรแบบเกาส์สำหรับอาจอนันต์XXดังนั้นคุณสามารถใช้ KL divergence ระหว่างการแจกแจงความน่าจะเป็น GP ได้โดยรวมเข้ากับRX :

DKL(P|Q)=RXlogdPdQdP.

คุณสามารถใช้วิธีการ MC เพื่อประมาณปริมาณนี้เป็นจำนวนมากกว่าโดยการสุ่มตัวอย่างกระบวนการต่าง ๆ ตามการกระจาย GP ฉันไม่รู้ว่าความเร็วของคอนเวอร์เจนซ์นั้นดีพอหรือไม่ ...X

โปรดทราบว่าหากมีขอบเขต จำกัด ด้วย| X | = nจากนั้นคุณจะกลับไปสู่ค่าเบี่ยงเบน KL ปกติสำหรับหลายตัวแปรการแจกแจงปกติ: D K L ( G P ( μ 1 , K 1 ) , G P ( μ 2 , K 2 ) ) = 1X|X|=n

DKL(GP(μ1,K1),GP(μ2,K2))=12(tr(K21K1)+(μ2μ1)K21(μ2μ1)n+log|K2||K1|)

ฉันจะคำนวณสองวิธี (mu1 และ mu2) ที่คุณกล่าวถึงได้อย่างไร หรือฉันควรจะพาพวกเขาเท่ากับศูนย์ตามปกติสำหรับกระบวนการ Gaussian?
Marat Zakirov

4

จำไว้ว่าถ้าเป็นกระบวนการเกาส์เซียนที่มีค่าเฉลี่ยของฟังก์ชันmและฟังก์ชันความแปรปรวนร่วมKจากนั้นสำหรับทุกๆt 1 , , t kT , เวกเตอร์แบบสุ่ม( X ( t 1 ) , ... , X ( t k ) )มีการแจกแจงปกติหลายตัวแปรที่มีเวกเตอร์เฉลี่ย( m ( t 1 ) , , mX:T×ΩRmKt1,,tkT(X(t1),,X(tk))และเมทริกซ์ความแปรปรวนร่วม Σ = ( σ ฉันj ) = ( K ( t ฉัน , t j ) )ที่ซึ่งเราใช้ตัวย่อทั่วไป X ( t ) = X ( t ,(m(t1),,m(tk))Σ=(σij)=(K(ti,tj)) .X(t)=X(t,)

แต่ละสำนึกเป็นฟังก์ชั่นที่แท้จริงที่มีโดเมนเป็นดัชนีชุดT สมมติว่า T = [ 0 , 1 ] ให้กระบวนการแบบเกาส์สองกระบวนการ Xและ Yระยะทางทั่วไปหนึ่งค่าระหว่างการรับรู้สองแบบ X (X(,ω)TT=[0,1]XYและ Y (X(,ω)คือ sup t [ 0 , 1 ] | X ( t , ω ) - Y ( t , ω ) | . ดังนั้นจึงเป็นเรื่องธรรมดาที่จะกำหนดระยะห่างระหว่างสองกระบวนการ Xและ Yเป็น d ( X , Y ) = EY(,ω)supt[0,1]|X(t,ω)Y(t,ω)|XY

d(X,Y)=E[supt[0,1]|X(t)Y(t)|].()
0t1<<tk1(xi1,,xik)(yi1,,yik)(X(t1),,X(tk))(Y(t1),,Y(tk)), respectively, for i=1,,N. Approximate d(X,Y) by
1Ni=1Nmax1jk|xijyij|.

How do you sample from each vector? If you only sample the means in each of the GPs you do not take into account the variances. Otherwise you will have to devise a sampling technique that is consistent.
pushkar

This is an excellent resource: gaussianprocess.org/gpml/chapters
Zen

You may also read all the answers to this question: stats.stackexchange.com/questions/30652/…
Zen

Pay attention that this is not a distance since d(X,X)0. As the KL compares two distributions and not two realisations, Zen's distance between two GPs should be defined as d(G1,G2)=EXG1,YG2[supt|X(t)Y(t)|], and we have that EXG,YGsupt|X(t)Y(t)|>0 for non degenerated Gaussian process G.
Emile

@Emile: how is it that d(X,X)0 using definition ()?
Zen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.