ระยะทางของ Earth Mover (EMD) ระหว่างสอง Gaussians


26

มีสูตรแบบปิดสำหรับ (หรือการผูกมัดบางอย่าง) EMD ระหว่างและหรือไม่x1N(μ1,Σ1)x2N(μ2,Σ2)


2
ตาม en.wikipedia.org/wiki/Earth_mover%27s_distance EMD นั้นเป็นระยะทางเหมือนกับ Mallows หรือ Wasserstein ดังนั้นคุณสามารถลองใช้ Google
kjetil b halvorsen

2
คุณอาจพบว่าเอกสารนี้มีประโยชน์: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

คำตอบ:


27

ระยะทางของโลกผู้เสนอญัตติสามารถเขียนเป็นซึ่งค่าน้อยที่สุดจะถูกนำไปรวมการกระจายของXและYที่มีมาร์จินX \ ซิม P , Y \ sim Q นี่เป็นที่รู้จักกันในนามระยะแรกWassersteinซึ่งก็คือW_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} ที่มีค่าเดียวกันEMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Let XP=N(μx,Σx) , YQ=N(μy,Σy)Sigma_y)

ขอบเขตล่าง:โดยความไม่สมดุลของเซ่นเนื่องจากบรรทัดฐานมีความนูน

EXYE(XY)=μxμy,
ดังนั้น EMD จึงเสมอ อย่างน้อยระยะห่างระหว่างค่าเฉลี่ย (สำหรับการแจกแจงใด ๆ )

บนผูกพันอยู่บนพื้นฐานของW2 : อีกครั้งโดยความไม่เท่าเทียมกันของเซ่น, (EXY)2EXY2 2 ดังนั้นW1W2W_2 แต่Dowson และกุ๊บ (1982)ระบุว่า

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
ให้ขอบเขตบนEMD=W1W_1

ขอบเขตบนที่เข้มงวด: พิจารณาการมีเพศสัมพันธ์ นี่คือแผนที่ที่ได้มาจากKnott และ Smith (1984) , ในการแมปที่เหมาะสมที่สุดของการแจกแจง , วารสารทฤษฎีการเพิ่มประสิทธิภาพและการประยุกต์, 43 (1) pp 39-49เป็นแผนที่ที่ดีที่สุดสำหรับ ; ดูโพสต์บล็อกนี้ด้วย โปรดทราบว่าและ

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
ดังนั้นการเชื่อมต่อจึงถูกต้อง

ระยะทางคือซึ่งตอนนี้ ซึ่งเป็นเรื่องปกติที่มี XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

ดังนั้นผูกพันบนสำหรับเป็น\ แต่น่าเสียดายที่รูปแบบปิดสำหรับความคาดหวังนี้เป็นที่พอใจที่น่าแปลกใจที่จะเขียนลงสำหรับภาวะปกติหลายตัวแปรโดยทั่วไป: ดูคำถามนี้เช่นเดียวกับคนนี้W1(P,Q)ED

ถ้าความแปรปรวนของจบลงด้วยการเป็นทรงกลม (เช่นถ้า ,จากนั้นความแปรปรวนของจะกลายเป็น ) คำถามให้คำตอบในแง่ของพหุนาม Laguerre ทั่วไปDΣx=σx2IΣy=σy2ID(σxσy)2I

โดยทั่วไปเรามีขอบเขตบนอย่างง่ายสำหรับตามความไม่เท่าเทียมของ Jensen ที่ได้มาเช่นในคำถามแรก: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
ความเท่าเทียมกันในตอนท้ายเป็นเพราะการฝึกอบรมและมีความคล้ายคลึงกัน ดังนั้นพวกเขาจึงมีค่าลักษณะเดียวกันและทำให้รากที่สองของพวกเขามีร่องรอยเหมือนกันΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

ความไม่เท่าเทียมกันนี้เป็นที่เข้มงวดตราบเท่าที่ไม่ได้เป็นคนเลวซึ่งเป็นกรณีส่วนใหญ่เมื่อ\DΣxΣy

การคาดเดา : บางทีขอบเขตบนที่ใกล้กว่านี้ค่อนข้างแน่น จากนั้นอีกครั้งฉันมีขอบเขตบนที่แตกต่างกันที่นี่เป็นเวลานานที่ฉันคาดเดาว่าจะแน่นซึ่งในความเป็นจริงหลวมกว่าหนึ่งดังนั้นบางทีคุณไม่ควรไว้ใจการคาดเดานี้มากเกินไป :)EDW2

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.