ระยะทางของโลกผู้เสนอญัตติสามารถเขียนเป็นซึ่งค่าน้อยที่สุดจะถูกนำไปรวมการกระจายของXและYที่มีมาร์จินX \ ซิม P , Y \ sim Q นี่เป็นที่รู้จักกันในนามระยะแรกWassersteinซึ่งก็คือW_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} ที่มีค่าเดียวกันE M D( P, Q ) = inf E∥ X- Y∥XYX~ PY∼ QWพี= inf ( E∥ X- Y∥พี)1 / p
Let X~ P= N( μx, Σx) , Y∼ Q = N( μY, ΣY)Sigma_y)
ขอบเขตล่าง:โดยความไม่สมดุลของเซ่นเนื่องจากบรรทัดฐานมีความนูน
E∥ X- Y∥ ≥ ∥ E( X- Y) ∥ = ∥ μx- μY∥ ,
ดังนั้น EMD จึงเสมอ อย่างน้อยระยะห่างระหว่างค่าเฉลี่ย (สำหรับการแจกแจงใด ๆ )
บนผูกพันอยู่บนพื้นฐานของW2 :
อีกครั้งโดยความไม่เท่าเทียมกันของเซ่น,
( E∥ X- Y∥ )2≤ E∥ X- Y∥2 2 ดังนั้นW1≤ W.2W_2 แต่Dowson และกุ๊บ (1982)ระบุว่า
W2( P, Q )2= ∥ μx- μY∥2+ t r( Σx+ ΣY−2(ΣxΣy)1/2),
ให้ขอบเขตบนEMD=W1W_1
ขอบเขตบนที่เข้มงวด:
พิจารณาการมีเพศสัมพันธ์
นี่คือแผนที่ที่ได้มาจากKnott และ Smith (1984) , ในการแมปที่เหมาะสมที่สุดของการแจกแจง , วารสารทฤษฎีการเพิ่มประสิทธิภาพและการประยุกต์, 43 (1) pp 39-49เป็นแผนที่ที่ดีที่สุดสำหรับ ; ดูโพสต์บล็อกนี้ด้วย โปรดทราบว่าและ
XY∼ N( μx, Σx)= μY+ Σ- 12x( Σ12xΣYΣ12x)12Σ- 12xA( X- μx) .
W2A = ATEYvarY= μY+ ( EX- μx) = μY= A ΣxAT= Σ- 12x( Σ12xΣYΣ12x)12Σ- 12xΣxΣ- 12x( Σ12xΣYΣ12x)12Σ- 12x= Σ- 12x( Σ12xΣYΣ12x) Σ- 12x= ΣY,
ดังนั้นการเชื่อมต่อจึงถูกต้อง
ระยะทางคือซึ่งตอนนี้
ซึ่งเป็นเรื่องปกติที่มี
∥ X- Y∥∥ D ∥D= X- Y= X- μY- A ( X- μx)= ( I−A)X−μy+Aμx,
EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
ดังนั้นผูกพันบนสำหรับเป็น\ แต่น่าเสียดายที่รูปแบบปิดสำหรับความคาดหวังนี้เป็นที่พอใจที่น่าแปลกใจที่จะเขียนลงสำหรับภาวะปกติหลายตัวแปรโดยทั่วไป: ดูคำถามนี้เช่นเดียวกับคนนี้W1(P,Q)E∥D∥
ถ้าความแปรปรวนของจบลงด้วยการเป็นทรงกลม (เช่นถ้า ,จากนั้นความแปรปรวนของจะกลายเป็น ) คำถามให้คำตอบในแง่ของพหุนาม Laguerre ทั่วไปDΣx=σ2xIΣy=σ2yID(σx−σy)2I
โดยทั่วไปเรามีขอบเขตบนอย่างง่ายสำหรับตามความไม่เท่าเทียมของ Jensen ที่ได้มาเช่นในคำถามแรก:
E∥D∥(E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
ความเท่าเทียมกันในตอนท้ายเป็นเพราะการฝึกอบรมและมีความคล้ายคลึงกัน ดังนั้นพวกเขาจึงมีค่าลักษณะเดียวกันและทำให้รากที่สองของพวกเขามีร่องรอยเหมือนกันΣxΣyΣ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x
ความไม่เท่าเทียมกันนี้เป็นที่เข้มงวดตราบเท่าที่ไม่ได้เป็นคนเลวซึ่งเป็นกรณีส่วนใหญ่เมื่อ\∥D∥Σx≠Σy
การคาดเดา : บางทีขอบเขตบนที่ใกล้กว่านี้ค่อนข้างแน่น จากนั้นอีกครั้งฉันมีขอบเขตบนที่แตกต่างกันที่นี่เป็นเวลานานที่ฉันคาดเดาว่าจะแน่นซึ่งในความเป็นจริงหลวมกว่าหนึ่งดังนั้นบางทีคุณไม่ควรไว้ใจการคาดเดานี้มากเกินไป :)E∥D∥W2