L2ระยะทางตามที่แนะนำในความคิดเห็นโดยผู้ใช้ 39665 นี่คือ:
โปรดสังเกตว่าดังตัวอย่างในหัวข้อ 8.1.8 ของตำราอาหารเมทริกซ์ :
เพื่อให้สามารถประเมินได้อย่างง่ายๆในเวลาL2(P,Q)2=∫(p(x)−q(x))2dx=∫(∑iαipi(x)−∑jβjqj(x))2dx=∑i,i′αiαi′∫pi(x)pi′(x)dx+∑j,j′βjβj′∫qj(x)qj′(x)dx−2∑i,jαiβj∫pi(x)qj(x)dx.
∫N(x;μ,Σ)N(x;μ′,Σ′)dx=N(μ;μ′,Σ+Σ′)
O(mn)
ค่าเฉลี่ยความคลาดเคลื่อนสูงสุด (MMD) ด้วยเคอร์เนล Gaussian RBF นี่เป็นระยะทางที่เยี่ยมยอดซึ่งยังไม่เป็นที่รู้จักในหมู่ชุมชนสถิติที่ต้องใช้คณิตศาสตร์ในการกำหนด
ให้
กำหนดพื้นที่ฮิลแบร์ตเป็น ทำซ้ำเคอร์เนลพื้นที่ Hilbert สอดคล้องกับ :H}k(x,y):=exp(−12σ2∥x−y∥2),
Hkk(x,y)=⟨φ(x),φ(y)⟩H
กำหนดแผนที่เฉลี่ยเคอร์เนลเป็น
K(P,Q)=EX∼P,Y∼Qk(X,Y)=⟨EX∼Pφ(X),EY∼Qφ(Y)⟩.
MMD คือ
MMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥=K(P,P)+K(Q,Q)−2K(P,Q)−−−−−−−−−−−−−−−−−−−−−−−−−√=supf:∥f∥H≤1EX∼Pf(X)−EY∼Qf(Y).
สำหรับการผสมของเราและทราบว่า
และในทำนองเดียวกันสำหรับและQ)PQK(P,Q)=∑i,jαiβjK(Pi,Qj)
K(P,P)K(Q,Q)
มันกลับกลายเป็นว่าใช้กลอุบายที่คล้ายกันกับนั่นคือคือ
L2K(N(μ,Σ),N(μ′,Σ′))(2πσ2)d/2N(μ;μ′,Σ+Σ′+σ2I).
ในฐานะชัดเจนว่าสิ่งนี้รวมเป็นระยะทางหลายโดยปกติคุณต้องการใช้แตกต่างกันแต่อย่างใดอย่างหนึ่งตามมาตราส่วนของการเปลี่ยนแปลงข้อมูลσ→0L2σ
แบบฟอร์มปิดยังมีให้สำหรับเมล็ดพหุนามใน MMD ดูk
Muandet, Fukumizu, Dinuzzo และSchölkopf (2012) เรียนรู้จากการแจกแจงผ่านเครื่องวัดการสนับสนุน ในความก้าวหน้าในระบบประมวลผลข้อมูลประสาท ( รุ่นอย่างเป็นทางการ ) arXiv: 1202.6504
สำหรับคุณสมบัติที่ดีของระยะทางนี้ให้ดู
Sriperumbudur, Gretton, Fukumizu, Schölkopfและ Lanckriet (2010) งานแต่งงานของ Hilbert Space และการวัดความน่าจะเป็น วารสารเครื่องการเรียนรู้การวิจัย, 11, 1517-1561 arXiv: 0907.5309