การอ้างอิงที่แสดงให้เห็นถึงการใช้ Gaussian Mixtures


14

แบบจำลองการผสมแบบเกาส์ (GMMs) มีความน่าสนใจเพราะง่ายต่อการทำงานกับทั้งในเชิงวิเคราะห์และในทางปฏิบัติ มีคุณสมบัติการวิเคราะห์เล็กน้อยที่เราควรคาดว่าจะมีซึ่งไม่ชัดเจนโดยทั่วไป โดยเฉพาะอย่างยิ่ง:

  • SnnPnP
    limninfP^SnD(P||P^)=0?
  • บอกว่าเรามีการกระจายอย่างต่อเนื่องและเราได้พบ -component ผสมแบบเกาส์ซึ่งอยู่ใกล้กับPในรูปแบบรวม: \ เดลต้า (P \ hat {P}) <\ varepsilon เราสามารถผูกD (P || \ hat {P})ในแง่ของ\ epsilon ได้หรือไม่?N P P δ ( P , P ) < ε D ( P | | P ) εPNP^Pδ(P,P^)<εD(P||P^)ϵ
  • ถ้าเราต้องการสังเกตุผ่านเสียงเพิ่มเติมอิสระY \ sim P_Y (ทั้งจริงต่อเนื่อง) และเรามี GMMs \ hat {X} \ sim Q_X, \ hat {Y} \ sim Q_Nโดยที่\ delta (P , Q) <\ epsilonดังนั้นค่านี้มีขนาดเล็ก: \ left | \ mathsf {mmse} (X | X + Y) - \ mathsf {mmse} (\ hat {X} | \ hat {X} + \ hat { Y}) \ right | นั่นคือความจริงที่ว่าการประมาณXผ่านY noise นั้นยากพอ ๆ กับการประมาณ\ hat {X}ถึง\ hat {Y} noise? Y ~ P Y X ~ Q X , Y ~ Q N δ ( P , Q ) < ε | ม. s E (XPXYPYX^QX,Y^QNδ(P,Q)<ϵ
    |mmse(X|X+Y)mmse(X^|X^+Y^)|,
    XYX^Y^
  • คุณสามารถทำได้สำหรับรุ่นที่ไม่ใช่เสียงรบกวนเช่นเสียงปัวซองหรือไม่?

การทบทวนวรรณกรรมของฉัน (สั้น) จนถึงตอนนี้เพิ่งเปิดตัวบทเรียนที่นำมาใช้มาก ไม่มีใครมีการอ้างอิงใด ๆ ที่แสดงให้เห็นอย่างจริงจังภายใต้เงื่อนไขใดที่เรามีความชอบธรรมในการใช้แบบจำลองผสม?


3
ชุดของ GMMs มีความหนาแน่นในชุดของการแจกแจงในโทโพโลยีที่อ่อนแอ (สอดคล้องกับการรวมกันของการกระจาย) เห็นเช่นที่นี่ ฉันไม่แน่ใจว่าคำสั่งแรกของคุณถือแม้ว่ามันจะแน่นอนจะต้องมีการอนุญาตให้ส่วนประกอบศูนย์ความแปรปรวนในส่วนผสมที่จะจัดการกับฝูงจุดใด ๆ ในPฉันยังสงสัยเกี่ยวกับสัญลักษณ์แสดงหัวข้อย่อยที่สองอีกครั้งเพราะปัญหาของมวลชน P
Dougal

1
จุดดีฉันได้ระบุทุกสิ่งไว้อย่างต่อเนื่อง
27716 enthdegree

1
คุณอาจโชคดีกว่าในการดูวรรณกรรมเกี่ยวกับการประเมินความหนาแน่นของเคอร์เนลกับเมล็ดเกาส์เซียน เนื่องจากคุณมีส่วนผสมของ Gaussians ที่มีหนึ่งตัวอย่างต่อเมื่อจำนวนตัวอย่างเพิ่มขึ้นคุณจะได้รับการประมาณแบบกระจายที่ไม่มีความเป็นกลางและสอดคล้องกันของการแจกแจงหรือไม่? ฉันคิดว่าคำตอบคือใช่ แต่ไม่สามารถหาข้อมูลอ้างอิงได้ในทันที
Greg Ver Steeg

2
@thdegree: คำถามที่ดีมาก เนื่องจากคุณต้องการใช้โทโพโลยีที่แข็งแกร่ง (ความแตกต่าง KL และการแปรผันรวม) คำตอบทั่วไปสำหรับสองจุดแรกของคุณคือไม่: ตัวอย่างเช่นพิจารณาการกระจายแบบเทลด์ไขมัน KL สำหรับส่วนผสมแบบเกาส์ จำกัด ใด ๆ นั้นไม่มีที่สิ้นสุด (ฉันค่อนข้างแน่ใจว่ามันใช้งานได้จริง แต่ไม่ใช่ 100%) แต่สิ่งนี้นำไปสู่คำถามที่น่าสนใจมากขึ้นซึ่งคลาสย่อยของการแจกแจงความน่าจะเป็นใดที่สัญลักษณ์แสดงหัวข้อย่อยของคุณทั้งหมดจะนำไปใช้? ฉันไม่รู้คำตอบ แต่มันน่าสนใจมาก ฉันเดาว่ามันอาจเป็นการแจกแจงความน่าจะเป็นเกือบทั้งหมด
Guillaume Dehaene

1
ฉันเข้าเรียนพร้อมหนังสือเล่มนี้ ลิงค์ มันมีพื้นฐานที่เหมาะสม
EngrStudent - Reinstate Monica

คำตอบ:


0

ในเศรษฐมิติที่บริบทมีการกระจายของค่าสัมประสิทธิ์ในแบบจำลอง logit การอ้างอิงมาตรฐานคือ: MIXED MNL MODELS สำหรับ DISCRETE RESPONSE DANIEL MCFADDEN และ KENNETH TRAIN, JOONNAL of APPLIED ECONOMETRICS, J. Appl Econ 15: 447-470 (2000)


0

ด้วยความเคารพต่อคำถามของคุณ:

  1. สำหรับปัญหาแบบเบย์ที่คล้ายกันของส่วนผสมของ Dirichlet Process ของ gaussians ฉันเข้าใจว่าคำตอบคือใช่ Ghosal (2013)
  2. เมื่อฉันเข้าร่วมการพูดคุยในหัวข้อนี้ดูเหมือนว่าความคืบหน้าส่วนใหญ่จะทำโดยใช้ KL divergence ดูภาพนิ่งแฮร์รี่แวน Zanten ของ
  3. ฉันไม่ชัดเจน อย่างไรก็ตามดูเหมือนว่าปัญหาการแยกแหล่งที่มา ( ทราบ) โดยทั่วไปแล้วจะยากกว่าการสร้างแบบผสมเพียงอย่างเดียว โดยเฉพาะอย่างยิ่งสำหรับกรณีง่าย ๆ ของP N = P S = N ( 0 , 1 )คุณจะไม่สามารถระบุXและY ที่แท้จริงได้เนื่องจากสมมาตรของการแจกแจงเป็นศูนย์PN,PSPN=PS=N(0,1)XY
  4. ดูสไลด์สี่ที่ลิงก์ด้านบนมีรายการของแบบจำลอง Bayesian ที่รับประกันการลู่เข้า

0

นี่คือคำตอบบางส่วน

Say คือคลาสของส่วนผสมแบบเกาส์ทั้งหมดที่มีส่วนประกอบn สำหรับการกระจายอย่างต่อเนื่องPบน reals เรารับประกันได้หรือไม่ว่าเมื่อnเติบโตขึ้นเราสามารถประมาณPด้วย GMM ที่มีการสูญเสียเล็กน้อยในแง่ของความสัมพันธ์ของเอนโทรปี นั่นคือไม่Lim n →การ INF PS n D ( P | | P ) = 0 ?SnnPnP

limninfP^SnD(P||P^)=0?

ฉบับที่คุณสามารถหวังเดียวที่แตกต่าง KL มีขนาดเล็กถ้าคุณรู้ว่าQ 's หางอยู่ในที่สุดของการสั่งซื้อเช่นเดียวกับP ' s สิ่งนี้ไม่เป็นความจริงโดยทั่วไป มันไม่ยากที่จะเห็นว่าสำหรับP Cauchy แล้วสำหรับการใด ๆn , INF PS n D ( P | | P ) = D(PQ)QPPn

infP^SnD(P||P^)=

จำเป็นต้องระบุเงื่อนไขเพิ่มเติมเกี่ยวกับP

บอกว่าเรามีการกระจายอย่างต่อเนื่องและเราได้พบN -component ส่วนผสม Gaussian Pซึ่งอยู่ใกล้กับPในรูปแบบรวม: δ ( P , P ) < ε เราสามารถผูกD ( P | | P )ในแง่ของε ?PNP^Pδ(P,P^)<εD(P||P^)ϵ

ไม่ใช้ตัวอย่างเดียวกันกับข้างบน

XPXYPYX^QX,Y^QYδ(P,Q)<ϵ

|mmse(X|X+Y)mmse(X^|X^+Y^)|,
XYX^Y^

X,Y,X^,Y^E[X|Y]E[X^|Y^]|EP[(EP[X|Y]X)2]EQ[(EQ[X|Y]X)2]|TV(P,Q)

ฉันไม่สามารถพิสูจน์เรื่องนี้ได้ทั้งโดยทั่วไปหรือการใช้โครงสร้างเพิ่มเติมที่เราคาดไว้ใน P, Q หรือเกิดขึ้นกับการตอบโต้ใด ๆ

คุณสามารถทำได้สำหรับรุ่นที่ไม่ใช่เสียงรบกวนเช่นเสียงปัวซองหรือไม่?

นี่มันคลุมเครือ ในบริบทของคำถามก่อนหน้าหากคำสั่งในคำตอบนั้นสามารถพิสูจน์ได้โดยทั่วไปแล้วคำตอบคือใช่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.