ความแปรปรวนของส่วนผสมน้ำหนักของสอง gaussians คืออะไร?


38

บอกว่าผมมีสองการแจกแจงปรกติ A และ B ด้วยวิธีการและและแปรปรวนและ\ฉันต้องการที่จะใช้เป็นส่วนผสมถ่วงน้ำหนักของทั้งสองการกระจายการใช้น้ำหนักและที่และ1-P ฉันรู้ว่าค่าเฉลี่ยของส่วนผสมนี้จะเป็นmu_B)μAμBσAσBpq0p1q=1pμAB=(p×μA)+(q×μB)

ความแปรปรวนจะเป็นอย่างไร


ตัวอย่างที่ชัดเจนคือถ้าฉันรู้พารามิเตอร์สำหรับการกระจายความสูงของเพศชายและเพศหญิง หากฉันมีห้องของคนที่เป็นเพศชาย 60% ฉันสามารถสร้างความสูงเฉลี่ยที่คาดไว้สำหรับทั้งห้อง แต่ความแปรปรวนล่ะ?


คำศัพท์ Re: ส่วนผสมมีค่าเฉลี่ยและความแปรปรวน ไม่มีเหตุผลที่จะถือว่าคุณสมบัติเหล่านี้เป็น "คาดหวัง" นอกจากว่าคุณอาจจะพูดเป็นนัย ๆ ว่าและควรพิจารณาว่าเป็นตัวแปรสุ่ม pq
whuber

ฉันรู้ว่าส่วนผสมของการแจกแจงแบบเกาส์สองอันนั้นสามารถระบุได้ แต่ถ้าการแจกแจงสองตัวนั้นมีค่า emans เหมือนกัน? เช่น:, คือการผสมของการแจกแจงสองแบบปกติด้วยค่าเฉลี่ยเดียวกันและค่าเบี่ยงเบนมาตรฐานที่แตกต่างกันที่สามารถระบุได้หรือไม่? มีเอกสารในบริบทนี้หรือไม่ ขอบคุณล่วงหน้า

1
มีคำถามที่คล้ายกันกับคำตอบ (จัดการกับ COVARIANCES) ที่นี่: math.stackexchange.com/q/195911/96547
hplieninger

คำตอบ:


62

ความแปรปรวนเป็นโมเมนต์ที่สองลบกำลังสองของช่วงเวลาแรกดังนั้นจึงพอเพียงในการคำนวณช่วงเวลาของการผสม

โดยทั่วไปการแจกแจงด้วยไฟล์ PDFและค่าคงที่ (ไม่ใช่แบบสุ่ม) น้ำหนัก PDF ของส่วนผสมคือfipi

f(x)=ipifi(x),

ซึ่งมันจะตามมาทันทีในทันทีที่นั้นk

μ(k)=Ef[xk]=ipiEfi[xk]=ipiμi(k).

ฉันได้เขียนสำหรับช่วงเวลาของและ สำหรับช่วงเวลาของการf_iμ(k)kthfμi(k)kthfi

การใช้สูตรเหล่านี้สามารถสร้างความแปรปรวนได้

Var(f)=μ(2)(μ(1))2=ipiμi(2)(ipiμi(1))2.

ถ้าความแปรปรวนของเท่ากับดังนั้น , การเปิดใช้งานความแปรปรวนของการผสมจะถูกเขียนในแง่ของความแปรปรวนและความหมายขององค์ประกอบในฐานะfiσi2μi(2)=σi2+(μi(1))2f

Var(f)=ipi(σi2+(μi(1))2)(ipiμi(1))2=ipiσi2+ipi(μi(1))2(ipiμi(1))2.

ในคำพูดนี้คือความแปรปรวนเฉลี่ย (ถ่วงน้ำหนัก) บวกค่าเฉลี่ยกำลังสองลบด้วยกำลังสองของค่าเฉลี่ย เนื่องจากกำลังสองเป็นฟังก์ชันนูน, ความไม่เท่าเทียมกันของ Jensen ยืนยันว่าค่าเฉลี่ยกำลังสองเฉลี่ยไม่น้อยกว่ากำลังสองของค่าเฉลี่ย สิ่งนี้ช่วยให้เราเข้าใจสูตรได้ว่าการระบุความแปรปรวนของส่วนผสมคือส่วนผสมของความแปรปรวนบวกกับการบัญชีที่ไม่เป็นลบสำหรับการกระจายตัว (ถ่วงน้ำหนัก) ของค่าเฉลี่ย

ในกรณีของคุณความแปรปรวนคือ

pAσA2+pBσB2+[pAμA2+pBμB2(pAμA+pBμB)2].

เราสามารถตีความได้ว่านี่เป็นส่วนผสมที่ถ่วงน้ำหนักของความแปรปรวนสองอย่างคือบวกกับคำที่ใช้แก้ไข (จำเป็นต้องเป็นบวก) เพื่อเปลี่ยนกะจากค่าเฉลี่ยของแต่ละบุคคลเมื่อเทียบกับค่าเฉลี่ยโดยรวมpAσA2+pBσB2

ยูทิลิตี้ของความแปรปรวนนี้ในการตีความข้อมูลเช่นที่กำหนดไว้ในคำถามนั้นเป็นที่น่าสงสัยเนื่องจากการกระจายของส่วนผสมจะไม่เป็นปกติ (และอาจแยกออกจากกันอย่างมีนัยสำคัญจนถึงระดับที่จะแสดง bimodality)


8
โดยเฉพาะอย่างยิ่งการสังเกตว่าการแสดงออกครั้งสุดท้ายของคุณทำให้ 2 pA+pB=1σ2=μ(2)μ2=pAσA2+pBσB2+pApB(μAμB)2
Ilmari Karonen

2
หรือถ้าเราทำกำหนดคำอธิบายที่น่าจะเป็นความหนาแน่นผสม (มีเหตุการณ์ของ probabiityและเงื่อนไขความหนาแน่นของได้รับเป็นในขณะที่เงื่อนไขความหนาแน่นของได้รับคือ ) จากนั้น varคือผลรวมของค่าเฉลี่ยของความแปรปรวนตามเงื่อนไขบวกกับความแปรปรวนของค่าเฉลี่ยตามเงื่อนไข ด้านหลังคือ RVไม่ต่อเนื่องที่มีค่าพร้อมความน่าจะเป็นและApAXAN(μA,σA2)XAc=BN(μB,σB2)(X)YμA,μBpqและการแสดงออกของคุณในวงเล็บเป็นที่ยอมรับพร้อมที่จะเป็น 2 E[Y2](E[Y])2
Dilip Sarwate

1
@ Neodyme ตามคำนิยามความแปรปรวนเป็นช่วงเวลาที่สองลบด้วยค่าเฉลี่ยกำลังสอง ดังนั้นวินาทีที่สองคือความแปรปรวนบวกค่าเฉลี่ยกำลังสอง
whuber

1
@Neodyme ใช้EE(X)=μ
whuber

1
@ คีรานถึงแม้ว่าในบางกรณีส่วนผสมอาจมีลักษณะเป็นปกติ แต่จะไม่เป็นเช่นนั้น วิธีหนึ่งในการดูนั่นคือการคำนวณ kurtosis ส่วนเกินโดยใช้สูตรที่ให้ไว้ที่นี่ มันจะไม่ใช่ศูนย์เว้นแต่ส่วนเบี่ยงเบนมาตรฐานทั้งหมดจะเท่ากัน - ในกรณีนี้ "ส่วนผสม" ไม่ใช่ส่วนผสมในตอนแรก
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.