ฉันคิดว่าคุณพอใจกับสามเหลี่ยมมุมฉากเพราะความหมายว่าและY - E [ Y ∣ X ]เป็นตัวแปรสุ่มที่ไม่เกี่ยวข้องกัน สำหรับตัวแปรสุ่มAและB ที่ไม่มีการเชื่อมโยง,
var ( A + B ) = var ( A ) + var ( B ) ,
และอื่น ๆ ถ้าเราตั้งA = Y - E [E[ Y∣ X]Y- E[ Y∣ X]AB
var(A+B)=var(A)+var(B),(1)
และ
B = E [ Y ∣ X ]เพื่อให้
A + B = Yเราได้รับ
var ( Y ) = var ( Y - E [ Y ∣ X ] ) + var ( E [ Y ∣ X ] ) .
มันยังคงแสดงให้เห็นว่า
var ( Y - E [ Y ∣ XA=Y−E[Y∣X]B=E[Y∣X]A+B=Yvar(Y)=var(Y−E[Y∣X])+var(E[Y∣X]).(2)
var(Y−E[Y∣X])เหมือนกับ
เพื่อให้เราสามารถเปลี่ยนสถานะ
( 2 )เป็น
var ( Y ) = E [ var ( Y ∣ X ) ] + var ( E [ Y ∣ X ] )E[var(Y∣X)](2)var( Y) = E[ var( Y∣ X) ] + var( E[ Y∣ X] )(3)
ซึ่งเป็นสูตรผลต่างทั้งหมด
มันเป็นที่รู้จักกันดีว่ามูลค่าที่คาดหวังของตัวแปรสุ่มคือE [ Y ] , ที่อยู่, E [ E [ Y | X ] ] = E [ Y ] ดังนั้นเราจะเห็นว่า
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [E[ Y∣ X]E[ Y]E[ E[ Y∣ X] ] = E[ Y]
จากการที่มันตามที่ var ( ) = E [ 2 ] , ที่อยู่,
var ( Y - E [ Y | X ] ) = E [ ( Y - E [ Y | X ] ) 2 ]
ให้ Cแทนตัวแปรสุ่ม ( Y - E [ Y
E[ A ] = E[ Y- E[ Y∣ X] ] = E[ Y] - E[ E[ Y∣ X] ] = 0 ,
var( A ) = E[ ก2]var( Y- E[ Y∣ X] ) = E[ ( Y)- E[ Y∣ X] )2] .(4)
คเพื่อให้เราสามารถเขียนว่า
var ( Y - E [ Y | X ] ) = E [ C ]
แต่
E [ C ] = E [ E [ C ∣ X ] ]โดยที่
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )( Y- E[ Y∣ X] )2var(Y-E[Y|X] ) =E[ C] .(5)
E[ C] = E[ E[ C|X] ]
ตอนนี้
ได้รับที่
X=xการกระจายตามเงื่อนไขของ
Yมีค่าเฉลี่ย
E[Y|X=x]
และอื่น ๆ
E [ (Y-E[Y|X=x])2 | X=x ] =var(Y|X=x)
กล่าวอีกนัยหนึ่ง
E[ C|X] = E[ (Y)-E[Y|X] )2||X] .X= xYE[Y|X= x ]E[ (Y)-E[Y|X= x ] )2||X= x ] = var(Y|X= x )
เพื่อให้
ตัวแปรสุ่ม E [ C | X ]เป็นเพียง
var ( Y | X )
ดังนั้น
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,E[ C|X= x ] = var(Y|X= x ) E[ C|X]var(Y|X)E[ C] = E[ E[ C|X] ] = E[ var( Y∣ X) ] ,(6)
ซึ่งเมื่อเปลี่ยนตัวลงไป
แสดงให้เห็นว่า
var ( Y - E [ Y | X ] ) = E [ var ( Y | X ) ]
นี้ทำให้ด้านขวาของ
( 2 )สิ่งที่เราต้องการและเพื่อให้เราได้พิสูจน์แล้วว่าสูตรแปรปรวนทั้งหมด
( 3 )
( 5 )var( Y- E[ Y∣ X] ) = E[ var( Y∣ X) ]
( 2 )( 3 )