ลักษณะทั่วไปของกฎหมายว่าด้วยความคาดหวังซ้ำแล้วซ้ำอีก


43

ฉันเพิ่งเจอตัวตนนี้:

E[E(Y|X,Z)|X]=E[Y|X]

แน่นอนว่าฉันคุ้นเคยกับกฎฉบับนั้นง่ายกว่านั่นคือแต่ฉันไม่สามารถหาเหตุผลในการวางหลักเกณฑ์ทั่วไปได้E[E(Y|X)]=E(Y)

ฉันจะขอบคุณถ้ามีคนสามารถชี้ให้ฉันอ้างอิงที่ไม่ช่างเทคนิคสำหรับความจริงที่ว่าหรือดีกว่าถ้ามีคนสามารถวางหลักฐานง่าย ๆ สำหรับผลลัพธ์ที่สำคัญนี้


2
ถ้ามีเงื่อนไขในxแล้วจะไม่ตกรุ่นที่ง่ายกว่านี้หรือไม่ yx
Mehrdad

คำตอบ:


36

การรักษาอย่างไม่เป็นทางการ

เราควรจำไว้ว่าสัญกรณ์ที่เรามีเงื่อนไขกับตัวแปรสุ่มนั้นไม่ถูกต้องแม้ว่าจะเป็นเรื่องประหยัดก็ตาม ในความเป็นจริงเรามีเงื่อนไขกับซิกม่า - พีชคณิตที่ตัวแปรสุ่มเหล่านี้สร้าง ในคำอื่น ๆจะหมายถึงค่าเฉลี่ยE [ Y | σ ( X ) ] คำพูดนี้อาจดูเหมือนไม่เหมาะสมใน "การรักษาแบบไม่เป็นทางการ" แต่เตือนเราว่าหน่วยงานปรับสภาพของเราเป็นชุดของชุด (และเมื่อเรามีเงื่อนไขในค่าเดียวดังนั้นนี่คือชุดซิงเกิล) ชุดเหล่านี้มีอะไรบ้าง? พวกเขามีข้อมูลE[YX]E[Yσ(X)]ซึ่งค่าที่เป็นไปได้ของตัวแปรสุ่มจัดหาเราเกี่ยวกับสิ่งที่อาจเกิดขึ้นกับการสำนึกของY การนำแนวคิดของสารสนเทศมาใช้ทำให้เราคิด (และใช้) กฎแห่งการทำซ้ำ (บางครั้งเรียกว่า "Tower Property") ด้วยวิธีการที่เข้าใจง่ายมาก: ซิกม่า - พีชคณิตที่สร้างโดยตัวแปรสุ่มสองตัวเป็นอย่างน้อย มีขนาดใหญ่เป็นที่สร้างขึ้นโดยตัวแปรสุ่มที่หนึ่ง: σ ( X ) σ ( X , Z )ในความหมายที่ตั้งทฤษฎีที่เหมาะสม ดังนั้นข้อมูลเกี่ยวกับY ที่อยู่ในσ ( X ,XY

σ(X)σ(X,Z)Yเป็นอย่างน้อยเป็นใหญ่เป็นข้อมูลที่สอดคล้องกันใน σ ( X ) ขณะนี้เป็นสัญลักษณ์การเสียดสีชุด σ ( X ) ฉันxและ σ ( X , Z ) ฉันx Z จากนั้นเราสามารถเขียน LHS ของสมการได้σ(X,Z)σ(X)
σ(X)Ixσ(X,Z)Ixz

อธิบายด้วยวาจาข้างต้นที่เรามี: "อะไรคือความคาดหวังของ {ค่าคาดหวังของ Y ที่ได้รับข้อมูล I x z } เนื่องจากเรามีข้อมูลที่ฉันมีเพียง xเท่านั้น"

E[E(Y|Ixz)|Ix]
YIxzIx

เราสามารถ "คำนึงถึง" ไหม? ไม่มี - เรารู้เพียงว่าฉัน x แต่ถ้าเราใช้สิ่งที่เรามี (ตามที่เราต้องการโดยการแสดงออกที่เราต้องการที่จะแก้ไข) แล้วเราจะพูดสิ่งที่เกี่ยวกับYภายใต้การดำเนินการตามความคาดหวังคือเราพูดว่า " E ( Y I x ) " ไม่มาก - เราเพิ่งหมดข้อมูลของเราIxzIxYE(YIx)

ดังนั้น

E[E(Y|Ixz)|Ix]=E(Y|Ix)

หากมีคนอื่นไม่ฉันจะกลับไปรักษาอย่างเป็นทางการ

การรักษารูปแบบ (อีกเล็กน้อย)

เรามาดูกันว่าหนังสือทฤษฎีความน่าจะเป็นที่สำคัญสองเล่มคืออะไรความน่าจะเป็นและการวัดของ P. Billingsley (3d ed. -1995) และ D. Williams "ความน่าจะเป็นกับ Martingales" (1991) รักษาเรื่องการพิสูจน์
Billingsley คลับคล้ายคลับคลาสามบรรทัดเพื่อพิสูจน์ วิลเลียมส์และฉันพูดพูดว่า

"(The Tower Property) แทบจะทันทีจากคำจำกัดความของการคาดการณ์ตามเงื่อนไข"

นั่นคือข้อความบรรทัดเดียว การพิสูจน์ของ Billingsley นั้นไม่ทึบแสง

พวกเขาถูกต้องแน่นอน: คุณสมบัติที่สำคัญและใช้งานง่ายมากของความคาดหวังตามเงื่อนไขนี้เกิดขึ้นโดยตรง (และเกือบจะทันที) จากคำจำกัดความ - ปัญหาเดียวคือฉันสงสัยว่าคำจำกัดความนี้มักจะไม่ได้สอนหรืออย่างน้อยก็ไม่เน้น หรือวัดวงกลมตามหลักวิชา แต่เพื่อที่จะแสดงใน (เกือบ) สามบรรทัดที่กฎหมายของการทำซ้ำความคาดหวังถือเราต้องการคำจำกัดความของความคาดหวังตามเงื่อนไขหรือค่อนข้างกำหนดคุณสมบัติของมัน

ให้พื้นที่ความน่าจะเป็นและ integrable ตัวแปรสุ่มY ให้Gเป็นอนุกรรมการσพีชคณิตของF , G F จากนั้นจะมีฟังก์ชั่นWที่เป็นG -measable สามารถรวมกันได้และ (นี่คือคุณสมบัติที่กำหนด)(Ω,F,P)YGσFGFWG

E(W1G)=E(Y1G)GG[1]

ที่เป็นฟังก์ชั่นตัวบ่งชี้ของชุดG เราบอกว่าWคือ ("เวอร์ชันของ") ความคาดหวังตามเงื่อนไขของY ที่ให้Gและเราเขียน W = E ( Y G )1GGWYG โดยมีรายละเอียดสำคัญที่จะทราบว่านี่คือความคาดหวังที่มีเงื่อนไขมีค่าที่คาดหวังเช่นเดียวกับ Yไม่ได้เพียงกว่าทั้ง G ,แต่ในทุกเซต GของGW=E(YG)a.s.
YGGG

(ฉันจะลองตอนนี้เพื่อนำเสนอว่าคุณสมบัติของ Tower มาจากคำจำกัดความของการคาดการณ์แบบมีเงื่อนไข)

เป็น Gตัวแปรสุ่ม -measurable พิจารณาแล้วบางส่วนย่อย σพีชคณิตพูด H G จากนั้น G HG G ดังนั้นในลักษณะที่คล้ายคลึงกันก่อนหน้านี้เรามีความคาดหวังแบบมีเงื่อนไขของ W ที่ให้ Hกล่าวว่า U = E ( W H )WGσHGGHGGWHที่โดดเด่นด้วย U=E(WH)a.s.

E(U1G)=E(W1G)GH[2]

ตั้งแต่สมการ[ 1 ]และ[ 2 ]ให้เราHG[1][2]

E(U1G)=E(Y1G)GH[3]

แต่นี้เป็นกำหนดคุณสมบัติของความคาดหวังที่มีเงื่อนไขของให้H YHดังนั้นเรามีสิทธิ์เขียน เนื่องจากเรามีการก่อสร้างด้วย U = E ( W H ) = E ( E [ Y G ] H )เราเพิ่งพิสูจน์สมบัติของ Tower หรือรูปแบบทั่วไปของกฎแห่งความคาดหวังซ้ำ - ในแปดบรรทัดU=E(YH)a.s.
U=E(WH)=E(E[YG]H)


6
(+1) นี่เป็นวิธีที่มีประโยชน์ในการอธิบายแนวคิดที่เป็นนามธรรมและยาก ฉันเชื่อว่าวลี "... ไม่ยิ่งใหญ่กว่า ... " ควรเป็น "ไม่เล็ก" ยังดีกว่าส่วนนั้นสามารถทำให้ชัดเจนขึ้นโดยลบเชิงลบและใช้การก่อสร้างแบบขนานเช่นเดียวกับใน "พีชคณิตซิกม่าที่สร้างโดยสองตัวแปรอย่างน้อยที่สุดก็ใหญ่พอ ๆ กับที่สร้างขึ้นโดยตัวแปรสุ่มหนึ่ง ... ดังนั้นข้อมูลเกี่ยวกับมีอยู่ ในσ ( X , Z )อย่างน้อยก็เยี่ยมยอดเหมือนข้อมูลในσ ( X ) " Yσ(X,Z)σ(X)
whuber

ขอบคุณทั้งคู่ cc @whuber นี่เป็นทฤษฎีบทที่มีประโยชน์มาก
JohnK

@ whuber ขอบคุณที่จำสิ่งนี้ - และสำหรับข้อเสนอแนะ
Alecos Papadopoulos

24

วิธีที่ฉันเข้าใจความคาดหวังตามเงื่อนไขและสอนนักเรียนของฉันมีดังต่อไปนี้:

ความคาดหวังตามเงื่อนไขเป็นภาพที่ถ่ายโดยกล้องที่มีความละเอียดσ ( X )E[Y|σ(X)]σ(X)

E[Y|σ(X)]E[Y|X]YE[Y|σ(X,Z)]σ(X,Z). ความคาดหวังคือตัวดำเนินการหาค่าเฉลี่ย (ตัวดำเนินการ "เบลอ") Scenary อาจมีหลายสิ่ง แต่ภาพที่คุณถ่ายด้วยกล้องที่มีความละเอียดต่ำจะทำให้รายละเอียดบางอย่างหายไปอย่างแน่นอนเช่นอาจมีจานบินบนท้องฟ้าที่มองเห็นได้ด้วยตาเปล่า แต่ไม่ ปรากฏในรูปภาพของคุณที่ถ่ายโดย (iphone 3?)

σ(X,Z)=σ(Y)E[Y|σ(Y)]=Y

E[E[Y|σ(X,Z)]|σ(X)]σ(X)σ(X,Z)σ(X,Z)σ(X)

E[E[Y|X,Z]|X]=E[Y|X]E[E[Y|X]|X,Z]=E[Y|X]ยังคง นี่เป็นเพราะ: หากภาพแรกของคุณถูกถ่ายโดย iphone 1 (เช่นความละเอียดต่ำ) และตอนนี้คุณต้องการใช้กล้องที่ดีกว่า (เช่น iphone 3) เพื่อสร้างภาพอีกภาพในรูปแรกแล้วไม่มีทางเลย สามารถปรับปรุงคุณภาพของภาพถ่ายแรก


2
รักมัน! :) คำอธิบายที่ดี
jessica

1
@ jessica ฉันดีใจที่มันช่วย :-) ฉันใช้เวลาสักครู่กว่าจะได้คำอธิบายนี้มา
KevinKim

21

E[E[YX]]=E[Y]Xg(X)YXYYYXYpX,Y(x,y)

E[Y]=yypY(y)definition=yyxpX,Y(x,y)write in terms of joint pmf=yyxpYX(yX=x)pX(x)write in terms of conditional pmf=xpX(x)yypYX(yX=x)interchange order of summation=xpX(x)E[YX=x]inner sum is conditional expectation=E[E[YX]]RV E[YX] has value E[YX=x] when X=x
XE[YX]XYY

E[E[YX,Z]X]h(X,Z)XZ E[YX]E[YX]Xx

E[YX=x]=yypYX(yX=x)=yypX,Y(x,y)pX(x)=yyzpX,Y,Z(x,y,z)pX(x)=yyzpYX,Z(yX=x,Z=z)pX,Z(x,z)pX(x)=zpX,Z(x,z)pX(x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)yypYX,Z(yX=x,Z=z)=zpZX(zX=x)E[YX=x,Z=z)=E[E[YX,Z]X=x]
E[YX,Z]XZXXxE[YX,Z]ZX

xXE[YX]XYE[E[YX,Z]X]

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.