ปรีชาสำหรับความคาดหวังตามเงื่อนไขของ -algebra


20

Letมีพื้นที่ความน่าจะเป็นที่ได้รับตัวแปรสุ่มและพีชคณิตเราสามารถสร้างตัวแปรสุ่มใหม่ซึ่งเป็นความคาดหวังตามเงื่อนไข( Ω , F , μ ) (Ω,F,μ)ξ : Ω Rξ:ΩR σ σGFGF E [ ξ | ]E[ξ|G]


ว่าอะไรคือสัญชาตญาณสำหรับการคิดเกี่ยวกับ ? ฉันเข้าใจสัญชาตญาณสำหรับสิ่งต่อไปนี้:E [ ξ | ]E[ξ|G]

(i) โดยที่คือเหตุการณ์ (ที่มีความน่าจะเป็นบวก)E [ ξ | A ] E[ξ|A]AA

(ii) โดยที่เป็นตัวแปรสุ่มแบบแยกE [ ξ | η ] E[ξ|η]ηη

แต่ฉันไม่สามารถเห็นภาพ{G}] ฉันเข้าใจคณิตศาสตร์ของมันและฉันเข้าใจว่ามันถูกกำหนดในลักษณะทั่วไปที่ง่ายกว่ากรณีที่เราสามารถเห็นภาพ แต่กระนั้นฉันก็ไม่คิดว่าวิธีนี้มีประโยชน์ มันยังคงเป็นวัตถุลึกลับสำหรับฉันE [ ξ | ]E[ξ|G]


ตัวอย่างเช่นสมมติเป็นเหตุการณ์ที่มี 0 รูปแบบพีชคณิตหนึ่งที่สร้างขึ้นโดย จากนั้นจะเท่ากับถ้าและเท่ากับถ้าA กล่าวอีกนัยหนึ่งถ้าและถ้า\ omega \ in a ^A Aμ ( A ) > 0 μ(A)>0σ σG = { , A , A c , Ω } G={,A,Ac,Ω}A AE [ ξ | G ] ( ω ) E[ξ|G](ω)1μ ( )ξ1μ(A)Aξโอห์มωA1μ ( )ξ1μ(Ac)Acξโอห์มωAE[ξ| G](ω)=E[ξ| ]E[ξ|G](ω)=E[ξ|A]โอห์มωAE[ξ| G](ω)=E[ξ| ]E[ξ|G](ω)=E[ξ|Ac]โอห์มωAc

ส่วนที่สับสนคือโอห์มโอห์มωΩดังนั้นทำไมเราไม่เขียนE [ ξ | G ] ( ω ) = E [ ξ | Ω ] = E [ ξ ]E[ξ|G](ω)=E[ξ|Ω]=E[ξ] ? ทำไมเราถึงแทนที่E [ ξ | ]E[ξ|G]ด้วยE [ ξ | A  หรือ  A c ]E[ξ|A or Ac]ขึ้นอยู่กับว่าโอห์มωAแต่ไม่ได้รับอนุญาตให้แทนที่E [ ξ | ]E[ξ|G]โดยE [ ξ ]E[ξ] ?


บันทึก. ในการตอบคำถามนี้ไม่ได้อธิบายโดยใช้คำจำกัดความที่เข้มงวดของการคาดการณ์ตามเงื่อนไข ฉันเข้าใจ. สิ่งที่ฉันต้องการทำความเข้าใจคือสิ่งที่ความคาดหวังตามเงื่อนไขควรจะคำนวณและทำไมเราจึงปฏิเสธอย่างใดอย่างหนึ่งแทนอีกสิ่งหนึ่ง

คำตอบ:


16

วิธีหนึ่งที่จะคิดเกี่ยวกับการเป็นตัวแทนเงื่อนไขเป็นฉายลงบนที่σσพีชคณิตGG

ป้อนคำอธิบายรูปภาพที่นี่( จาก Wikimedia Commons )

นี่เป็นเรื่องจริงอย่างจริงจังเมื่อพูดถึงตัวแปรสุ่มที่รวมกันเป็นตาราง ในกรณีนี้E [ ξ | G ]E [ξ| G]เป็นจริงประมาณการมุมฉากของตัวแปรสุ่มบนสเปซของประกอบด้วยตัวแปรสุ่มที่วัดด้วยความเคารพ{G} และในความเป็นจริงมันก็กลายเป็นจริงในแง่หนึ่งสำหรับตัวแปรสุ่มผ่านการประมาณค่าโดยตัวแปรสุ่มξ L 2 ( Ω ) G L 1 L 2ξL2( Ω )GL1L2

(ดูความคิดเห็นสำหรับการอ้างอิง)

ถ้าใครคิดว่า algebras เป็นตัวแทนของข้อมูลที่เรามีอยู่ (การตีความที่ de rigueur ในทฤษฎีของกระบวนการสุ่ม) ดังนั้น algebras ที่ใหญ่กว่าหมายถึงเหตุการณ์ที่เป็นไปได้มากขึ้นและข้อมูลเพิ่มเติมเกี่ยวกับผลลัพธ์ที่เป็นไปได้σ - σ - σ -σσσ algebras หมายถึงเหตุการณ์ที่เป็นไปได้น้อยลงและทำให้ข้อมูลเกี่ยวกับผลลัพธ์ที่เป็นไปได้น้อยลง

ดังนั้นที่ยื่นออกมา -measurable ตัวแปรสุ่มบนขนาดเล็กพีชคณิตวิธีการเดาที่ดีที่สุดของเราสำหรับค่าของได้รับข้อมูลที่ จำกัด มากขึ้นจากF ξ σ - G ξ GFξσGξG .

กล่าวอีกอย่างหนึ่งคือให้ข้อมูลจากเท่านั้นและไม่ใช่ข้อมูลทั้งหมดจาก ,ซึ่งเป็นสิ่งที่ดีที่สุดของเรา เดาเป็นไปได้สำหรับสิ่งที่เป็นตัวแปรสุ่มคือGGFFE[ξ|G]E[ξ|G]ξξ


จากตัวอย่างของคุณฉันคิดว่าคุณอาจสับสนกับตัวแปรสุ่มและค่าของตัวแปรเหล่านั้น ตัวแปรสุ่มคือฟังก์ชั่นที่มีโดเมนเป็นพื้นที่เหตุการณ์ มันไม่ใช่ตัวเลข กล่าวอีกนัยหนึ่ง ,ในขณะที่ ,{R}XXX:ΩRX:ΩRX{f | f:ΩR}X{f | f:ΩR}ωΩωΩX(ω)RX(ω)R

สัญกรณ์สำหรับความคาดหวังที่มีเงื่อนไขในความคิดของฉันไม่ดีจริงๆเพราะมันเป็นตัวแปรสุ่มตัวเองเช่นนี้ยังมีฟังก์ชั่น ในทางตรงกันข้าม (ปกติ) ความคาดหวังของตัวแปรสุ่มเป็นจำนวน ความคาดหวังตามเงื่อนไขของตัวแปรสุ่มเป็นปริมาณที่แตกต่างอย่างสิ้นเชิงจากความคาดหวังของตัวแปรสุ่มแบบเดียวกันคือไม่แม้แต่ "พิมพ์เช็ค" ด้วยE[ξ|G]E[ξ|G]E[ξ]E[ξ]Xi]

กล่าวอีกนัยหนึ่งโดยใช้สัญลักษณ์EEเพื่อแสดงถึงความคาดหวังทั้งแบบปกติและแบบมีเงื่อนไขเป็นการใช้สัญลักษณ์ขนาดใหญ่มาก

จากทั้งหมดที่กล่าวไว้โปรดทราบว่าคือตัวเลข (ค่าของตัวแปรสุ่มประเมินที่ค่า ) แต่เป็นตัวแปรสุ่ม แต่มันกลับกลายเป็นตัวแปรสุ่มคงที่ (เช่น trivial degenerate) เพราะ -algebra ที่สร้างขึ้นโดย ,เป็นเรื่องไร้สาระ / เสื่อมโทรมแล้วเทคนิคการพูดค่าคงที่ของตัวแปรสุ่มคงที่นี้คือที่นี่E[ξ|G](ω)E[ξ|G](ω)E[ξ|G]E[ξ|G]ωωE[ξ|Ω]E[ξ|Ω]σσΩΩ{,Ω}{,Ω}E[ξ]E[ξ]EE หมายถึงความคาดหวังปกติและตัวเลขไม่ใช่ความคาดหวังตามเงื่อนไขและไม่ใช่ตัวแปรสุ่ม

คุณดูเหมือนจะสับสนกับสัญกรณ์หมายถึงอะไร; ในทางเทคนิคการพูดเป็นไปได้ที่จะมีเงื่อนไขใน algebras ไม่ใช่ในแต่ละเหตุการณ์เนื่องจากการวัดความน่าจะเป็นจะถูกกำหนดเฉพาะกับ algebras ที่สมบูรณ์เท่านั้นไม่ใช่ในแต่ละเหตุการณ์ ดังนั้นเป็นเพียงย่อ (ขี้เกียจ) สำหรับ , ที่หมายถึงพีชคณิตที่สร้างขึ้น โดยเหตุการณ์ซึ่งเป็น\} โปรดสังเกตว่า ; กล่าวอีกนัยหนึ่ง ,E[ξ|A]E[ξ|A]σσσσE[ξ|A]E[ξ|A]E[ξ|σ(A)]E[ξ|σ(A)]σ(A)σ(A)σσAA{,A,Ac,Ω}{,A,Ac,Ω}σ(A)=G=σ(Ac)σ(A)=G=σ(Ac)E[ξ|A]E[ξ|A]E[ξ|G]E[ξ|G]และมีวิธีการที่แตกต่างกันทั้งหมดเพื่อแสดงถึงวัตถุเดียวกันแน่นอนE[ξ|Ac]E[ξ|Ac]

ในที่สุดฉันแค่อยากจะเพิ่มว่าคำอธิบายที่เข้าใจง่ายที่ฉันให้ไว้ข้างต้นอธิบายว่าทำไมค่าคงที่ของตัวแปรสุ่มเป็นเพียงหมายเลข - theพีชคณิตแสดงถึงจำนวนข้อมูลที่เป็นไปได้น้อยที่สุดที่เราสามารถทำได้ ในความเป็นจริงเป็นหลักไม่มีข้อมูลดังนั้นภายใต้สถานการณ์ที่รุนแรงนี้เดาที่ดีที่สุดเราจะได้มีที่ตัวแปรสุ่มคือเป็นตัวแปรสุ่มคงมีค่าคงที่คือXi]E[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{,Ω}]E[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{,Ω}]E[ξ]E[ξ]σσ{,Ω}{,Ω}ξξE[ξ]E[ξ]

หมายเหตุว่าทุกตัวแปรสุ่มคงมีตัวแปรสุ่มและพวกเขาทั้งหมดที่วัดด้วยความเคารพต่อเล็กน้อยพีชคณิตดังนั้นแน่นอนเราไม่ได้ว่าคงสุ่มเป็นการประมาณการมุมฉากของไปยังพื้นที่ย่อยของประกอบด้วยตัวแปรสุ่มที่วัดได้ด้วยความเคารพตามที่อ้างไว้L2L2σσ{,Ω}{,Ω}E[ξ]E[ξ]ξξL2(Ω)L2(Ω){,Ω}{,Ω}


2
@ วิลเลียมฉันไม่เห็นด้วยกับคุณเกี่ยวกับการใช้เป็น var ที่วิ่ง หนังสือหลายเล่มกำหนดให้เป็นตัวเลขไม่ใช่ var ที่วิ่ง มันเป็นประมาณการที่ดีที่สุดของ\นี่คือความคิดที่มีประโยชน์และใช้งานง่ายมาก ไม่สนใจมันอย่างสมบูรณ์เพียงเพราะคุณมีความเห็นทั่วไปเกี่ยวกับ cond เนื่องจาก var ที่วิ่งผิดจากมุมมองของการสอน ฉันไม่สับสนเกี่ยวกับสิ่งที่ rv คือและฉันไม่เห็นว่าสิ่งที่ฉันเขียนจะทำให้คุณคิดเช่นนั้น E[ξ|A]E[ξ|A]E[ξ|A]E[ξ|A]ξ|A
Nicolas Bourbaki

1
@ วิลเลียมคิดว่าการแสดงออกของ expe เป็นการประมาณค่า var ที่วิ่งด้วย เป็นตัวแทนของข้อมูลเป็นสิ่งที่ฉันเคยเห็นมาก่อน แต่ฉันไม่เคยให้ความคิดมากขนาดนั้นและพยายามหาวิธีที่แตกต่างในการมองภาพ cond expec ใช้คำแนะนำของคุณฉันจะเขียนตัวอย่างง่าย ๆ และโพสต์เป็นคำตอบสำหรับตัวฉันเองและเพื่อคนอื่น บางทีบางคนก็สามารถยกตัวอย่างของฉันและทำให้แปลกใหม่มากขึ้น G
Nicolas Bourbaki

1
@NicolasBourbaki ผมขอแนะนำให้คุณดูที่ p.221 ของรุ่นที่ 4 ของ Durrett ของความน่าจะเป็น - ทฤษฎีและตัวอย่าง ฉันสามารถอ้างอิงคุณไปยังแหล่งข้อมูลอื่นที่พูดถึงเรื่องนี้เช่นกัน ไม่ว่าในกรณีใดมันไม่ใช่เรื่องของความเห็น - ในกรณีทั่วไปส่วนใหญ่ความคาดหวังตามเงื่อนไขคือตัวแปรสุ่มและการปรับเงื่อนไขทำได้เฉพาะกับ algebras เท่านั้น ปรับอากาศด้วยความเคารพต่อเหตุการณ์คือปรับอากาศด้วยความเคารพพีชคณิตที่สร้างขึ้นโดยเหตุการณ์และปรับอากาศด้วยความเคารพตัวแปรสุ่มคือปรับสภาพ - พีชคณิตที่สร้างขึ้นโดย RVσσσ
Chill2Macht

3
@ วิลเลียมและฉันสามารถอ้างถึงแหล่งที่มาซึ่งกำหนดคอน exep ของเหตุการณ์ที่จะเป็นจำนวนจริง ฉันไม่รู้ว่าทำไมคุณถึงติดอยู่ในจุดนี้ อย่างใดอย่างหนึ่งสามารถกำหนดได้ทุกวิธีตราบใดที่ความคิดไม่ได้ผสมกัน สำหรับเหตุผลการสอนการสอนในชั้นเรียนเกี่ยวกับปัญหา ทฤษฎีและกระโดดลงไปใน def ทั่วไปส่วนใหญ่ทันทีไม่ส่องแสง ไม่ว่าในกรณีใดมันไม่สำคัญในการสนทนานี้และการร้องเรียนของคุณเกี่ยวกับสัญกรณ์ / อรรถศาสตร์
Nicolas Bourbaki

1
@NicolasBourbaki บทที่ 5 ของความน่าจะเป็นของ Whittle ผ่านความคาดหวังทำให้บัญชีที่ดีมาก (ในความคิดของฉัน) ทั้งลักษณะของความคาดหวังตามเงื่อนไขและอธิบายได้ดีว่าความสัมพันธ์แต่ละข้อมีความสัมพันธ์อย่างไรและมีแรงจูงใจจากคำจำกัดความอื่น ๆ คุณพูดถูกว่าความแตกต่างเป็นอีกหนึ่งความหมาย ความกระตือรือร้นของฉันสำหรับคำจำกัดความทั่วไปมากขึ้น (ฉันคิดว่า) จากการอ่านบทนี้ (5 ของความน่าจะเป็นของ Whittle ผ่านความคาดหวัง ) ซึ่งทำให้ (ฉันเชื่อ) ข้อโต้แย้งที่ดีเกี่ยวกับวิธีการกำหนดทั่วไปที่มากขึ้น
Chill2Macht

3

ฉันจะพยายามอธิบายรายละเอียดตามที่ William แนะนำ

ให้Ωเป็นพื้นที่ตัวอย่างของการโยนเหรียญสองครั้ง กำหนดวิ่ง var ξเป็นตัวการ ของหัวที่เกิดขึ้นในการทดสอบ เห็นได้ชัดว่าE [ ξ ] = 1 วิธีหนึ่งในการคิดว่า1คือ expec คุ้มค่าหมายถึงเป็นประมาณการที่ดีที่สุดสำหรับξ ถ้าเราต้องใช้เวลาคาดเดาสิ่งที่คุ้มค่าξจะใช้เวลาที่เราจะคาดเดา1 นี่เป็นเพราะE [ ( ξ - 1 ) 2 ] E [ ( ξ - a ) 2]สำหรับการใด ๆ จำนวนจริง

แสดงโดยA = { H T , H H }เป็นเหตุการณ์ที่ผลลัพธ์แรกคือหัว ให้G = { , A , A , C , Ω }เป็นσ -alg Gen โดย เราคิดว่าGเป็นตัวแทนของสิ่งที่เรารู้หลังจากการโยนครั้งแรก หลังจากโยนครั้งแรกหัวทั้งสองเกิดขึ้นหรือหัวไม่เกิดขึ้น ดังนั้นเราอยู่ในเหตุการณ์AหรือA cหลังจากการทอยครั้งแรก

หากเราอยู่ในเหตุการณ์Aค่าประมาณที่ดีที่สุดสำหรับξคือE [ ξ | A ] = 1.5 , และถ้าเราอยู่ในเหตุการณ์A cดังนั้นการประมาณที่ดีที่สุดสำหรับξคือE [ ξ | ] = 0.5

ตอนนี้กำหนดวิ่ง var η ( ω )ที่จะเป็นได้ทั้ง1.5หรือ0.5ขึ้นอยู่กับว่าหรือไม่ω สิ่งนี้วิ่ง var ηเป็นประมาณดีกว่า1 = E [ ξ ]ตั้งแต่E [ ( ξ - η ) 2 ] E [ ( ξ - 1 ) 2 ]

อะไรηจะทำคือการให้คำตอบสำหรับคำถาม: สิ่งที่เป็นประมาณการที่ดีที่สุดของξหลังจากที่โยนครั้งแรก? เนื่องจากเราไม่ทราบข้อมูลหลังจากที่โยนแรกηจะขึ้นอยู่กับ เมื่อเหตุการณ์Gถูกเปิดเผยให้เราหลังจากที่โยนแรกค่าของηจะถูกกำหนดและให้ประมาณการที่ดีที่สุดสำหรับξ

ปัญหาเกี่ยวกับการใช้ξเป็นค่าประมาณของตัวเองเช่น0 = E [ ( ξ - ξ ) 2 ] E [ ( ξ - η ) 2 ]มีดังนี้ ξไม่ได้ถูกกำหนดอย่างชัดเจนหลังจากการโยนครั้งแรก พูดว่าผลลัพธ์ของการทดสอบคือωโดยมีผลลัพธ์แรกเป็นหัวหน้าเราอยู่ในเหตุการณ์Aแต่อะไรคือξ ( ω ) = ? เราไม่ทราบว่าจากเพียงแค่โยนแรกว่าค่าไม่ชัดเจนกับเราและเพื่อξไม่ได้กำหนดไว้อย่างดี อย่างเป็นทางการมากขึ้นเราบอกว่าξไม่ใช่G -measme เช่นค่าของมันไม่ได้กำหนดอย่างชัดเจนหลังจากการโยนครั้งแรก ดังนั้นηเป็นค่าประมาณที่ดีที่สุดที่เป็นไปได้ของξหลังจากการโยนครั้งแรก

บางทีบางคนที่นี่อาจมีตัวอย่างที่ซับซ้อนกว่านี้ได้โดยใช้พื้นที่ตัวอย่าง[ 0 , 1 ] , ด้วยξ ( ω ) = ω , และGบางตัวที่ไม่น่าสนใจσ -algebra


1

แม้ว่าคุณจะไม่ขอให้ใช้คำจำกัดความที่เป็นทางการ แต่ฉันคิดว่าคำจำกัดความที่เป็นทางการน่าจะเป็นวิธีที่ดีที่สุดในการอธิบาย

Wikipedia - conditional expectation:

Then a conditional expectation of X given H, denoted as E(XH), is any H-measurable function ( ΩRn) which satisfies:

HE(XH)dP=HXdPfor eachHH

ประการแรกมันเป็นฟังก์ชั่นH-วัดได้ ประการที่สองก็มีเพื่อให้ตรงกับความคาดหวังมากกว่าทุกที่วัด (ย่อย) ที่ตั้งอยู่ในH ดังนั้นสำหรับเหตุการณ์, A, พีชคณิตซิกคือ{ , C , , Ω }ดังนั้นเห็นได้ชัดว่ามีการตั้งค่าที่คุณระบุไว้ในคำถามของคุณสำหรับโอห์ม/ ในทำนองเดียวกันสำหรับตัวแปรสุ่มแบบแยก (และชุดค่าผสม) เราจะแสดงรายการเหตุการณ์ดั้งเดิมทั้งหมดและกำหนดความคาดหวังของเหตุการณ์ดั้งเดิมนั้น

Now consider tossing a coin an infinite number of times, where at each toss i, you get 1/2i, if your coin is tails then your total winnings are X=i=112ici where ci = 1 for tails and 0 for heads. Then X is a real random variable on [0,1]. After n coin tosses, you know the value of X to precision 1/2n, eg after 2 coin tosses it is in [0,1/4], [1/4,1/2], [1/2,3/4] or [3/4,1] - after every coin toss, your associated sigma algebra is getting finer and finer, and similarly the conditional expectation of X is getting more and more precise.

Hopefully this example of a real valued random variable with a sequence of sigma algebras getting finer and finer (Filtration) gets you away from the purely event based intuition you are used to, and clarifies its purpose.


I apologize, but I downvoted this question. It does not answer what I originally asked. Nor does it provide any new information that I did not know before.
Nicolas Bourbaki

What I am trying to suggest to you is you do not understand the formal definition as well as you think you do (as the other answer also suggested), so unless you work through what is unintuitive with the formal definition you will not progress.
seanv507

I understand the formal definition just fine. The questions that I asked, I know how to answer them when working from the formal definitions. The 'other answer', was trying to explain my question without using the definition of con. exp.
Nicolas Bourbaki
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.