การรักษาอย่างไม่เป็นทางการ
เราควรจำไว้ว่าสัญกรณ์ที่เรามีเงื่อนไขกับตัวแปรสุ่มนั้นไม่ถูกต้องแม้ว่าจะเป็นเรื่องประหยัดก็ตาม ในความเป็นจริงเรามีเงื่อนไขกับซิกม่า - พีชคณิตที่ตัวแปรสุ่มเหล่านี้สร้าง ในคำอื่น ๆจะหมายถึงค่าเฉลี่ยE [ Y | σ ( X ) ] คำพูดนี้อาจดูเหมือนไม่เหมาะสมใน "การรักษาแบบไม่เป็นทางการ" แต่เตือนเราว่าหน่วยงานปรับสภาพของเราเป็นชุดของชุด (และเมื่อเรามีเงื่อนไขในค่าเดียวดังนั้นนี่คือชุดซิงเกิล) ชุดเหล่านี้มีอะไรบ้าง? พวกเขามีข้อมูลE[Y∣X]E[Y∣σ(X)]ซึ่งค่าที่เป็นไปได้ของตัวแปรสุ่มจัดหาเราเกี่ยวกับสิ่งที่อาจเกิดขึ้นกับการสำนึกของY
การนำแนวคิดของสารสนเทศมาใช้ทำให้เราคิด (และใช้) กฎแห่งการทำซ้ำ (บางครั้งเรียกว่า "Tower Property") ด้วยวิธีการที่เข้าใจง่ายมาก:
ซิกม่า - พีชคณิตที่สร้างโดยตัวแปรสุ่มสองตัวเป็นอย่างน้อย มีขนาดใหญ่เป็นที่สร้างขึ้นโดยตัวแปรสุ่มที่หนึ่ง: σ ( X ) ⊆ σ ( X , Z )ในความหมายที่ตั้งทฤษฎีที่เหมาะสม ดังนั้นข้อมูลเกี่ยวกับY ที่อยู่ในσ ( X ,XY
σ(X)⊆σ(X,Z)Yเป็นอย่างน้อยเป็นใหญ่เป็นข้อมูลที่สอดคล้องกันใน σ ( X )
ขณะนี้เป็นสัญลักษณ์การเสียดสีชุด σ ( X ) ≡ ฉันxและ σ ( X , Z ) ≡ ฉันx Z จากนั้นเราสามารถเขียน LHS ของสมการได้σ(X,Z)σ(X)
σ(X)≡Ixσ(X,Z)≡Ixz
อธิบายด้วยวาจาข้างต้นที่เรามี: "อะไรคือความคาดหวังของ {ค่าคาดหวังของ Y ที่ได้รับข้อมูล I x z } เนื่องจากเรามีข้อมูลที่ฉันมีเพียง xเท่านั้น"
E[E(Y|Ixz)|Ix]
YIxzIx
เราสามารถ "คำนึงถึง" ไหม? ไม่มี - เรารู้เพียงว่าฉัน x แต่ถ้าเราใช้สิ่งที่เรามี (ตามที่เราต้องการโดยการแสดงออกที่เราต้องการที่จะแก้ไข) แล้วเราจะพูดสิ่งที่เกี่ยวกับYภายใต้การดำเนินการตามความคาดหวังคือเราพูดว่า " E ( Y ∣ I x ) " ไม่มาก - เราเพิ่งหมดข้อมูลของเราผมx zผมxYE( Y∣ ฉันx)
ดังนั้น
E[ E( Y| ผมx z) | ผมx] = E( Y| ผมx)
หากมีคนอื่นไม่ฉันจะกลับไปรักษาอย่างเป็นทางการ
การรักษารูปแบบ (อีกเล็กน้อย)
เรามาดูกันว่าหนังสือทฤษฎีความน่าจะเป็นที่สำคัญสองเล่มคืออะไรความน่าจะเป็นและการวัดของ P. Billingsley (3d ed. -1995) และ D. Williams "ความน่าจะเป็นกับ Martingales" (1991) รักษาเรื่องการพิสูจน์
Billingsley คลับคล้ายคลับคลาสามบรรทัดเพื่อพิสูจน์ วิลเลียมส์และฉันพูดพูดว่า
"(The Tower Property) แทบจะทันทีจากคำจำกัดความของการคาดการณ์ตามเงื่อนไข"
นั่นคือข้อความบรรทัดเดียว การพิสูจน์ของ Billingsley นั้นไม่ทึบแสง
พวกเขาถูกต้องแน่นอน: คุณสมบัติที่สำคัญและใช้งานง่ายมากของความคาดหวังตามเงื่อนไขนี้เกิดขึ้นโดยตรง (และเกือบจะทันที) จากคำจำกัดความ - ปัญหาเดียวคือฉันสงสัยว่าคำจำกัดความนี้มักจะไม่ได้สอนหรืออย่างน้อยก็ไม่เน้น หรือวัดวงกลมตามหลักวิชา แต่เพื่อที่จะแสดงใน (เกือบ) สามบรรทัดที่กฎหมายของการทำซ้ำความคาดหวังถือเราต้องการคำจำกัดความของความคาดหวังตามเงื่อนไขหรือค่อนข้างกำหนดคุณสมบัติของมัน
ให้พื้นที่ความน่าจะเป็นและ integrable ตัวแปรสุ่มY ให้Gเป็นอนุกรรมการσพีชคณิตของF , G ⊆ F จากนั้นจะมีฟังก์ชั่นWที่เป็นG -measable สามารถรวมกันได้และ (นี่คือคุณสมบัติที่กำหนด)( Ω , F, P )YGσFG⊆FWG
E(W⋅1G)=E(Y⋅1G)∀G∈G[1]
ที่เป็นฟังก์ชั่นตัวบ่งชี้ของชุดG เราบอกว่าWคือ ("เวอร์ชันของ") ความคาดหวังตามเงื่อนไขของY ที่ให้Gและเราเขียน
W = E ( Y ∣ G )1GGWYG
โดยมีรายละเอียดสำคัญที่จะทราบว่านี่คือความคาดหวังที่มีเงื่อนไขมีค่าที่คาดหวังเช่นเดียวกับ Yไม่ได้เพียงกว่าทั้ง G ,แต่ในทุกเซต GของGW=E(Y∣G)a.s.
YGGG
(ฉันจะลองตอนนี้เพื่อนำเสนอว่าคุณสมบัติของ Tower มาจากคำจำกัดความของการคาดการณ์แบบมีเงื่อนไข)
เป็น Gตัวแปรสุ่ม -measurable พิจารณาแล้วบางส่วนย่อย σพีชคณิตพูด H ⊆ G จากนั้น G ∈ H ⇒ G ∈ G ดังนั้นในลักษณะที่คล้ายคลึงกันก่อนหน้านี้เรามีความคาดหวังแบบมีเงื่อนไขของ W ที่ให้ Hกล่าวว่า U = E ( W ∣ H )WGσH⊆GG∈H⇒G∈GWHที่โดดเด่นด้วย U=E(W∣H)a.s.
E(U⋅1G)=E(W⋅1G)∀G∈H[2]
ตั้งแต่สมการ[ 1 ]และ[ 2 ]ให้เราH⊆G[1][2]
E(U⋅1G)=E(Y⋅1G)∀G∈H[3]
แต่นี้เป็นกำหนดคุณสมบัติของความคาดหวังที่มีเงื่อนไขของให้H YHดังนั้นเรามีสิทธิ์เขียน
เนื่องจากเรามีการก่อสร้างด้วย U = E ( W ∣ H ) = E ( E [ Y ∣ G ] ∣ H )เราเพิ่งพิสูจน์สมบัติของ Tower หรือรูปแบบทั่วไปของกฎแห่งความคาดหวังซ้ำ - ในแปดบรรทัดU=E(Y∣H)a.s.
U=E(W∣H)=E(E[Y∣G]∣H)