ปัญหาเกี่ยวกับการพิสูจน์ความคาดหวังตามเงื่อนไขว่าเป็นตัวพยากรณ์ที่ดีที่สุด


19

ฉันมีปัญหากับการพิสูจน์

E(Y|X)argming(X)E[(Yg(X))2]

ซึ่งน่าจะเปิดเผยความเข้าใจผิดที่คาดการณ์ไว้อย่างลึกซึ้งและความคาดหวังตามเงื่อนไข

หลักฐานที่ฉันรู้จะเป็นดังนี้ (สามารถพบหลักฐานอีกรุ่นหนึ่งได้ที่นี่ )

หาเรื่องนาทีก.(X)E[(Y-ก.(x))2]=หาเรื่องนาทีก.(X)E[(Y-E(Y|X)+E(Y|X)-ก.(X))2]=หาเรื่องนาทีก.(x)E[(Y-E(Y|X))2+2(Y-E(Y|X))(E(Y|X)-ก.(X))+(E(Y|X)-ก.(X))2]=หาเรื่องนาทีก.(x)E[2(Y-E(Y|X))(E(Y|X)-ก.(X))+(E(Y|X)-ก.(X))2]

โดยทั่วไปแล้วข้อพิสูจน์จะยังคงมีข้อโต้แย้งแสดงว่าและด้วยเหตุนี้2E[(Y-E(Y|X))(E(Y|X)-ก.(X))]=0

หาเรื่องนาทีก.(x)E[(Y-ก.(x))2]=หาเรื่องนาทีก.(x)E[(E(Y|X)-ก.(X))2]

ซึ่งสามารถมองเห็นที่จะลดลงเมื่อก.(X)=E(Y|X)X)

ปริศนาของฉันเกี่ยวกับการพิสูจน์ดังต่อไปนี้:

  1. พิจารณา

E[2(Y-E(Y|X))(E(Y|X)-ก.(X))+(E(Y|X)-ก.(X))2]บิ๊ก]

สำหรับฉันแล้วดูเหมือนว่าเป็นอิสระจากการโต้แย้งใด ๆ ที่แสดงว่าเทอมแรกมีค่าเท่ากับศูนย์เสมอเราจะเห็นว่าการตั้งค่าก.(X)=E(Y|X)ลดการแสดงออกเมื่อมันมีความหมาย(E(Y|X)-ก.(X))=0และด้วยเหตุนี้

E[2(Y-E(Y|X))(E(Y|X)-ก.(X))+(E(Y|X)-ก.(X))2]=E(0+0) = 0

แต่ถ้าเรื่องนี้เป็นเรื่องจริงคนหนึ่งอาจทำซ้ำการพิสูจน์แทนโดยฟังก์ชั่นอื่น ๆ ของ , พูดและได้ข้อสรุปว่ามันเป็นที่ลดการแสดงออก ดังนั้นจะต้องมีสิ่งที่ฉันเข้าใจผิด (ใช่ไหม)X h ( X ) h ( X )E(Y|X)Xชั่วโมง(X)ชั่วโมง(X)

  1. ฉันมีข้อสงสัยเกี่ยวกับความหมายของในการแถลงปัญหา สัญกรณ์ควรตีความได้อย่างไร? มันหมายความว่าE[(Y-ก.(X))2]

E Y [ ( Y - g ( X ) ) 2 ] E X Y [ ( Y - g ( X ) ) 2 ]EX[(Y-ก.(X))2] ,หรือ ?EY[(Y-ก.(X))2]EXY[(Y-ก.(X))2]

คำตอบ:


11

(นี่คือการดัดแปลงจาก Granger & Newbold (1986) "ซีรีย์การพยากรณ์เศรษฐกิจแบบเวลา")

โดยการก่อสร้างของฟังก์ชั่นค่าใช้จ่ายข้อผิดพลาดเป็น 2 นี้จะรวมเป็นสมมติฐานที่สำคัญ (ที่ฟังก์ชั่นค่าใช้จ่ายข้อผิดพลาดคือสมมาตรรอบศูนย์) -a ฟังก์ชั่นค่าใช้จ่ายข้อผิดพลาดที่แตกต่างกันจะไม่จำเป็นต้องมีค่าคาดว่าเงื่อนไขเป็นของมูลค่าที่คาดว่าจะ คุณไม่สามารถลดฟังก์ชั่นค่าใช้จ่ายข้อผิดพลาดให้น้อยที่สุดเนื่องจากมีจำนวนที่ไม่รู้จัก ดังนั้นคุณตัดสินใจที่จะลดค่าที่คาดหวังไว้แทน จากนั้นฟังก์ชั่นวัตถุประสงค์ของคุณจะกลายเป็นหาเรื่องนาที[Yg(X)]2argmin

E[Yg(X)]2=[yg(X)]2fY|X(y|x)dy

ซึ่งฉันเชื่อว่ายังตอบคำถามที่สองของคุณ มันง่ายว่ามูลค่าที่คาดว่าจะเป็นเงื่อนไขในเนื่องจากเรากำลังพยายามที่จะประเมิน / การคาดการณ์บนพื้นฐานของXย่อยสลายสี่เหลี่ยมเพื่อให้ได้X Y XYXYX

E[Yg(X)]2=y2fY|X(y|x)dy2g(X)yfY|X(y|x)dy+[g(X)]2fY|X(y|x)dy

เทอมแรกไม่มีดังนั้นจึงไม่มีผลต่อการย่อขนาดและมันสามารถถูกละเว้นได้ อินทิกรัลในระยะที่สองเท่ากับค่าคาดหวังตามเงื่อนไขของกำหนดและอินทิกรัลในระยะสุดท้ายเท่ากับความสามัคคี ดังนั้นY Xg(X)YX

argming(x)E[Yg(X)]2=argming(x){2g(X)E(YX)+[g(X)]2}

อนุพันธ์อันดับแรก wrtคือนำไปสู่เงื่อนไขการสั่งซื้อครั้งแรกสำหรับการย่อในขณะที่อนุพันธ์อันดับสองเท่ากับซึ่งเพียงพอสำหรับขั้นต่ำ- 2 E ( Y X ) + 2 g ( X ) g ( X ) = E ( Y X )ก.(X)-2E(Y|X)+2ก.(X)ก.(X)=E(Y|X)2>0

เพิ่ม: ตรรกะของวิธีการพิสูจน์ "เพิ่มและลบ"

OP สับสนด้วยวิธีการที่ระบุไว้ในคำถามเพราะดูเหมือนว่าซ้ำซาก ไม่ใช่เพราะในขณะที่ใช้กลยุทธ์การเพิ่มและลบทำให้ส่วนหนึ่งของฟังก์ชันวัตถุประสงค์เป็นศูนย์สำหรับการเลือกคำศัพท์ที่เพิ่มและลบโดยพลการมันไม่ได้ทำให้ฟังก์ชั่นค่าเท่ากันคือค่าของวัตถุประสงค์ การประเมินฟังก์ชั่นที่ตัวลดขนาดตัวเลือก

สำหรับตัวเลือกเรามีฟังก์ชั่นค่า สำหรับตัวเลือกโดยพลการเรามีค่า funtionบิ๊ก]V ( E ( Y | X ) ) = E [ ( Y - E ( Y | X ) ) 2 | X ]กรัม( X ) = H ( X ) V ( H ( X ) ) = E [ ( Y - h (ก.(X)=E(Y|X)V(E(YX))=E[(YE(YX))2X]g(X)=h(X)V(h(X))=E[(Yh(X))2X]

ฉันอ้างว่า

E ( Y 2X ) - 2 E [ ( Y E ( Y X ) ) X ] + E [ ( E ( Y X ) ) 2X ]

V(E(YX))V(h(X))
E(Y2X)2E[(YE(YX))X]+E[(E(YX))2X]E(Y2X)2E[(Yh(X))X]+E[(h(X))2X]

เทอมแรกของ LHS และ RHS ยกเลิก นอกจากนี้ยังทราบว่าความคาดหวังด้านนอกเป็นเงื่อนไขในการXด้วยคุณสมบัติของความคาดหวังตามเงื่อนไขที่เรามีX

...2E(YX)E(YX)+[E(YX)]22E(YX)h(X)+[h(X)]2

0[E(YX)]22E(YX)h(X)+[h(X)]2

h ( x ) E ( Y X ) E ( Y X )

0[E(YX)h(x)]2
ซึ่งถือกับความไม่เท่าเทียมกันที่เข้มงวดถ้าX) ดังนั้นจึงเป็นตัวย่อขนาดและไม่ซ้ำใครh(x)E(YX)E(YX)

แต่สิ่งนี้ยังบอกว่าวิธีการ "เพิ่มและลบ" ไม่ใช่วิธีการพิสูจน์ที่สว่างที่สุดที่นี่


ขอบคุณสำหรับคำตอบ ช่วยชี้แจงคำถามที่สองของฉัน ในขณะที่ฉันพยายามสื่อในชื่อคำถามประเด็นหลักของฉัน (ฉบับแรกในโพสต์) เป็นเรื่องเกี่ยวกับกลไกการพิสูจน์ ความกังวลหลักของฉันคือเกี่ยวกับความเข้าใจของฉันของหลักฐานที่ฉันนำเสนอในคำถาม ดังที่ฉันได้อธิบายความเข้าใจของฉันเกี่ยวกับการพิสูจน์ทำให้ฉันมีคำแถลงที่โจ่งแจ้งอย่างมีปัญหา ดังนั้นฉันอยากจะเข้าใจว่าข้อผิดพลาดของฉันคือมันอาจเปิดเผยความเข้าใจที่คลาดเคลื่อนเกี่ยวกับแนวคิดของการตอบสนองและความคาดหวังตามเงื่อนไข มีความคิดเห็นเกี่ยวกับเรื่องนี้ไหม?
Martin Van der Linden

1
ฉันเพิ่มคำอธิบายบางอย่างเกี่ยวกับวิธีการ "เพิ่มและลบ" เพื่อพิสูจน์
Alecos Papadopoulos

ใช้เวลาสักครู่เพื่อทำความเข้าใจ แต่ในที่สุดฉันก็ได้รับข้อผิดพลาดพื้นฐาน: จริงพอเมื่อแต่ไม่ได้หมายความว่าลดการแสดงออก . ไม่มีเหตุผลใดที่นิพจน์วงเล็บเหลี่ยมต้องไม่ต่ำกว่าศูนย์ เนื่องจากเครื่องหมายลบที่ด้านหน้าเราสามารถหาเช่น . g ( X ) = h ( X ) h ( X ) ( Y - h ( X ) ) (E[2(Yh(X))(h(X)g(X))+(h(X)g(X))2]=0ก.(X)=ชั่วโมง(X)ชั่วโมง(X) g ( X ) E [ - 2 ( Y - h ( X ) ) ( h ( X ) - g ( X ) ) + ( h ( X ) - g ( X ) ) 2 ] < 0(Y-ชั่วโมง(X))(ชั่วโมง(X)-ก.(X))ก.(X)E[-2(Y-ชั่วโมง(X))(ชั่วโมง(X)-ก.(X))+(ชั่วโมง(X)-ก.(X))2]<0
Martin Van der Linden

1
อืม ... เครื่องหมายลบในนิพจน์ที่คุณอ้างถึงเป็นข้อผิดพลาด - ควรเป็นเครื่องหมายบวก แน่นอนคุณสามารถจัดเรียงเงื่อนไขใหม่เพื่อให้ได้เครื่องหมายลบ ... สิ่งนี้ส่งผลกระทบต่อสัญชาตญาณที่คุณได้รับหรือไม่?
Alecos Papadopoulos

ขอขอบคุณที่ติดตามคำถาม ฉันแก้ไขโพสต์เริ่มต้นเพื่อแก้ไขข้อผิดพลาดนี้ โชคดีที่ฉันคิดว่ามันไม่ได้ทำร้ายสัญชาตญาณที่ได้รับ ที่จริงแล้วมันช่วยให้ฉันเข้าใจถึงความผิดพลาดอีกครั้ง: ฉันคิดว่าเครื่องหมายลบเป็นสิ่งสำคัญที่จะรับประกันว่าไม่จำเป็นต้องมีค่าต่ำสุดของ2] แต่ฉันรู้ว่านี่ไม่ใช่แค่สัญญาณก่อนหน้า 2 (หวังว่า) สิ่งที่ฉันต้องเข้าใจจริงๆคือโดยทั่วไป (เช่นสำหรับ )ไม่จำเป็นต้องย่อให้เล็กสุดเมื่อ (ใช่ไหม?) E [ - 2 ( Y - h ( X ) ) ( h ( X ) - g ( X)0h ( X ) E [ 2 ( Y - X ) ) ] g ( X ) = h ( X )E[-2(Y-ชั่วโมง(X))(ชั่วโมง(X)-ก.(X))+(ชั่วโมง(X)-ก.(X))2]ชั่วโมง(X)E[2(Y-ชั่วโมง(X))(ชั่วโมง(X)-ก.(X))]ก.(X)=ชั่วโมง(X)
Martin Van der Linden

5

โปรดทราบว่าเพื่อพิสูจน์คำตอบคุณจำเป็นต้องแสดงให้เห็นเท่านั้น

E[-2(Y-E(Y|X))(E(Y|X)-ก.(X))]=0

สำหรับสิ่งที่คาดหวังว่าจะได้รับ

หาเรื่องนาทีก.(X)E[(Y-ก.(X))2]

ไม่ได้ทำให้รู้สึกเป็นเป็นตัวแปรสุ่มถ้าเป็นและไม่X} แสดงว่าคุณควรเขียนหรือเพื่อทำให้ชัดเจน ตอนนี้เมื่อได้รับการชี้แจงคำว่าเป็นค่าคงที่และสามารถดึงออกนอกการประมาณค่าและคุณมี:E E X Y E Y | X E [ ( Y - g ( X ) ) 2 | X ] E Y | Xก.(X)EEXYEY|XE[(Y-ก.(X))2|X]( E(Y|XEY|X[(Y-ก.(X))2](E(Y|X)-ก.(X))

-2(E(Y|X)-ก.(X))E[(Y-E(Y|X))|X]=-2(E(Y|X)-ก.(X))[E(Y|X)-E[E(Y|X)|X]]=-2(E(Y|X)-ก.(X))[E(Y|X)-E(Y|X)]=0

ดังนั้นคุณสามารถเขียนฟังก์ชันวัตถุประสงค์เป็น:

EY|X[(Y-ก.(X))2]=EY|X[(Y-EY|X(Y|X))2]+(EY|X(Y|X)-ก.(X))2

ตัวย่อที่เห็นได้ชัดจากที่นี่ โปรดทราบว่าหากคุณมีค่าเฉลี่ยมากกว่าเช่นกันสามารถใช้อาร์กิวเมนต์ที่คล้ายคลึงกันเพื่อแสดง:X

EX[(E(Y|X)-ก.(X))2]=EX[(EY|X(Y|X)-EX[EY|X(Y|X)])2]+(EX[EY|X(Y|X)]-EX[ก.(X)])2

นี่แสดงให้เห็นว่าถ้าคุณตั้งค่าสำหรับแต่ละคุณก็จะมีตัวย่อขนาดเล็กกว่าฟังก์ชันนี้เช่นกัน ดังนั้นในความรู้สึกบางอย่างมันไม่ได้เรื่องจริงๆไม่ว่าจะเป็นเป็นหรือX}ก.(X)=EY|X(Y|X)XEEYXEY|X


3

มีมุมมองทางคณิตศาสตร์ที่ง่ายมาก สิ่งที่คุณมีคือปัญหาการฉายภาพในอวกาศของฮิลแบร์ตเหมือนกับการฉายเวกเตอร์ในไปยังพื้นที่ย่อยRn

อนุญาตแสดงถึงความน่าจะเป็นพื้นฐาน สำหรับปัญหาที่เกิดขึ้นจะทำให้ความรู้สึกพิจารณาตัวแปรสุ่มที่มีช่วงเวลาที่สองแน่นอนนั่นคือพื้นที่ HilbertMU) ปัญหาคือตอนนี้: กำหนดค้นหาภาพของ ลงบนพื้นที่ย่อยที่เป็น -subalgebra ของสร้างโดยX(เช่นเดียวกับในกรณีขอบเขต จำกัด การย่อระยะห่างจากพื้นที่ย่อยหมายถึงการค้นหาการฉายภาพ) การฉายภาพที่ต้องการคือ(Ω,F,μ)L2(Ω,F,μ)X,YL2(Ω,F,μ)YL2(Ω,FX,μ)FXσFXL2E(X|Y)โดยการก่อสร้าง (นี่คือลักษณะๆ ถ้ามีคนตรวจสอบหลักฐานการมีอยู่)E(X|Y)


นี่คือการตอบสนองที่สวยงาม
jII

0

เกี่ยวกับคำถามสุดท้ายของคุณความคาดหวังอาจเป็น wrt (ข้อผิดพลาดที่ไม่มีเงื่อนไข) หรือ wrt (ข้อผิดพลาดตามเงื่อนไขที่แต่ละค่า ) อย่างมีความสุขการลดความผิดพลาดตามเงื่อนไขในแต่ละค่ายังช่วยลดข้อผิดพลาดที่ไม่มีเงื่อนไขดังนั้นนี่จึงไม่ใช่ความแตกต่างที่สำคัญพี(x,Y)พี(Y|x)X=xX=x

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.