สัญชาตญาณเกี่ยวกับเครื่องหมาย "บวก" ที่เกี่ยวข้องกับความแปรปรวน (จากข้อเท็จจริงที่ว่าแม้เมื่อเราคำนวณความแปรปรวนของความแตกต่างของตัวแปรสุ่มอิสระเราเพิ่มความแปรปรวน) นั้นถูกต้อง แต่ไม่สมบูรณ์อย่างร้ายแรง: หากตัวแปรสุ่มที่เกี่ยวข้องไม่อิสระ จากนั้นก็มีส่วนร่วมกับความแปรปรวนร่วมและความแปรปรวนร่วมอาจเป็นลบ มีการแสดงออกที่เป็นอยู่เกือบจะเหมือนการแสดงออกในคำถามก็คิดว่ามัน "ควร" จะโดย OP (และผม) และมันก็เป็นความแปรปรวนของการทำนายผิดพลาดแสดงว่ามันที่y 0 = β 0 +e0=y0−y^0 :y0=β0+β1x0+u0
วาร์( e0) = σ2⋅ ( 1 + 1n+ ( x0-x¯)2Sx x)
ความแตกต่างที่สำคัญระหว่างความแปรปรวนของข้อผิดพลาดการทำนายและความแปรปรวนของการประมาณค่าข้อผิดพลาด (เช่นของที่เหลือ) เป็นคำว่าข้อผิดพลาดของการสังเกตที่คาดการณ์ไม่ได้มีความสัมพันธ์กับประมาณการเนื่องจากค่าถูกไม่ได้นำมาใช้ในการสร้าง ตัวประมาณและคำนวณค่าประมาณเป็นค่าที่ไม่อยู่ในกลุ่มตัวอย่างY0
พีชคณิตสำหรับรายได้ทั้งสองในลักษณะเดียวกันถึงจุด (ใช้0แทนฉัน ) แต่แล้ว diverges โดยเฉพาะ:0ผม
ในเชิงเส้นอย่างง่ายถดถอย , Var ( U ฉัน ) = σ 2ความแปรปรวนของประมาณการβ = ( β 0 , β 1 ) 'ยังคงเป็นYผม= β0+ β1xผม+ uผมวาร์(คุณผม) = σ2β^= ( β^0, β^1)'
วาร์( β^) = σ2( X'X )- 1
เรามี
X′X=[n∑xi∑xi∑x2i]
และอื่น ๆ
( X'X )- 1= [ ∑ x2ผม- ∑ xผม- ∑ xผมn] ⋅ [ n ∑ x2ผม- ( ∑ xผม)2]- 1
เรามี
[ n ∑ x2ผม- ( ∑ xผม)2] = [ n ∑ x2ผม- n2x¯2] =n [ ∑ x2ผม- n x¯2]= n ∑ ( x2ผม- x¯2) ≡ n Sx x
ดังนั้น
( X'X )- 1= [ ( 1 / n ) ∑ x2ผม- x¯- x¯1] ⋅(1 / Sx x)
ซึ่งหมายความว่า
Var(β^0)=σ2(1n∑x2i)⋅ (1/Sxx)=σ2nSxx+nx¯2Sxx=σ2(1n+x¯2Sxx)
Var(β^1)=σ2(1/Sxx)
Cov(β^0,β^1)=−σ2(x¯/Sxx)
-th ที่เหลือถูกกำหนดให้เป็นi
u^i=yi−y^i=(β0−β^0)+(β1−β^1)xi+ui
ค่าสัมประสิทธิ์ที่เกิดขึ้นจริงจะถือว่าเป็นค่าคงที่ regressor ได้รับการแก้ไข (หรือเงื่อนไขในนั้น) และมีศูนย์ความแปรปรวนที่มีระยะเวลาข้อผิดพลาดแต่ประมาณมีความสัมพันธ์กับระยะผิดพลาดเพราะประมาณมีตัวแปรตามและตัวแปรตาม มีคำข้อผิดพลาด ดังนั้นเราจึงมี
Var(u^i)=[Var(ui)+Var(β^0)+x2iVar(β^1)+2xiCov(β^0,β^1)]+2Cov([(β0−β^0)+(β1−β^1)xi],ui)
=[σ2+σ2(1n+x¯2Sxx)+x2iσ2(1/Sxx)+2Cov([(β0−β^0)+(β1−β^1)xi],ui)
แพ็คมันขึ้นมาเล็กน้อยเพื่อรับ
Var(u^i)=[σ2⋅(1+1n+(xi−x¯)2Sxx)]+2Cov([(β0−β^0)+(β1−β^1)xi],ui)
คำในวงเล็บใหญ่มีตรงโครงสร้างเดียวกันกับความแปรปรวนของข้อผิดพลาดการทำนายที่มีการเปลี่ยนแปลงเพียงอย่างเดียวว่าแทนที่จะเราจะมีx 0 (และความแปรปรวนจะเป็นที่ของอี0และไม่ได้ของยูฉัน ) คำแปรปรวนสุดท้ายเป็นศูนย์สำหรับข้อผิดพลาดการทำนายเพราะY 0และด้วยเหตุนี้ยู0จะไม่รวมอยู่ในตัวประมาณ แต่ไม่เป็นศูนย์สำหรับข้อผิดพลาดการประมาณค่าเพราะY ฉันและด้วยเหตุนี้ยูฉันเป็นส่วนหนึ่งของกลุ่มตัวอย่างและดังนั้นจึงเป็นที่รวมอยู่ใน ประมาณการ เรามีxix0e0u^iy0u0yiui
2Cov([(β0−β^0)+(β1−β^1)xi],ui)=2E([(β0−β^0)+(β1−β^1)xi]ui)
=−2E(β^0ui)−2xiE(β^1ui)=−2E([y¯−β^1x¯]ui)−2xiE(β^1ui)
การเปลี่ยนตัวผู้เล่นที่ผ่านมาจากวิธีβ 0มีการคำนวณ อย่างต่อเนื่องβ^0
...=−2E(y¯ui)−2(xi−x¯)E(β^1ui)=−2σ2n−2(xi−x¯)E[∑(xi−x¯)(yi−y¯)Sxxui]
=−2σ2n−2(xi−x¯)Sxx[∑(xi−x¯)E(yiui−y¯ui)]
=−2σ2n−2(xi−x¯)Sxx[−σ2n∑j≠i(xj−x¯)+(xi−x¯)σ2(1−1n)]
=−2σ2n−2(xi−x¯)Sxx[−σ2n∑(xi−x¯)+(xi−x¯)σ2]
=−2σ2n−2(xi−x¯)Sxx[0+(xi−x¯)σ2]=−2σ2n−2σ2(xi−x¯)2Sxx
เราใส่สิ่งนี้ลงในนิพจน์สำหรับความแปรปรวนของส่วนที่เหลือเราได้
Var(u^i)=σ2⋅(1−1n−(xi−x¯)2Sxx)
ดังนั้นปิดข้อความที่ OP ใช้
(ฉันได้ข้ามพีชคณิตมาแล้วไม่น่าแปลกใจที่พีชคณิต OLS ถูกสอนน้อยลงทุกวันนี้ ... )
สัญชาตญาณบางอย่าง
ดังนั้นจึงปรากฏว่าสิ่งที่ทำงาน "กับ" เรา (ความแปรปรวนขนาดใหญ่) เมื่อทำนายการทำงาน "สำหรับเรา" (ความแปรปรวนต่ำกว่า) เมื่อประมาณ นี่เป็นจุดเริ่มต้นที่ดีสำหรับคนที่จะไตร่ตรองว่าทำไมความพอดีที่ยอดเยี่ยมอาจเป็นสัญญาณที่ไม่ดีสำหรับความสามารถในการทำนายของแบบจำลอง
ความจริงที่ว่าเรามีการประเมินมูลค่าที่คาดหวังของ regressor ที่ลดความแปรปรวนโดย n ทำไม? เพราะโดยการประมาณเรา "ปิดตาของเรา" กับความแปรปรวนข้อผิดพลาดบางอย่างที่มีอยู่ในตัวอย่างเนื่องจากเราประเมินค่าที่คาดหวังเป็นหลัก ยิ่งกว่านั้นยิ่งใหญ่1/nเบี่ยงเบนของการสังเกตของ regressor จาก regressor ของค่าเฉลี่ยของกลุ่มตัวอย่างนั้นที่มีขนาดเล็กความแปรปรวนของที่เหลือเกี่ยวข้องกับการสังเกตนี้จะเป็น ... ที่มากกว่าที่เบี่ยงเบนสังเกตที่น้อยกว่าที่เบี่ยงเบนของที่เหลือ ... มันเป็นความแปรปรวนของ regressorsที่เหมาะกับเราโดย "รับตำแหน่ง" ของความแปรปรวนที่ไม่รู้จักที่ไม่รู้จัก
แต่นั่นเป็นสิ่งที่ดีสำหรับการประมาณค่า สำหรับการคาดเดาสิ่งเดียวกันทำให้เรา: ตอนนี้โดยไม่คำนึงถึง แต่ไม่สมบูรณ์ความแปรปรวนใน (เนื่องจากเราต้องการที่จะทำนายมัน) ผู้ประมาณค่าที่ไม่สมบูรณ์ของเราที่ได้จากตัวอย่างแสดงจุดอ่อนของพวกเขา: เราประเมินตัวอย่าง หมายความว่าเราไม่ทราบค่าที่คาดหวังที่แท้จริง - ความแปรปรวนเพิ่มขึ้น เรามีx 0ที่อยู่ห่างไกลจากค่าเฉลี่ยของกลุ่มตัวอย่างตามที่คำนวณได้จากข้อสังเกตอื่น ๆ -too ไม่ดีแปรปรวนข้อผิดพลาดการคาดการณ์ของเราได้รับเพิ่มอีกเพราะคาดการณ์ปี 0y0x0 y^0จะมีแนวโน้มที่จะหลงทาง ... ในภาษาวิทยาศาสตร์มากกว่า "ตัวทำนายที่ดีที่สุดในแง่ของการลดความผิดพลาดในการทำนายที่ลดลงแสดงถึงการหดตัวไปสู่ค่าเฉลี่ยของตัวแปรภายใต้การทำนาย" เราไม่พยายามทำซ้ำความแปรปรวนของตัวแปรตาม - เราเพียงแค่พยายามอยู่ "ใกล้เคียงกับค่าเฉลี่ย"