หนึ่งในสมมติฐานของการถดถอยเชิงเส้นคือควรมีความแปรปรวนคงที่ในข้อผิดพลาดและว่าช่วงความเชื่อมั่นและการทดสอบสมมติฐานที่เกี่ยวข้องกับรูปแบบขึ้นอยู่กับสมมติฐานนี้ จะเกิดอะไรขึ้นเมื่อเงื่อนไขข้อผิดพลาดไม่มีความแปรปรวนคงที่
หนึ่งในสมมติฐานของการถดถอยเชิงเส้นคือควรมีความแปรปรวนคงที่ในข้อผิดพลาดและว่าช่วงความเชื่อมั่นและการทดสอบสมมติฐานที่เกี่ยวข้องกับรูปแบบขึ้นอยู่กับสมมติฐานนี้ จะเกิดอะไรขึ้นเมื่อเงื่อนไขข้อผิดพลาดไม่มีความแปรปรวนคงที่
คำตอบ:
ผลที่ตามมาของความแตกต่างคือ:
สี่เหลี่ยมน้อยสามัญ (OLS) ประมาณการยังคงสอดคล้องกันแต่มันไม่ได้อยู่ที่มีประสิทธิภาพ
การประมาณโดยที่คือไม่ได้ประมาณการสอดคล้องกันอีกต่อไปสำหรับเมทริกซ์ความแปรปรวนของประมาณการของคุณ{ข}} อาจมีความเอนเอียงและไม่สอดคล้องกัน และในทางปฏิบัติมันสามารถประเมินความแปรปรวนได้ต่ำเกินไป
คะแนน (1) อาจไม่ใช่ประเด็นสำคัญ ผู้คนมักจะใช้เครื่องมือประมาณการ OLS ธรรมดาอยู่ดี แต่ต้องระบุจุด (2) จะทำอย่างไร?
คุณจำเป็นต้องมีข้อผิดพลาดมาตรฐาน heteroscedasticity สอดคล้อง วิธีการมาตรฐานคือการพึ่งพาสมมติฐานขนาดใหญ่ผลเชิงซีโมติกและประเมินความแปรปรวนของโดยใช้:
สิ่งนี้ทำให้เกิดข้อผิดพลาดมาตรฐานที่สอดคล้องกับ heteroskedasticity พวกเขายังเป็นที่รู้จักกันในนามข้อผิดพลาดมาตรฐานของฮูเบอร์ - ไวท์ข้อผิดพลาดมาตรฐานที่มีประสิทธิภาพการประมาณ "แซนวิช" ฯลฯ ... แพคเกจสถิติมาตรฐานขั้นพื้นฐานใด ๆ มีตัวเลือกสำหรับข้อผิดพลาดมาตรฐานที่แข็งแกร่ง ใช้มัน!
ถ้า heteroskedasticity มีขนาดใหญ่พอประมาณการ OLS ปกติอาจมีปัญหาในทางปฏิบัติที่ยิ่งใหญ่ ในขณะที่ยังเป็นตัวประมาณที่สอดคล้องกันคุณอาจพบปัญหาตัวอย่างเล็กน้อยซึ่งการประมาณทั้งหมดของคุณได้รับแรงผลักดันจากการสังเกตความแปรปรวนเล็กน้อยและสูง (นี่คือสิ่งที่ @ seanv507 กำลังพูดถึงในความคิดเห็น) ตัวประมาณ OLS ไม่มีประสิทธิภาพในการให้น้ำหนักมากกว่าการสังเกตค่าความแปรปรวนสูงกว่าค่าที่เหมาะสม การประเมินอาจมีเสียงดังมาก
ปัญหาเกี่ยวกับการพยายามแก้ไขความไร้ประสิทธิภาพคือคุณอาจไม่ทราบเมทริกซ์ความแปรปรวนร่วมสำหรับเงื่อนไขข้อผิดพลาดดังนั้นการใช้บางอย่างเช่นGLSสามารถทำให้สิ่งเลวร้ายยิ่งขึ้นถ้าการประมาณค่าความแปรปรวนของคำว่าแปรปรวนเป็นขยะ
นอกจากนี้ข้อผิดพลาดมาตรฐานของ Huber-White ที่ฉันให้ไว้ข้างต้นอาจมีปัญหาใหญ่ในตัวอย่างเล็ก ๆ มีวรรณกรรมที่มีความยาวในหัวข้อนี้ เช่น. ดู Imbens and Kolesar (2016), "ข้อผิดพลาดมาตรฐานที่แข็งแกร่งในตัวอย่างเล็ก ๆ : คำแนะนำการใช้งานจริง"
หากนี่คือการศึกษาด้วยตนเองสิ่งที่ควรพิจารณาในทางปฏิบัติถัดไปคือข้อผิดพลาดมาตรฐานแบบกลุ่ม สิ่งเหล่านี้ถูกต้องสำหรับความสัมพันธ์โดยพลการภายในกลุ่ม
คำตอบสั้น ๆ นั้นก็คือแบบจำลองของคุณนั้นผิดเช่น
ดังนั้นในกรณีของปัญหาความแตกต่างของการประเมินความแปรปรวนร่วมกับเมทริกซ์ความแปรปรวนเกิดขึ้นซึ่งนำไปสู่ข้อผิดพลาดมาตรฐานที่ผิดพลาดของค่าสัมประสิทธิ์ซึ่งจะนำไปสู่สถิติที่ผิดและค่า p กล่าวโดยย่อถ้าคำผิดพลาดของคุณไม่มีความแปรปรวนคงที่แล้วสี่เหลี่ยมน้อยที่สุดไม่ใช่วิธีที่มีประสิทธิภาพที่สุดในการประมาณ มีลักษณะที่นี้คำถามที่เกี่ยวข้อง
"Heteroscedasticity" ทำให้ยากที่จะประเมินค่าเบี่ยงเบนมาตรฐานจริงของข้อผิดพลาดการคาดการณ์ สิ่งนี้สามารถนำไปสู่ช่วงความเชื่อมั่นที่กว้างเกินไปหรือแคบเกินไป (โดยเฉพาะอย่างยิ่งพวกเขาจะแคบเกินไปสำหรับการคาดการณ์ที่ไม่อยู่ในกลุ่มตัวอย่างหากความแปรปรวนของข้อผิดพลาดเพิ่มขึ้นเมื่อเวลาผ่านไป)
นอกจากนี้ตัวแบบการถดถอยอาจเน้นหนักไปที่ชุดย่อยของข้อมูล
การอ้างอิงที่ดี: การทดสอบสมมติฐานของการถดถอยเชิงเส้น