ฉันกำลังมองหาอัลกอริทึมการถดถอยเชิงเส้นที่เหมาะสมที่สุดสำหรับข้อมูลที่ตัวแปรอิสระ (x) มีข้อผิดพลาดการวัดค่าคงที่และตัวแปรตาม (y) มีข้อผิดพลาดขึ้นอยู่กับสัญญาณ
ภาพด้านบนแสดงคำถามของฉัน
ฉันกำลังมองหาอัลกอริทึมการถดถอยเชิงเส้นที่เหมาะสมที่สุดสำหรับข้อมูลที่ตัวแปรอิสระ (x) มีข้อผิดพลาดการวัดค่าคงที่และตัวแปรตาม (y) มีข้อผิดพลาดขึ้นอยู่กับสัญญาณ
ภาพด้านบนแสดงคำถามของฉัน
คำตอบ:
ข้อผิดพลาดการวัดในตัวแปรตาม
ได้รับแบบจำลองเชิงเส้นทั่วไป กับ homosckedastic ไม่ใช่ autocorrelated และไม่เกี่ยวข้องกับตัวแปรอิสระปล่อยให้แสดงถึงตัวแปร "จริง" และมาตรการที่สังเกตได้ ข้อผิดพลาดการวัดถูกกำหนดเป็นความแตกต่างของพวกเขา ดังนั้นแบบจำลองที่ประเมินได้คือ: เนื่องจากคือ สังเกตได้เราสามารถประมาณแบบจำลองโดย OLS หากข้อผิดพลาดการวัดในเป็นอิสระจากแต่ละตัวแปรอธิบายแล้ว
เครื่องประมาณกำลังสองน้อยที่สุดถ่วงน้ำหนัก (เช่นKutner et al. , §11.1; Verbeek , §4.3.1-3)
ตัวประมาณ OLS ซึ่งยังคงเป็นกลางและสอดคล้องกันและข้อผิดพลาดมาตรฐานที่สอดคล้องกันแบบ heteroskedasticity หรือเพียงแค่ข้อผิดพลาดมาตรฐาน Wite ( Verbeek , §4.3.4)
ข้อผิดพลาดการวัดในตัวแปรอิสระ
เมื่อพิจารณาจากโมเดลเชิงเส้นเดียวกันกับข้างบนให้แทนค่า "จริง" และการวัดที่สังเกตได้ ข้อผิดพลาดการวัดอยู่ในขณะนี้: มีสองสถานการณ์หลัก ( Wooldridge , §4.4.2)
: ข้อผิดพลาดการวัดไม่เกี่ยวข้องกับการวัดที่สังเกตและจะต้องมีความสัมพันธ์กับตัวแปรที่ไม่ได้สังเกต ; เขียนและเสียบนี้ลงใน (1): ตั้งแต่และทั้งสอง uncorrelated กับแต่ละรวมทั้งวัดเพียง เพิ่มความแปรปรวนของข้อผิดพลาดและไม่ละเมิดสมมติฐาน OLS ใด ๆ
: ข้อผิดพลาดในการวัดไม่เกี่ยวข้องกับตัวแปรที่ไม่ได้ตรวจสอบดังนั้นจึงต้องสัมพันธ์กับการวัดที่สังเกตเห็น ; ความสัมพันธ์เช่นนี้ทำให้เกิด prolems และการถดถอยของ OLS ของใน dotโดยทั่วไปให้ตัวประมาณค่าแบบเอนเอียงและไม่เอนเอียง
เท่าที่ฉันสามารถเดาได้โดยดูที่พล็อตของคุณ (ข้อผิดพลาดที่มีศูนย์กลางอยู่ที่ค่า "จริง" ของตัวแปรอิสระ) สถานการณ์แรกอาจนำไปใช้