โมเดลการถดถอยเชิงเส้นที่เหมาะสมที่สุดสำหรับข้อมูลที่มีข้อผิดพลาด


9

ฉันกำลังมองหาอัลกอริทึมการถดถอยเชิงเส้นที่เหมาะสมที่สุดสำหรับข้อมูลที่ตัวแปรอิสระ (x) มีข้อผิดพลาดการวัดค่าคงที่และตัวแปรตาม (y) มีข้อผิดพลาดขึ้นอยู่กับสัญญาณ

ป้อนคำอธิบายรูปภาพที่นี่

ภาพด้านบนแสดงคำถามของฉัน


1
หากตัวแปรค่าคงที่ x มีข้อผิดพลาดในการวัดค่าคงที่และข้อผิดพลาดจะใช้เพื่อให้น้ำหนักกับตัวแปรในลักษณะที่สัมพันธ์กันเท่านั้นสถานการณ์นี้ไม่เทียบเท่ากับไม่มีข้อผิดพลาดใน x ใช่หรือไม่
pedrofigueira

2
@pedro นั่นไม่ใช่กรณีเนื่องจากข้อผิดพลาดในไม่เพียง แต่น้ำหนักในสูตร ด้วยการถดถอยข้อผิดพลาดในตัวแปรพอดีจะแตกต่างกันและการประมาณค่าความแปรปรวนร่วมของพารามิเตอร์จะแตกต่างจากการถดถอยปกติ x
whuber

1
ขอบคุณสำหรับการชี้แจง คุณช่วยขยายให้หน่อยได้ไหมว่าทำไมถึงเป็นเช่นนั้น
pedrofigueira

คำตอบ:


2

ข้อผิดพลาดการวัดในตัวแปรตาม

ได้รับแบบจำลองเชิงเส้นทั่วไป กับ homosckedastic ไม่ใช่ autocorrelated และไม่เกี่ยวข้องกับตัวแปรอิสระปล่อยให้แสดงถึงตัวแปร "จริง" และมาตรการที่สังเกตได้ ข้อผิดพลาดการวัดถูกกำหนดเป็นความแตกต่างของพวกเขา ดังนั้นแบบจำลองที่ประเมินได้คือ: เนื่องจากคือ สังเกตได้เราสามารถประมาณแบบจำลองโดย OLS หากข้อผิดพลาดการวัดในเป็นอิสระจากแต่ละตัวแปรอธิบายแล้ว

(1)y=β0+β1x1++βkxk+ε
εyy
e=yy
(2)y=β0+β1x1++βkxk+e+ε
y,x1,,xky(e+ε)แบ่งปันคุณสมบัติเดียวกันกับและขั้นตอนการอนุมาน OLS ตามปกติ ( สถิติฯลฯ ) ถูกต้อง อย่างไรก็ตามในกรณีของคุณผมจะคาดหวังที่เพิ่มขึ้นของความแปรปรวนอีคุณสามารถใช้:εte
  • เครื่องประมาณกำลังสองน้อยที่สุดถ่วงน้ำหนัก (เช่นKutner et al. , §11.1; Verbeek , §4.3.1-3)

  • ตัวประมาณ OLS ซึ่งยังคงเป็นกลางและสอดคล้องกันและข้อผิดพลาดมาตรฐานที่สอดคล้องกันแบบ heteroskedasticity หรือเพียงแค่ข้อผิดพลาดมาตรฐาน Wite ( Verbeek , §4.3.4)

ข้อผิดพลาดการวัดในตัวแปรอิสระ

เมื่อพิจารณาจากโมเดลเชิงเส้นเดียวกันกับข้างบนให้แทนค่า "จริง" และการวัดที่สังเกตได้ ข้อผิดพลาดการวัดอยู่ในขณะนี้: มีสองสถานการณ์หลัก ( Wooldridge , §4.4.2)xkxk

ek=xkxk
  • Cov(xk,ek)=0 : ข้อผิดพลาดการวัดไม่เกี่ยวข้องกับการวัดที่สังเกตและจะต้องมีความสัมพันธ์กับตัวแปรที่ไม่ได้สังเกต ; เขียนและเสียบนี้ลงใน (1): ตั้งแต่และทั้งสอง uncorrelated กับแต่ละรวมทั้งวัดเพียง เพิ่มความแปรปรวนของข้อผิดพลาดและไม่ละเมิดสมมติฐาน OLS ใด ๆxkxk=xkek

    y=β0+β1x1++βkxk+(εβkek)
    εexjxk
  • Cov(xk,ηk)=0 : ข้อผิดพลาดในการวัดไม่เกี่ยวข้องกับตัวแปรที่ไม่ได้ตรวจสอบดังนั้นจึงต้องสัมพันธ์กับการวัดที่สังเกตเห็น ; ความสัมพันธ์เช่นนี้ทำให้เกิด prolems และการถดถอยของ OLS ของใน dotโดยทั่วไปให้ตัวประมาณค่าแบบเอนเอียงและไม่เอนเอียงxkyx1,,xk

เท่าที่ฉันสามารถเดาได้โดยดูที่พล็อตของคุณ (ข้อผิดพลาดที่มีศูนย์กลางอยู่ที่ค่า "จริง" ของตัวแปรอิสระ) สถานการณ์แรกอาจนำไปใช้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.