สูตร y ~ x + 0 ใน R คำนวณอะไรจริง ๆ


11

ความแตกต่างทางสถิติระหว่างการทำการถดถอยเชิงเส้นใน R กับformulaชุดเป็นy ~ x + 0แทนที่จะเป็นy ~ xอะไร? ฉันจะตีความผลลัพธ์ที่แตกต่างกันสองแบบได้อย่างไร

คำตอบ:


18

การเพิ่ม+0(หรือ-1) ลงในสูตรแบบจำลอง (เช่นในlm()) ใน R จะหยุดการสกัดกั้น โดยทั่วไปถือว่าเป็นสิ่งไม่ดีที่ต้องทำ ดู:

ความชันโดยประมาณจะถูกคำนวณต่างกันไปขึ้นอยู่กับว่าการประมาณค่าตัดแกนนั้นมีค่าเท่าไรกล่าวคือ:

(with intercept)β^1=xiyi(xi)(yi)Nxi2(xi)2N(without intercept)β^1=xiyixi2

เนื่องจากปริมาณที่จะลบ ("subtrahend") ทั้งในตัวเศษและตัวหารนั้นไม่จำเป็นต้องเป็นการประมาณค่าของความชันจะเอนเอียงเมื่อถูกสกัดกั้น 0

ค่าสำหรับนั้นจะถูกคำนวณด้วยเช่นกัน ดู: R2

นี่คือสูตรพื้นฐาน:

(with intercept)R2=1(yiy^i)2(yiy¯)2(without intercept)R2=1(yiy^i)2yi2

ขอบคุณ gung! ถ้าฉันระงับการสกัดกั้น R-squared หลายอันของฉันก็ดีขึ้นทันที คุณช่วยฉันออกจากที่นี่ได้ไหม
JimBoy

6
ไม่มีวิธีการคำนวณ r กำลังสองที่ตกลงกันโดยไม่มีการสกัดกั้น r กำลังสองไม่มีการตีความตามปกติ การถดถอยโดยปราศจากการสกัดกั้นมักเป็นความคิดที่เลวร้ายมาก
Repmat

@Repmat: ดูเพิ่มเติมstats.stackexchange.com/questions/171240/…


5

มันขึ้นอยู่กับบริบท (แน่นอน) ในlm(...)คำสั่งใน R มันจะหยุดการสกัดกั้น นั่นคือคุณจะถดถอยถึงที่มา

โปรดทราบว่าตำราเรียนส่วนใหญ่ในเรื่องของการถดถอยจะบอกคุณว่าการบังคับให้มีการสกัดกั้น (เป็นค่าใด ๆ ) เป็นความคิดที่ไม่ดี

การตีความของ x จะไม่เปลี่ยนแปลง แต่ค่า (เปรียบเทียบกับและไม่มีการสกัดกั้น) จะเปลี่ยนแปลงบางครั้งมีนัยสำคัญมาก


ขอบคุณ Repmat! ฉันได้รับการประมาณการที่แตกต่างกันมากถ้าฉันระงับการสกัดกั้นเมื่อเทียบกับเมื่อฉันไม่ทำ นอกจากนี้การทดสอบ t ทั้งหมดมีความสำคัญสูง คุณรู้ไหมว่าทำไมถึงเป็นเช่นนี้?
JimBoy

2
การสกัดกั้นจะดูดซับค่าที่ไม่ใช่ 0 หมายถึงตัวแปรที่ไม่มีอยู่ในตัวแบบ เมื่อมีการสกัดกั้นหายไปความแปรปรวนต้องไปที่ใดที่หนึ่ง นี่คือเหตุผลที่หนังสือส่วนใหญ่ตามกฎทั่วไประบุว่าการถดถอยที่ไม่มีการสกัดกั้นนั้นผิดเสมอไป นั่นคือ OLS มักจะลำเอียงเสมอและสอดคล้องกันในกรณีนี้ (มีข้อยกเว้นเล็กน้อย)
Repmat
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.