ความแตกต่างทางสถิติระหว่างการทำการถดถอยเชิงเส้นใน R กับformula
ชุดเป็นy ~ x + 0
แทนที่จะเป็นy ~ x
อะไร? ฉันจะตีความผลลัพธ์ที่แตกต่างกันสองแบบได้อย่างไร
ความแตกต่างทางสถิติระหว่างการทำการถดถอยเชิงเส้นใน R กับformula
ชุดเป็นy ~ x + 0
แทนที่จะเป็นy ~ x
อะไร? ฉันจะตีความผลลัพธ์ที่แตกต่างกันสองแบบได้อย่างไร
คำตอบ:
การเพิ่ม+0
(หรือ-1
) ลงในสูตรแบบจำลอง (เช่นในlm()
) ใน R จะหยุดการสกัดกั้น โดยทั่วไปถือว่าเป็นสิ่งไม่ดีที่ต้องทำ ดู:
ความชันโดยประมาณจะถูกคำนวณต่างกันไปขึ้นอยู่กับว่าการประมาณค่าตัดแกนนั้นมีค่าเท่าไรกล่าวคือ:
เนื่องจากปริมาณที่จะลบ ("subtrahend") ทั้งในตัวเศษและตัวหารนั้นไม่จำเป็นต้องเป็นการประมาณค่าของความชันจะเอนเอียงเมื่อถูกสกัดกั้น
ค่าสำหรับนั้นจะถูกคำนวณด้วยเช่นกัน ดู:
นี่คือสูตรพื้นฐาน:
มันขึ้นอยู่กับบริบท (แน่นอน) ในlm(...)
คำสั่งใน R มันจะหยุดการสกัดกั้น นั่นคือคุณจะถดถอยถึงที่มา
โปรดทราบว่าตำราเรียนส่วนใหญ่ในเรื่องของการถดถอยจะบอกคุณว่าการบังคับให้มีการสกัดกั้น (เป็นค่าใด ๆ ) เป็นความคิดที่ไม่ดี
การตีความของ x จะไม่เปลี่ยนแปลง แต่ค่า (เปรียบเทียบกับและไม่มีการสกัดกั้น) จะเปลี่ยนแปลงบางครั้งมีนัยสำคัญมาก