ฉันอยากจะแนะนำการค้นหาสั้น ๆ เกี่ยวกับ " การวินิจฉัยแบบจำลองการถดถอยเชิงเส้น " เป็นการเริ่มต้น แต่นี่คือบางส่วนที่ฉันอยากจะแนะนำให้คุณตรวจสอบ:
ตรวจสอบให้แน่ใจว่าสมมติฐานเป็นไปตามที่พอใจ
ใช้ scatterplot หรือส่วนประกอบบวกกับส่วนที่เหลือเพื่อตรวจสอบความสัมพันธ์เชิงเส้นระหว่างตัวทำนายอิสระและตัวแปรตาม
เขียนพล็อตที่มีค่ามาตรฐานที่ตกค้างเทียบกับค่าที่คาดการณ์ไว้และตรวจสอบให้แน่ใจว่าไม่มีจุดที่มากที่สุดที่มีค่าตกค้างสูงมากและการแพร่กระจายของส่วนที่เหลือจะคล้ายกันมากกับค่าที่คาดการณ์ไว้ ศูนย์.
นอกจากนี้คุณยังสามารถเปลี่ยนแกน y จะเหลือ 2 จุดนี้ช่วยระบุความแปรปรวนที่ไม่เท่ากัน2
ตรวจสอบการออกแบบการศึกษาเพื่อให้แน่ใจว่าสมมติฐานของความเป็นอิสระมีเหตุผล
ดึงข้อมูลปัจจัยความแปรปรวนเงินเฟ้อ (VIF) หรือสถิติความอดทนเพื่อตรวจสอบความเป็นไปได้ collinearity
ตรวจสอบจุดที่มีอิทธิพล
- ตรวจสอบสถิติเช่น D, DFits หรือ DF Beta ของ Cook เพื่อดูว่าจุดข้อมูลบางจุดกำลังเปลี่ยนแปลงผลลัพธ์การถดถอยของคุณอย่างมากหรือไม่ ท่านสามารถหาข้อมูลเพิ่มเติมได้ที่นี่
ตรวจสอบการเปลี่ยนแปลงในสถิติและ AdjustedR2R2
- เมื่อเป็นอัตราส่วนของผลรวมการถดถอยของกำลังสองต่อผลรวมของกำลังสองสามารถบอกคุณได้ว่าแบบจำลองความแปรปรวนของตัวแปรตามจำนวนของคุณเป็นเท่าใดR2
- Adjustedสามารถใช้เพื่อตรวจสอบว่าผลรวมกำลังสองที่เพิ่มขึ้นมาจากตัวทำนายเพิ่มเติมของฉันนั้นคุ้มค่ากับระดับความเป็นอิสระของพวกเขาหรือไม่R2
ตรวจสอบการมีปฏิสัมพันธ์ที่จำเป็น
- หากมีตัวทำนายอิสระหลักก่อนที่คุณจะตีความผลอิสระใด ๆ ให้ตรวจสอบว่ามันมีปฏิสัมพันธ์กับตัวแปรอิสระอื่น ๆ หรือไม่ การโต้ตอบหากปล่อยทิ้งไว้โดยไม่ได้ปรับอาจมีอคติกับการประมาณการของคุณ
ใช้โมเดลของคุณกับชุดข้อมูลอื่นและตรวจสอบประสิทธิภาพ
- คุณยังสามารถใช้สูตรการถดถอยกับข้อมูลอื่น ๆ ที่แยกกันและดูว่ามันทำนายได้ดีเพียงใด กราฟเช่นพล็อตกระจายและสถิติเช่น% ความแตกต่างจากค่าที่สังเกตสามารถใช้เป็นการเริ่มต้นที่ดี
r-squared
แท็กและgoodness-of-fit
แท็ก ..