เหตุใดจึงปรับ R-squared น้อยกว่า R-squared หากปรับ R-squared ทำนายว่าแบบจำลองดีกว่า


15

เท่าที่ฉันเข้าใจอธิบายว่าตัวแบบทำนายการสังเกตได้ดีเพียงใด Adjusted R 2คือสิ่งที่คำนึงถึงการสังเกตมากขึ้น (หรือองศาอิสระ) ดังนั้น Adjusted R 2จะทำนายโมเดลได้ดีขึ้นหรือไม่ แล้วทำไมนี้จะน้อยกว่าR 2 ? ดูเหมือนว่ามันควรจะมากขึ้นR2R2R2R2

คำตอบ:


30

แสดงความสัมพันธ์เชิงเส้นระหว่างตัวแปรอิสระและตัวแปรตาม มันถูกกำหนดเป็น 1R2ซึ่งเป็นผลรวมของความคลาดเคลื่อนกำลังสองหารด้วยผลรวมของกำลังสอง SSTO=SSE+SSRซึ่งเป็นข้อผิดพลาดทั้งหมดและผลรวมของสี่เหลี่ยมถดถอย เมื่อมีการเพิ่มตัวแปรอิสระSSRจะยังคงเพิ่มขึ้นเรื่อย ๆ (และเนื่องจากSSTOได้รับการแก้ไข)SSEจะลดลงและR2จะเพิ่มขึ้นอย่างต่อเนื่องโดยไม่คำนึงว่าตัวแปรที่คุณเพิ่มนั้นมีค่าเท่าใด1SSESSTOSSTO=SSE+SSRSSRSSTOSSER2

Adjusted พยายามที่จะอธิบายการหดตัวทางสถิติ แบบจำลองที่มีตัวคาดการณ์ตันมีแนวโน้มที่จะทำงานได้ดีกว่าตัวอย่างมากกว่าเมื่อทดสอบจากตัวอย่าง R 2 ที่ปรับแล้ว"ลงโทษ" คุณสำหรับการเพิ่มตัวแปรทำนายพิเศษที่ไม่ปรับปรุงโมเดลที่มีอยู่ มันจะมีประโยชน์ในการเลือกรูปแบบ การปรับR 2จะเท่ากับR 2สำหรับตัวแปรทำนายหนึ่งตัว เมื่อคุณเพิ่มตัวแปรก็จะมีขนาดเล็กกว่าR 2R2R2R2R2R2


ยังไม่ชัดเจนว่า R Square ที่ปรับแล้วนั้นมีคุณสมบัติแหลมได้อย่างไร นั่นคือสูตรคืออะไรและทำให้เกิดคุณสมบัติอย่างไร
Alexey Voytenko

Adj R ^ 2 = 1 - ((n -1) / (n - k -1)) (1 - R ^ 2)
เขา

โดยที่ k = # ของตัวแปรอิสระ n = # การสังเกต
เขา

พยายามที่จะบัญชีสำหรับการหดตัวทางสถิติ - บางทีสำหรับ overfitting?
Richard Hardy

-1

R ^ 2 อธิบายถึงสัดส่วนของความแปรปรวนในตัวแปรตาม (Y) ที่อธิบายโดยตัวแปรอิสระ (X) ของคุณสำหรับแบบจำลองการถดถอยเชิงเส้น

ในขณะที่ปรับ R ^ 2 กล่าวว่าสัดส่วนของความแปรปรวนในตัวแปรตาม (Y) ของคุณอธิบายโดยมากกว่า 1ตัวแปรอิสระ (X) สำหรับตัวแบบการถดถอยเชิงเส้น


1
ความแตกต่างที่คุณทำระหว่าง "ตัวแปรอิสระ" และ "ตัวแปรอิสระมากกว่า 1" ไม่ชัดเจน นอกจากนี้การอ้างถึงแอนดี้จากด้านล่าง "คุณไม่ได้เพิ่มข้อมูลใหม่ลงในสิ่งที่เคยให้มาก่อน"
อะมีบาพูดว่า Reinstate Monica

-2

R-Squared เพิ่มขึ้นแม้ว่าคุณจะเพิ่มตัวแปรที่ไม่เกี่ยวข้องกับตัวแปรตาม แต่การปรับ R-Squared นั้นจะลดลงเมื่อใดก็ตามที่คุณเพิ่มตัวแปรที่ไม่เกี่ยวข้องกับตัวแปรตามดังนั้นจึงควรระวัง เพื่อลด


3
ระบุว่าคำถามนี้มีคำตอบที่ยอมรับแล้วนี่ควรเป็นความคิดเห็นที่มากกว่า คุณไม่ได้เพิ่มข้อมูลใหม่ลงในสิ่งที่เคยให้มาก่อน
Andy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.