6
คือ
ฉันกำลังอ่านบันทึกการบรรยายโดย Cosma Shalizi (โดยเฉพาะอย่างยิ่งหัวข้อ 2.1.1 ของการบรรยายครั้งที่สอง ) และได้รับการเตือนว่าคุณจะได้รับต่ำมากR2R2R^2แม้ว่าคุณจะมีโมเดลเชิงเส้นสมบูรณ์ ในการถอดความตัวอย่างของ Shalizi: สมมติว่าคุณมีโมเดลY=aX+ϵY=aX+ϵY = aX + \epsilonโดยที่aaaรู้จัก จากนั้นVar[Y]=a2Var[x]+Var[ϵ]Var[Y]=a2Var[x]+Var[ϵ]\newcommand{\Var}{\mathrm{Var}}\Var[Y] = a^2 \Var[x] + \Var[\epsilon]และจำนวนความแปรปรวนที่อธิบายคือa2Var[X]a2Var[X]a^2 \Var[X]ดังนั้นR2=a2Var[x]a2Var[X]+Var[ϵ]R2=a2Var[x]a2Var[X]+Var[ϵ]R^2 = \frac{a^2 \Var[x]}{a^2 \Var[X] + \Var[\epsilon]}epsilon]} นี้ไป 0 เป็นVar[X]→0Var[X]→0\Var[X] \rightarrow 0และ 1 Var[X]→∞Var[X]→∞\Var[X] \rightarrow \infty\ ในทางกลับกันคุณสามารถรับR ^ 2สูงR2R2R^2ถึงแม้ว่าแบบจำลองของคุณจะไม่ใช่แบบเส้นตรง (ใครมีตัวอย่างที่ดีทันทีทันใด?) ดังนั้นเมื่อR2R2R^2เป็นสถิติที่มีประโยชน์และเมื่อใดควรจะละเว้น?
233
regression
r-squared