R2อาจเป็นค่าลบมันก็หมายความว่า:
- โมเดลเหมาะกับข้อมูลของคุณไม่ดีมาก
- คุณไม่ได้ตั้งค่าดักฟัง
สำหรับคนที่บอกว่าอยู่ระหว่าง 0 ถึง 1 นี่ไม่ใช่กรณี ในขณะที่ค่าลบสำหรับบางสิ่งบางอย่างที่มีคำว่า 'กำลังสอง' อยู่ในนั้นอาจฟังดูคล้ายกับว่าทำลายกฎของคณิตศาสตร์ แต่มันสามารถเกิดขึ้นได้ในตัวแบบR 2โดยไม่มีการสกัด เพื่อให้เข้าใจว่าทำไมเราต้องดูว่าคำนวณอย่างไรกับR 2R2R2R2
ยาวไปหน่อย - หากคุณต้องการคำตอบโดยไม่เข้าใจให้ข้ามไปจนจบ มิฉะนั้นฉันพยายามจะเขียนมันด้วยคำพูดง่ายๆ
อันดับแรกให้กำหนด 3 ตัวแปร: , T S SและE S SRSSTSSESS
กำลังคำนวณ RSS :
ทุกตัวแปรอิสระเรามีตัวแปรY เราพล็อตเป็นเส้นตรงแบบที่ดีที่สุดซึ่งคาดการณ์ค่าของYสำหรับค่าของแต่ละx ขอเรียกค่าของYสายคาดการณ์ปี ข้อผิดพลาดระหว่างสิ่งที่บรรทัดของคุณคาดการณ์และสิ่งที่สามารถคำนวณค่าyจริงได้คือการลบ ความแตกต่างเหล่านี้ทั้งหมดจะยืดและเพิ่มขึ้นซึ่งจะช่วยให้ส่วนที่เหลือรวมของสแควร์R S Sxyyxyy^yRSS
ใส่ลงในสมการRSS=∑(y−y^)2
กำลังคำนวณ TSS :
เราสามารถคำนวณค่าเฉลี่ยของซึ่งเรียกว่าˉ Y ถ้าเราวางแผนˉ ปีก็เป็นเพียงเส้นแนวนอนผ่านข้อมูลเพราะมันเป็นค่าคงที่ เราสามารถทำอะไรกับมัน แต่เป็นลบˉ Y (ค่าเฉลี่ยของปี ) จากทุกค่าจริงของปี ผลที่ได้คือยืดและรวมเข้าด้วยกันซึ่งจะช่วยให้ผลรวมของสี่เหลี่ยมT S Syy¯y¯Y¯YYTSS
ใส่มันลงในสมการTSS= ∑ ( y- y¯)2
การคำนวณ ESS :
ความแตกต่างระหว่างปี (ค่าของปีที่คาดการณ์โดยบรรทัด) และค่าเฉลี่ยˉ Yจะยืดและเสริม นี่คือผลรวมของสี่เหลี่ยมอธิบายซึ่งเท่ากับ Σ ( Y - ˉ Y ) 2Y^YY¯∑ ( y^- y¯)2
โปรดจำไว้ว่าแต่เราสามารถเพิ่ม+ Y - Yเป็นมันเพราะมันจะยกเลิกตัวเองออก ดังนั้นT S S = Σ ( Y - Y + Y - ˉ Y ) 2 ขยายวงเล็บเหล่านี้เราได้รับT S S = Σ ( Y - Y ) 2 +TSS= ∑ ( y- y¯)2+ y^- y^TSS= ∑ ( y- y^+ y^- y¯)2TSS= ∑ ( y- y^)2+ 2 ∗ ∑ ( y- y^) ( y^- y¯) + ∑ ( y^- y¯)2
เมื่อและเฉพาะเมื่อสายพล็อตที่มีการตัดต่อไปนี้เป็นความจริงเสมอ: 0 ดังนั้นT S S = Σ ( Y - Y ) 2 + Σ ( Y - ˉ Y ) 2ซึ่งคุณอาจสังเกตเห็นก็หมายความว่าT S S = R S S +2 ∗ ∑ ( y- y^) ( y^- y¯) = 0TSS= ∑ ( y- y^)2+ ∑ ( y^- y¯)2 S ถ้าเราแบ่งคำทั้งหมดด้วย T S Sและจัดเรียงใหม่เราจะได้ 1 - R S STSS= R SS+ ESSTSS S1 - R S.STSS= ESSTSS
นี่คือส่วนสำคัญ :
ถูกกำหนดเป็นแบบจำลองของคุณอธิบายความแปรปรวนเท่าไร (โมเดลของคุณดีแค่ไหน) ในรูปแบบสมการนั่นคือ R 2 = 1 - R S SR2 S ดูคุ้นเคยไหม เมื่อเส้นถูกพล็อตด้วยจุดตัดเราสามารถแทนที่สิ่งนี้เป็นR2=ESSR2= 1 - R SSTSS S เนื่องจากทั้งตัวเศษและตัวอสูรนั้นเป็นผลบวกกำลังสองR2จึงต้องเป็นค่าบวกR2= ESSTSSR2
แต่
เมื่อเราไม่ได้ระบุตัดไม่จำเป็นต้องเท่ากับ0 ซึ่งหมายความว่าT S S = R S S + E S S + 2 * Σ ( Y - Y ) ( Y - ˉ Y )2 ∗ ∑ ( y- y^) ( y^- y¯)0TSS= R SS+ ESS+ 2 ∗ ∑ ( y- y^) ( y^- y¯)
การหารทุกเทอมด้วยเราจะได้1 - R S STSS1 - R S.STSS= ESS+ 2 ∗ ∑ ( y- y^) ( y^- y¯)TSS.
Finally, we substitute to get R2= ESS+ 2 ∗ ∑ ( y- y^) ( y^- y¯)TSS. This time, the numerator has a term in it which is not a sum of squares, so it can be negative. This would make R2 negative. When would this happen? 2 ∗ ∑ ( y- y^) ( y^- y¯) would be negative when Y- y^ is negative and Y^- y¯ is positive, or vice versa. This occurs when the horizontal line of Y¯ actually explains the data better than the line of best fit.
Here's an exaggerated example of when R2 is negative (Source: University of Houston Clear Lake)
Put simply:
- When R2< 0, a horizontal line explains the data better than your model.
You also asked about R2= 0.
- When R2=0, a horizontal line explains the data equally as well as your model.
I commend you for making it through that. If you found this helpful, you should also upvote fcop's answer here which I had to refer to, because it's been a while.