วิธีการคำนวณจากตัวอย่าง R กำลังสอง?


10

ฉันรู้ว่าอาจมีการพูดถึงที่อื่น แต่ฉันไม่สามารถหาคำตอบที่ชัดเจนได้ ฉันกำลังพยายามใช้สูตรเพื่อคำนวณ -ตัวอย่างของการถดถอยเชิงเส้นโดยที่คือผลรวมของส่วนที่เหลือกำลังสองและคือผลรวมของกำลังสองทั้งหมด สำหรับชุดฝึกอบรมนั้นเป็นที่ชัดเจนว่าR2=1SSR/SSTR2SSRSST

SST=Σ(yy¯train)2

ชุดทดสอบมีอะไรบ้าง ฉันควรใช้สำหรับตัวอย่างหรือใช้แทนหรือไม่y¯trainyy¯test

ฉันพบว่าถ้าฉันใช้ผลลัพธ์อาจเป็นลบได้ในบางครั้ง สิ่งนี้สอดคล้องกับคำอธิบายฟังก์ชั่นของ sklearn โดยที่พวกเขาใช้ (ซึ่งยังใช้โดยฟังก์ชันlinear_model ของพวกเขาสำหรับการทดสอบตัวอย่าง) พวกเขากล่าวว่า "แบบจำลองค่าคงที่ที่ทำนายค่า y ที่คาดไว้เสมอโดยไม่คำนึงถึงคุณลักษณะอินพุตจะได้รับคะแนน R ^ 2 เท่ากับ 0.0"y¯testR2r2_score()y¯testscore()

อย่างไรก็ตามในที่อื่น ๆ ผู้คนใช้แบบนี้และที่นี่ (คำตอบที่สองโดย dmi3kno) ดังนั้นฉันสงสัยว่าสิ่งใดที่เหมาะสมกว่า ความคิดเห็นใด ๆ จะได้รับการชื่นชมอย่างมาก!y¯train

คำตอบ:


3

คุณถูก.

ส่วนที่เหลือของOSRนั้นอ้างอิงจากข้อมูลการทดสอบ แต่ข้อมูลพื้นฐานควรเป็นข้อมูลการฝึกอบรม ด้วยที่กล่าวว่า SST ของคุณคือ ; สังเกตว่าเหมือนกันสำหรับ2SST=Σ(yy¯train)2R2


3
แม้ว่าฉันได้แก้ไขข้อผิดพลาดที่เห็นได้ชัดและชัดเจนบางส่วนจากการแก้ไขก่อนหน้านี้บางส่วนของสัญกรณ์และความหมายที่ตั้งใจไว้บางส่วนยังไม่ชัดเจน
Nick Cox

ขอบคุณสำหรับคำตอบ! คุณมีข้อมูลอ้างอิงเกี่ยวกับเรื่องนี้หรือไม่? ดูเหมือนว่าโปรแกรมทางสถิติจะใช้คำจำกัดความอื่นแทน y_test?
Matifou

คุณมีการอ้างอิงสำหรับสิ่งนี้หรือไม่? จริงอยู่ถ้าคุณใช้เป็นการเปรียบเทียบความเบี่ยงเบนดังนั้นการเปรียบเทียบความน่าจะเป็นฉันคิดว่าคุณพูดถูก แต่ถ้าคุณใช้เป็นสัดส่วนของความแปรปรวนที่อธิบายแล้วก็ไม่ได้เพราะผลรวมของกำลังสองจะไม่ปรากฏที่ใดก็ได้ R2R2
Firebug
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.