การอธิบายความแปรปรวนหมายถึงอะไร


15

โดยเฉพาะอย่างยิ่งฉันสงสัยว่าทำไมเรามีแนวคิดนี้หลาย R (ซึ่งฉันสามารถเข้าใจเป็นความสัมพันธ์ระหว่างคะแนนที่สังเกตและทำนายในการถดถอยหลายครั้ง) แล้วแนวคิดแยกต่างหาก R-squared ซึ่งเป็นเพียงตารางหรืออาร์

ฉันได้รับแจ้งว่า R-squared เป็นการอธิบายเปอร์เซ็นต์ความแปรปรวนและ R ไม่ใช่ แต่ฉันไม่เข้าใจความแตกต่างระหว่างสหสัมพันธ์และความแปรปรวนที่อธิบาย


6
หนึ่งในครูที่ยิ่งใหญ่ที่สุดของฉันเล่าถึงการป้องกันวิทยานิพนธ์ระดับปริญญาเอกของเขาซึ่งเขาอธิบายให้กลุ่มนักสมุทรศาสตร์ทางกายภาพทราบว่าการถดถอยของเขาสามารถอธิบายความแปรปรวนของ XX ในข้อมูลบางส่วนได้ ผู้ตรวจสอบที่โดดเด่นยืนขึ้นและประกาศว่า "ด้วยความสัมพันธ์ของคุณคุณไม่ได้อธิบายอะไรอย่างแน่นอน แต่คุณได้เสนอข้อเสนอแนะให้กับเราซึ่งแยก 10% ของเวลา"
gregory_britten

3
สิ่งนี้ซ้ำกับ: stats.stackexchange.com/questions/90793/…
Aksakal

คำตอบ:


7

ปัญหาหลักที่นี่คือการวัดของ "การเปลี่ยนแปลง" ในการวิเคราะห์การถดถอยมีความสัมพันธ์กับความแตกต่างยกกำลังสองของตัวแปรที่สังเกตได้จากค่าเฉลี่ยที่ทำนายไว้ นี่เป็นทางเลือกที่มีประโยชน์ในการวัดการเปลี่ยนแปลงทั้งสำหรับการวิเคราะห์เชิงทฤษฎีและในการปฏิบัติงานเนื่องจากความแตกต่างยกกำลังสองจากค่าเฉลี่ยนั้นเกี่ยวข้องกับความแปรปรวนของตัวแปรสุ่มและความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระสองตัวคือ ผลรวมของผลต่างแต่ละรายการ

R2ในการถดถอยหลายครั้งแสดงถึงเศษส่วนของ "การเปลี่ยนแปลง" ในตัวแปรที่สังเกตซึ่งถูกนำมาใช้โดยตัวแบบการถดถอยเมื่อความแตกต่างยกกำลังสองจากค่าเฉลี่ยที่คาดการณ์ไว้ถูกนำมาใช้เป็นการวัดการเปลี่ยนแปลง หลาย ๆ R เป็นเพียงรากที่สองของ 2R2

ฉันกลัวว่าฉันไม่เคยเข้าใจประโยชน์ของการระบุค่าของหลาย R มากกว่า 2 ซึ่งแตกต่างจากค่าสัมประสิทธิ์สหสัมพันธ์ในการถดถอย univariate ซึ่งแสดงให้เห็นว่าทั้งสองทิศทางและความแข็งแรงของความสัมพันธ์ระหว่าง 2 ตัวแปรระบุหลาย R ดูเหมือนจะไม่เพิ่มมากเกินโอกาสสำหรับความสับสนเพิ่มเติมR2R

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.