ฉันจะพยายามอธิบายเรื่องนี้ด้วยคำศัพท์ง่ายๆ
ตัวแบบการถดถอยมุ่งเน้นไปที่ความสัมพันธ์ระหว่างที่ขึ้นอยู่กับตัวแปรและชุดของอิสระตัวแปร ตัวแปรตามคือผลลัพธ์ที่คุณพยายามทำนายโดยใช้ตัวแปรอิสระหนึ่งตัวหรือมากกว่า
สมมติว่าคุณมีโมเดลดังนี้:
Weight_i = 3.0 + 35 * Height_i + ε
ตอนนี้หนึ่งในคำถามที่ชัดเจนคือ: แบบจำลองนี้ทำงานได้ดีแค่ไหน? กล่าวอีกนัยหนึ่งความสูงของบุคคลทำนายได้อย่างถูกต้อง - หรืออธิบาย - น้ำหนักของบุคคลนั้นอย่างไร
ก่อนที่เราจะตอบคำถามนี้เราต้องเข้าใจความผันผวนของน้ำหนักตัวเราก่อน สิ่งนี้สำคัญเพราะสิ่งที่เราพยายามทำที่นี่คือการอธิบายความผันผวน (น้ำหนัก) ในน้ำหนักของคนต่าง ๆ โดยใช้ความสูงของพวกเขา หากความสูงของผู้คนสามารถอธิบายความแปรปรวนของน้ำหนักนี้ได้เราก็มีแบบจำลองที่ดี
แปรปรวนเป็นตัวชี้วัดที่ดีที่จะนำมาใช้เพื่อการนี้เนื่องจากมาตรการวิธีไกลชุดของตัวเลขที่จะกระจายออกไป (จากค่าเฉลี่ยของพวกเขา)
สิ่งนี้ช่วยให้เราเรียบเรียงคำถามเดิมของเราใหม่: ความสูงของเขา / เธอสามารถอธิบายความแปรปรวนของน้ำหนักได้มากน้อยเพียงใด?
นี่คือที่มาของ“% ความแปรปรวนอธิบาย” มาจาก โดยวิธีการในการวิเคราะห์การถดถอยก็เท่ากับค่าสัมประสิทธิ์สหสัมพันธ์R-Squared
สำหรับรูปแบบข้างต้นเราอาจจะสามารถทำคำสั่งที่ชอบ: โดยใช้การวิเคราะห์การถดถอยมันเป็นไปได้ในการตั้งค่ารูปแบบการทำนายโดยใช้ความสูงของคนที่อธิบายถึง60% ของความแปรปรวนในน้ำหนัก ”
ทีนี้ 60% ดีแค่ไหน? เป็นการยากที่จะตัดสินอย่างมีเหตุผลเกี่ยวกับเรื่องนี้ แต่ถ้าคุณมีรูปแบบการแข่งขันอื่น ๆ - พูดอีกรูปแบบการถดถอยที่ใช้อายุของบุคคลในการทำนาย / น้ำหนักของเขา - คุณสามารถเปรียบเทียบรูปแบบที่แตกต่างกันขึ้นอยู่กับว่าพวกเขาอธิบายความแปรปรวนมากน้อยเพียงใด (มีคำเตือนบางประการสำหรับสิ่งนี้ให้ดู 'การตีความและการใช้การถดถอย' - Christopher H. Achen http://www.sagepub.in/books/Book4505/automatic/ )