ในการตอบคำถามแรกพิจารณาตัวแบบ
Y=X+sin(X)+ε
กับ iidของค่าเฉลี่ยเป็นศูนย์และความแปรปรวนแน่นอน เมื่อช่วงของ (เพิ่มขึ้นคงที่หรือสุ่ม),ไปที่ 1 อย่างไรก็ตามหากความแปรปรวนของมีขนาดเล็ก (ประมาณ 1 หรือน้อยกว่า) ข้อมูลจะเป็น "ไม่เชิงเส้นอย่างเห็นได้ชัด" ในแปลงที่ 1X R 2 ε v a r ( ε ) = 1εXR2εvar(ε)=1
วิธีที่ง่ายที่สุดในการรับคือการแบ่งตัวแปรอิสระออกเป็นช่วงแคบ ๆ การถดถอย (ใช้รูปแบบเดียวกันทั้งหมด ) ภายในแต่ละช่วงจะมีค่าต่ำแม้ว่าการถดถอยแบบเต็มตามข้อมูลทั้งหมดจะมีค่าสูง การไตร่ตรองสถานการณ์นี้เป็นการฝึกที่ให้ข้อมูลและเตรียมการที่ดีสำหรับคำถามที่สองR 2 R 2R2R2R2
ทั้งแปลงต่อไปนี้ใช้ข้อมูลเดียวกัน สำหรับการถดถอยเต็มคือ 0.86 สำหรับชิ้น (1/2 ของความกว้างจาก -5/2 ไป 5/2) เป็น 0.16, 0.18, 0.07, 0.14, 0.08, 0.17, 0.20, 0.12, 0.01 , .00, อ่านจากซ้ายไปขวา หากมีสิ่งใดสิ่งที่พอดีจะดีขึ้นในสถานการณ์ที่ถูกแบ่งออกเพราะเส้น 10 เส้นแยกกันสามารถสอดคล้องกับข้อมูลภายในช่วงแคบ ๆ แม้ว่าสำหรับชิ้นส่วนทั้งหมดจะต่ำกว่าค่าอย่างสมบูรณ์ทั้งความแข็งแกร่งของความสัมพันธ์ความเป็นเส้นตรงหรือลักษณะของข้อมูลใด ๆ (ยกเว้นช่วงของใช้สำหรับการถดถอย) มีการเปลี่ยนแปลงR 2 R 2 R 2 XR2R2R2R2X
(หนึ่งอาจคัดค้านว่าขั้นตอนการแบ่งส่วนนี้เปลี่ยนการกระจายตัวของนั่นเป็นความจริง แต่ก็สอดคล้องกับการใช้งานในการสร้างแบบจำลองเอฟเฟกต์คงที่และแสดงให้เห็นถึงระดับที่บอกเราเกี่ยวกับ ความแปรปรวนของในสถานการณ์สุ่ม - เอฟเฟกต์โดยเฉพาะอย่างยิ่งเมื่อถูก จำกัด ให้เปลี่ยนแปลงภายในช่วงเวลาที่น้อยกว่าของช่วงธรรมชาติจะลดลง)R 2 R 2 X X R 2XR2R2XXR2
ปัญหาพื้นฐานของคือมันขึ้นอยู่กับหลายสิ่งหลายอย่างมากเกินไป (แม้เมื่อปรับในการถดถอยหลายครั้ง) แต่ส่วนใหญ่โดยเฉพาะอย่างยิ่งในความแปรปรวนของตัวแปรอิสระและความแปรปรวนของส่วนที่เหลือ ปกติแล้วมันจะไม่บอกอะไรเราเกี่ยวกับ "ความเป็นเส้นตรง" หรือ "ความแข็งแกร่งของความสัมพันธ์" หรือแม้แต่ "ความดีที่เหมาะสม" สำหรับการเปรียบเทียบลำดับของแบบจำลองR2
ส่วนใหญ่เวลาที่คุณสามารถหาสถิติที่ดีกว่า 2 สำหรับการเลือกรุ่นคุณสามารถดู AIC และ BIC; สำหรับการแสดงความเพียงพอของแบบจำลองให้ดูที่ความแปรปรวนของส่วนที่เหลือ R2
นี่นำเรามาถึงคำถามที่สองในที่สุด สถานการณ์หนึ่งที่อาจมีการใช้งานบางอย่างคือเมื่อตัวแปรอิสระถูกตั้งค่าเป็นค่ามาตรฐานการควบคุมผลกระทบของความแปรปรวนเป็นหลัก จากนั้นจะเป็นพร็อกซีสำหรับความแปรปรวนของค่าตกค้างที่ได้มาตรฐานอย่างเหมาะสม 1 - R 2R21−R2