ประชากร r-squareสามารถกำหนดสมมติว่าเป็นคะแนนคงที่หรือคะแนนสุ่ม:
คะแนนคงที่: ขนาดตัวอย่างและค่าเฉพาะของตัวทำนายจะได้รับการแก้ไข ดังนั้นคือสัดส่วนของความแปรปรวนที่อธิบายในผลลัพธ์โดยสมการการถดถอยของประชากรเมื่อค่าของตัวทำนายคงที่
คะแนนสุ่ม: ค่าเฉพาะของผู้ทำนายนั้นมาจากการแจกแจง ดังนั้นหมายถึงสัดส่วนของความแปรปรวนที่อธิบายในผลลัพธ์ในประชากรที่ค่าของตัวทำนายนั้นสอดคล้องกับการกระจายตัวของประชากรของตัวทำนาย
ผมเคยถามไว้ก่อนหน้านี้เกี่ยวกับการไม่ว่าจะเป็นความแตกต่างนี้ทำให้แตกต่างกันมากการประมาณการของ 2 ฉันยังเคยถามทั่วไปเกี่ยวกับวิธีการคำนวณประมาณการเป็นกลางของ 2
ฉันเห็นได้ว่าเมื่อขนาดตัวอย่างเพิ่มความแตกต่างระหว่างคะแนนคงที่และคะแนนสุ่มก็สำคัญน้อยลง แต่ฉันพยายามที่จะยืนยันว่าการปรับถูกออกแบบมาเพื่อประเมินคะแนนคงที่หรือคะแนนสุ่ม 2
คำถาม
- มีการปรับ เพื่อประเมินคะแนนคงที่หรือคะแนนสุ่มหรือไม่
- มีคำอธิบายหลักการว่าสูตรสำหรับการปรับ r-square นั้นเกี่ยวข้องกับรูปแบบใดรูปแบบหนึ่งหรือไม่?
เบื้องหลังความสับสนของฉัน
เมื่อฉันอ่าน Yin และ Fan (2001, p.206) พวกเขาเขียน:
หนึ่งในข้อสมมติฐานพื้นฐานของตัวแบบการถดถอยพหุคูณก็คือค่าของตัวแปรอิสระเป็นค่าคงที่ที่รู้จักกันและได้รับการแก้ไขโดยนักวิจัยก่อนการทดลอง เฉพาะตัวแปรที่ขึ้นต่อกันเท่านั้นที่มีอิสระในการเปลี่ยนแปลงจากกลุ่มตัวอย่างเป็นกลุ่มตัวอย่าง ตัวแบบการถดถอยที่เรียกว่ารูปแบบการถดถอยเชิงเส้นคงที่
อย่างไรก็ตามในสังคมศาสตร์และพฤติกรรมศาสตร์ค่าของตัวแปรอิสระไม่ค่อยได้รับการแก้ไขโดยนักวิจัยและยังมีข้อผิดพลาดแบบสุ่ม ดังนั้นรูปแบบการถดถอยครั้งที่สองสำหรับแอปพลิเคชันได้รับการแนะนำซึ่งทั้งสองตัวแปรขึ้นอยู่กับและเป็นอิสระได้รับอนุญาตให้แตกต่างกัน (Binder, 1959; Park & Dudycha, 1974) โมเดลนั้นเรียกว่าโมเดลแบบสุ่ม (หรือโมเดลการแก้ไข) แม้ว่าการประมาณค่าความน่าจะเป็นสูงสุดของสัมประสิทธิ์การถดถอยที่ได้จากแบบจำลองแบบสุ่มและแบบคงที่จะเหมือนกันภายใต้สมมติฐานเชิงบรรทัดฐานการแจกแจงของพวกมันนั้นแตกต่างกันมาก แบบจำลองแบบสุ่มนั้นซับซ้อนมากซึ่งจำเป็นต้องทำการวิจัยเพิ่มเติมก่อนจึงจะสามารถใช้แทนแบบจำลองการถดถอยเชิงเส้นคงที่ที่ใช้กันทั่วไป ดังนั้นรูปแบบคงที่จึงมักจะใช้ แม้ในกรณีที่สมมติฐานไม่สมบูรณ์ (Claudy, 1978) แอ็พพลิเคชันของโมเดลการถดถอยแบบคงที่ที่มีการละเมิดสมมติฐานจะทำให้ "overfitting" เนื่องจากข้อผิดพลาดแบบสุ่มที่นำมาจากข้อมูลตัวอย่างน้อยกว่าที่สมบูรณ์แบบมีแนวโน้มที่จะเป็นตัวพิมพ์ใหญ่ในกระบวนการ เป็นผลให้ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างที่ได้นั้นมีแนวโน้มที่จะประเมินค่าสูงกว่าค่าสหสัมพันธ์ที่แท้จริงของประชากร (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982)
ดังนั้นฉันจึงไม่ชัดเจนว่าข้อความข้างต้นบอกว่าการปรับชดเชยข้อผิดพลาดที่แนะนำโดยตัวแบบสุ่มหรือไม่หรือว่านี่เป็นเพียงข้อแม้ในกระดาษที่ตั้งค่าสถานะการมีอยู่ของตัวแบบสุ่ม แต่บทความนั้นจะไป มุ่งเน้นไปที่รูปแบบคงที่
อ้างอิง
- Yin, P. , & Fan, X. (2001) การประมาณค่าการหดตัวในการถดถอยหลายครั้ง: การเปรียบเทียบวิธีการวิเคราะห์ที่แตกต่างกัน วารสารการศึกษาทดลอง, 69 (2), 203-224 ไฟล์ PDF