ในด้านจิตวิทยาและสาขาอื่น ๆ รูปแบบของการถดถอยแบบขั้นตอนมักถูกใช้ซึ่งเกี่ยวข้องกับสิ่งต่อไปนี้:
- ดูตัวทำนายที่เหลือ (ไม่มีตัวแบบในตอนแรก) และระบุตัวทำนายที่ทำให้เกิดการเปลี่ยนแปลง r-square ที่ใหญ่ที่สุด
- หากค่า p ของการเปลี่ยนแปลง r-square น้อยกว่าอัลฟา (โดยทั่วไปคือ. 05) ให้รวมตัวทำนายนั้นและกลับไปที่ขั้นตอนที่ 1 มิฉะนั้นหยุด
ตัวอย่างเช่นดูขั้นตอนนี้ในโปรแกรม SPSS
ขั้นตอนการวิพากษ์วิจารณ์เป็นประจำด้วยเหตุผลที่หลากหลาย (ดูการสนทนานี้ในเว็บไซต์ Stata พร้อมการอ้างอิง )
โดยเฉพาะอย่างยิ่งเว็บไซต์ Stata สรุปความคิดเห็นหลายประการโดย Frank Harrell ฉันสนใจข้อเรียกร้อง:
[การถดถอยแบบขั้นตอน] ให้ค่า R-squared ที่มีความเอนเอียงไม่ดีที่จะสูง
โดยเฉพาะบางส่วนของการวิจัยในปัจจุบันของฉันมุ่งเน้นไปที่การประมาณการประชากร R-ตาราง จากประชากร r-square ฉันอ้างถึงเปอร์เซ็นต์ของความแปรปรวนที่อธิบายโดยข้อมูลประชากรที่สร้างสมการในประชากร วรรณกรรมที่มีอยู่ส่วนใหญ่ที่ฉันกำลังตรวจสอบได้ใช้ขั้นตอนการถดถอยแบบขั้นตอนและฉันต้องการทราบว่าการประเมินที่ให้นั้นมีความลำเอียงหรือไม่และถ้าเป็นเช่นนั้น โดยเฉพาะอย่างยิ่งการศึกษาทั่วไปจะมีตัวทำนาย 30 ตัว n = 200 อัลฟาของการป้อน. 05 และการประมาณ r-square ประมาณ. 50
สิ่งที่ฉันรู้
- Asymptotically ตัวทำนายใด ๆ ที่ไม่มีสัมประสิทธิ์เป็นศูนย์จะเป็นตัวทำนายนัยสำคัญทางสถิติและ r-square จะปรับ r-square ให้เท่ากัน ดังนั้นการถดถอยแบบขั้นตอน asymptotically ควรประเมินสมการการถดถอยที่แท้จริงและประชากรที่แท้จริง r-square
- ด้วยขนาดตัวอย่างที่เล็กลงการละเว้นที่เป็นไปได้ของตัวทำนายบางตัวจะส่งผลให้ r-square มีขนาดเล็กกว่าตัวทำนายทั้งหมดที่รวมอยู่ในแบบจำลอง แต่ด้วยความเอนเอียงปกติของ r-square สำหรับข้อมูลตัวอย่างจะเพิ่ม r-square ดังนั้นความคิดที่ไร้เดียงสาของฉันคือศักยภาพกองกำลังฝ่ายตรงข้ามทั้งสองอาจอยู่ภายใต้เงื่อนไขบางประการส่งผลให้เกิด r-square ที่ไม่มีอคติ และโดยทั่วไปทิศทางของอคตินั้นจะเกิดขึ้นกับคุณลักษณะต่าง ๆ ของข้อมูลและเกณฑ์การรวมอัลฟา
- การตั้งค่าเกณฑ์การรวมอัลฟาที่เข้มงวดยิ่งขึ้น (เช่น. 01, .001, ฯลฯ ) ควรต่ำกว่าที่คาดการณ์ไว้ r-square เนื่องจากความน่าจะเป็นที่จะรวมตัวทำนายใด ๆ ในรุ่นข้อมูลใด ๆ จะน้อยลง
- โดยทั่วไป r-square เป็นการประมาณค่าแบบเอนเอียงของประชากร r-square และระดับของความลำเอียงนี้เพิ่มขึ้นเมื่อมีตัวทำนายมากขึ้นและขนาดตัวอย่างที่เล็กลง
คำถาม
ในที่สุดคำถามของฉัน:
- r-square จากการถดถอยแบบขั้นตอนส่งผลให้การประมาณประชากรแบบ r-square มากน้อยแค่ไหน?
- ขอบเขตนี้เกี่ยวข้องกับขนาดตัวอย่างจำนวนตัวทำนายเกณฑ์รวมอัลฟาหรือคุณสมบัติของข้อมูลในระดับใด
- มีการอ้างอิงใด ๆ ในหัวข้อนี้หรือไม่?