ฉันต้องการเรียกใช้การถดถอยด้วยตัวแปรอธิบาย 4 ถึง 5 แต่มีข้อสังเกตเพียง 15 ข้อ ไม่สามารถสันนิษฐานได้ว่าตัวแปรเหล่านี้มีการกระจายโดยทั่วไปมีวิธีการที่ไม่เป็นพารามิเตอร์หรือวิธีการถดถอยที่ถูกต้องอื่น ๆ หรือไม่?
ฉันต้องการเรียกใช้การถดถอยด้วยตัวแปรอธิบาย 4 ถึง 5 แต่มีข้อสังเกตเพียง 15 ข้อ ไม่สามารถสันนิษฐานได้ว่าตัวแปรเหล่านี้มีการกระจายโดยทั่วไปมีวิธีการที่ไม่เป็นพารามิเตอร์หรือวิธีการถดถอยที่ถูกต้องอื่น ๆ หรือไม่?
คำตอบ:
@Glen_b ที่ถูกต้องเกี่ยวกับธรรมชาติของสมมติฐานภาวะปกติในการถดถอย1
ฉันคิดว่าปัญหาที่ใหญ่กว่าของคุณคือว่าคุณไม่มีข้อมูลเพียงพอที่จะรองรับตัวแปรอธิบายได้ 4 ถึง 5 ตัว กฎมาตรฐานหัวแม่มือ2คือคุณควรมีข้อมูลอย่างน้อย 10 ตัวต่อตัวแปรอธิบายนั่นคือข้อมูล 40 หรือ 50 รายการในกรณีของคุณ (และนี่คือสถานการณ์ที่ดีที่สุดที่ไม่มีคำถามเกี่ยวกับสมมติฐาน) เพราะแบบจำลองของคุณจะไม่อิ่มตัวอย่างสมบูรณ์3(คุณมีข้อมูลมากกว่าพารามิเตอร์ให้พอดี) คุณจะได้รับการประมาณค่าพารามิเตอร์ (ความชัน ฯลฯ ) และภายใต้สถานการณ์ที่เหมาะการประมาณการจะไม่เอนเอียง อย่างไรก็ตามมีโอกาสมากที่การประมาณการของคุณจะอยู่ห่างจากค่าจริงและ SE / CI ของคุณจะยาวมากดังนั้นคุณจะไม่มีอำนาจทางสถิติ โปรดทราบว่าการใช้การวิเคราะห์การถดถอยที่ไม่ใช่พารามิเตอร์หรือทางเลือกอื่นจะไม่ทำให้คุณพ้นจากปัญหานี้
สิ่งที่คุณต้องทำที่นี่คือเลือกตัวแปรอธิบายเดียว (ก่อนที่จะดูข้อมูลของคุณ!) ตามทฤษฎีก่อนหน้านี้ในสาขาของคุณหรือลางสังหรณ์ของคุณหรือคุณควรรวมตัวแปรอธิบายของคุณ กลยุทธ์ที่สมเหตุสมผลสำหรับตัวเลือกหลังคือการเรียกใช้การวิเคราะห์องค์ประกอบหลัก (PCA) และใช้องค์ประกอบหลักการแรกเป็นตัวแปรอธิบายของคุณ
ข้อมูลอ้างอิง:
1. จะเกิดอะไรขึ้นถ้าหากมีการแจกจ่ายสารตกค้างตามปกติ แต่ Y ไม่ใช่?
2. กฎของหัวแม่มือสำหรับขนาดตัวอย่างขั้นต่ำสำหรับการถดถอยหลายครั้ง
3. จำนวนตัวแปรอิสระสูงสุดที่สามารถป้อนลงในสมการการถดถอยหลายแบบ