จากสิ่งที่ฉันเข้าใจการเลือกตัวแปรตามค่า p (อย่างน้อยในบริบทการถดถอย) มีข้อบกพร่องสูง ดูเหมือนว่าการเลือกตัวแปรตาม AIC (หรือคล้ายกัน) ก็ถือว่ามีข้อบกพร่องบางอย่างด้วยเหตุผลที่คล้ายกันแม้ว่าจะดูเหมือนไม่ชัดเจน (เช่นดูคำถามของฉันและลิงก์บางส่วนในหัวข้อนี้ที่นี่: "การเลือกรุ่นตามขั้นตอน" คืออะไร? )
แต่สมมติว่าคุณเลือกหนึ่งในสองวิธีนี้เพื่อเลือกชุดพยากรณ์ที่ดีที่สุดในแบบจำลองของคุณ
อัมและแอนเดอร์สัน 2002 (การเลือกแบบจำลองและการอนุมานหลายรูปแบบ: วิธีปฏิบัติเชิงทฤษฎีสารสนเทศ, หน้า 83) ระบุว่าไม่ควรผสมการเลือกตัวแปรตาม AIC กับการทดสอบสมมติฐาน : "การทดสอบสมมติฐานว่างและแนวทางสารสนเทศเชิงทฤษฎีควร ไม่ใช้ร่วมกันพวกเขาเป็นกระบวนทัศน์การวิเคราะห์ที่แตกต่างกันมาก "
ในอีกทางหนึ่ง Zuur และคณะ 2009 (โมเดลเอฟเฟ็กต์ผสมกับส่วนขยายในระบบนิเวศด้วย R, หน้า 541) ดูเหมือนจะสนับสนุนการใช้AIC เพื่อค้นหาแบบจำลองที่ดีที่สุดก่อนแล้วจึงทำการ "ปรับจูน" โดยใช้การทดสอบสมมติฐาน : "ข้อเสียคือ AIC และคุณอาจต้องใช้การปรับแต่งแบบละเอียด (โดยใช้การทดสอบสมมติฐานจากแนวทางที่หนึ่ง) เมื่อ AIC ได้เลือกแบบจำลองที่ดีที่สุด "
คุณสามารถดูว่าสิ่งนี้ทำให้ผู้อ่านหนังสือทั้งสองเล่มสับสนอย่างไร
1) "ค่าย" ที่แตกต่างกันของการคิดเชิงสถิติและหัวข้อที่ไม่เห็นด้วยในหมู่นักสถิติหรือไม่? หนึ่งในวิธีการเหล่านี้เป็นเพียง "ล้าสมัย" ในขณะนี้ แต่ได้รับการพิจารณาที่เหมาะสมในขณะที่เขียนหรือไม่ หรือเป็นเพียงหนึ่งผิดปกติตั้งแต่เริ่มต้น?
2) จะมีสถานการณ์ที่วิธีนี้เหมาะสมหรือไม่ ตัวอย่างเช่นฉันมาจากภูมิหลังทางชีวภาพซึ่งฉันมักจะพยายามตรวจสอบว่าตัวแปรใดบ้างที่ดูเหมือนว่าจะส่งผลกระทบหรือขับเคลื่อนการตอบสนองของฉัน ฉันมักจะมีตัวแปรอธิบายผู้สมัครจำนวนมากและฉันพยายามค้นหาว่าอะไรคือ "สำคัญ" (ในแง่ที่เกี่ยวข้อง) นอกจากนี้โปรดทราบว่าชุดของตัวแปรตัวทำนายผู้สมัครได้ลดลงไปแล้วสำหรับผู้ที่พิจารณาแล้วว่ามีความเกี่ยวข้องทางชีวภาพ แต่ก็อาจรวมถึงตัวทำนายผู้สมัคร 5-20 คน