ฉันเข้าใจว่าการเลือกตัวแปรเป็นส่วนหนึ่งของการเลือกแบบจำลอง แต่การเลือกแบบจำลองนั้นประกอบด้วยอะไรบ้าง? มันเป็นมากกว่าต่อไปนี้:
1) เลือกการกระจายสำหรับรุ่นของคุณ
2) เลือกตัวแปรอธิบาย?
ฉันถามสิ่งนี้เพราะฉันกำลังอ่านบทความBurnham & Anderson: AIC กับ BICที่พวกเขาพูดคุยเกี่ยวกับ AIC และ BIC ในการเลือกรูปแบบ การอ่านบทความนี้ฉันรู้ว่าฉันกำลังคิดถึง 'การเลือกแบบจำลอง' เป็น 'การเลือกตัวแปร' (อ้างอิงความคิดเห็นBIC พยายามค้นหาแบบจำลองที่แท้จริงหรือไม่ )
ข้อความที่ตัดตอนมาจากบทความที่พวกเขาพูดคุยเกี่ยวกับ 12 รุ่นที่มีระดับ "ทั่วไป" ที่เพิ่มขึ้นและโมเดลเหล่านี้แสดง "เอฟเฟกต์การเรียว" (รูปที่ 1) เมื่อ KL-Information ถูกพล็อตกับ 12 โมเดล:
ปรัชญาและรุ่นเป้าหมายที่แตกต่าง ... แม้ว่าเป้าหมายของ BIC จะเป็นรูปแบบทั่วไปมากกว่าแบบเป้าหมายสำหรับ AIC แต่แบบจำลองที่เลือกโดย BIC ส่วนใหญ่มักจะน้อยกว่ารุ่น 7 ยกเว้นว่าnมีขนาดใหญ่มาก มันอาจจะเป็นแบบ 5 หรือ 6 เป็นที่รู้จักกัน (จากเอกสารและการจำลองมากมายในวรรณคดี) ว่าในบริบทของ tapering-effects (รูปที่ 1) AIC ทำงานได้ดีกว่า BIC หากนี่คือบริบทของการวิเคราะห์ข้อมูลจริงควรใช้ AIC
BIC จะเลือกรุ่นที่ซับซ้อนกว่า AIC ได้อย่างไรในการเลือกรุ่นที่ฉันไม่เข้าใจ! "การเลือกรูปแบบ" โดยเฉพาะคืออะไรและเมื่อใดที่ BIC เลือกรูปแบบ "ทั่วไป" มากกว่า AIC โดยเฉพาะ
หากเรากำลังพูดถึงการเลือกตัวแปร BIC จะต้องเลือกรุ่นที่มีตัวแปรต่ำที่สุดเสมอใช่ไหม? ในระยะ BIC จะเพิ่มลงโทษตัวแปรมากกว่า2 kในระยะ AIC แต่นี่ไม่ใช่เหตุผลที่ไม่สมควรหรือไม่เมื่อ " เป้าหมายของ BIC เป็นแบบจำลองทั่วไปมากกว่าแบบจำลองเป้าหมายสำหรับ AIC "
แก้ไข :
จากการอภิปรายในความคิดเห็นในมีเหตุผลอะไรที่จะชอบ AIC หรือ BIC มากกว่าคนอื่น ๆ ? เราเห็นการอภิปรายเล็ก ๆ ระหว่าง @Michael Chernick และ @ user13273 ในความคิดเห็นทำให้ฉันเชื่อว่านี่เป็นสิ่งที่ไม่สำคัญ:
ฉันคิดว่าเป็นการเหมาะสมกว่าที่จะเรียกการสนทนานี้เป็นการเลือก "คุณสมบัติ" หรือการเลือก "covariate" สำหรับฉันแล้วการเลือกแบบจำลองนั้นกว้างกว่ามากซึ่งเกี่ยวข้องกับข้อกำหนดของการกระจายข้อผิดพลาดรูปแบบของฟังก์ชันลิงก์และรูปแบบของค่าแปรปรวนร่วม เมื่อเราพูดถึง AIC / BIC เรามักจะอยู่ในสถานการณ์ที่ทุกแง่มุมของการสร้างแบบจำลองได้รับการแก้ไขยกเว้นการเลือก covariates - user13273 13 ส.ค. 2555 เวลา 21:17 น
การตัดสินใจที่เฉพาะเจาะจงเพื่อรวมในแบบจำลองนั้นมักจะไปโดยการเลือกรูปแบบคำและมีจำนวนของหนังสือที่มีการเลือกรูปแบบในชื่อที่มีการตัดสินใจส่วนใหญ่ covariates / พารามิเตอร์รูปแบบที่จะรวมอยู่ในรูปแบบ - Michael Chernick 24 ส.ค. 2555 เวลา 14:44 น