AIC สามารถเปรียบเทียบกับรุ่นต่าง ๆ ได้หรือไม่?


27

ฉันใช้ AIC (เกณฑ์ข้อมูลของ Akaike) เพื่อเปรียบเทียบแบบจำลองที่ไม่ใช่เชิงเส้นใน R มันถูกต้องหรือไม่ที่จะเปรียบเทียบ AIC ของแบบจำลองชนิดต่าง ๆ ? โดยเฉพาะฉันกำลังเปรียบเทียบแบบจำลองที่ติดตั้งโดย glm กับแบบจำลองที่มีระยะเอฟเฟกต์แบบสุ่มติดตั้งโดย glmer (lme4)

ถ้าไม่มีวิธีการเปรียบเทียบเช่นนี้สามารถทำได้หรือไม่? หรือความคิดที่ไม่ถูกต้องสมบูรณ์?

คำตอบ:


12

มันขึ้นอยู่กับ. AIC เป็นฟังก์ชั่นของความน่าจะเป็นของบันทึก หากทั้งสองประเภทของรูปแบบการประมวลผลบันทึกของความน่าจะเป็นในลักษณะเดียวกัน (เช่นรวมคงที่เดียวกัน) แล้วใช่คุณสามารถถ้ารุ่นที่มีการซ้อนกัน

ฉันแน่ใจอย่างมีเหตุผลglm()และlmer()ไม่ใช้โอกาสในการบันทึกที่เปรียบเทียบได้

ประเด็นเกี่ยวกับแบบจำลองที่ซ้อนกันก็ขึ้นอยู่กับการอภิปรายด้วย บางคนบอกว่า AIC ใช้ได้เฉพาะกับแบบจำลองที่ซ้อนกันเท่านั้นซึ่งเป็นวิธีที่ทฤษฎีนำเสนอ / ทำงานผ่าน คนอื่นใช้เพื่อการเปรียบเทียบทุกประเภท


ความเข้าใจของฉันคือ lme4 โดยค่าเริ่มต้นใช้ REML โดยที่ glm ใช้ ML อาจเปรียบเทียบได้หากคุณใช้ ML โดยการตั้งค่า REML = FALSE
russellpierce

นอกจากความเห็นของกาวินแล้วมันยังขึ้นอยู่กับว่าคุณต้องการจะทำอะไรกับโมเดล แบบจำลองการทำนายหรือ Thomas กำลังมองหา parsimony หรือไม่? (ฉันคิดว่า)
suncoolsu

3
@drnexus: ฉันไม่คิดว่าเพียงพอ คุณต้องแน่ใจว่าค่าคงตัว normalizing เดียวกันนี้ถูกนำไปใช้ในการคำนวณความน่าจะเป็นของบันทึก
Reinstate Monica - G. Simpson

2
@ โทมัส: สำหรับสิ่งที่คุณต้องดูรหัสหรือพูดกับคนที่เขียนมันเพื่อให้แน่ใจ โดยทั่วไปถือว่าความเป็นไปได้นั้นไม่สามารถเปรียบเทียบได้กับซอฟต์แวร์ / แพ็คเกจ / ฟังก์ชั่นต่างๆ
Reinstate Monica - G. Simpson

1
@ user3490 ขึ้นอยู่กับซอฟต์แวร์และอัลกอริทึมที่ใช้ในการรับการประมาณ โดยทั่วไปฉันจะเข้าใจว่าพวกเขาไม่เหมือนกันเว้นแต่ฉันจะรู้ว่าพวกเขาเป็นเช่นนั้น
Reinstate Monica - G. Simpson

4

นี่เป็นคำถามที่ยอดเยี่ยมที่ฉันสงสัยมาระยะหนึ่งแล้ว

สำหรับรุ่นในตระกูลเดียวกัน (เช่น. แบบจำลองการถอยหลังอัตโนมัติของคำสั่ง k หรือชื่อพหุนาม) AIC / BIC สมเหตุสมผลมาก ในกรณีอื่น ๆ มันชัดเจนน้อยลง การคำนวณความน่าจะเป็นในการบันทึก (ด้วยเงื่อนไขคงที่) ควรใช้งานได้ แต่การใช้แบบจำลองที่ซับซ้อนกว่าเช่น Bayes Factor น่าจะดีกว่า (http://www.jstor.org/stable/2291091)

หากโมเดลมีฟังก์ชั่นการสูญเสีย / ผิดพลาดเหมือนกันทางเลือกหนึ่งคือเพียงเปรียบเทียบความน่าจะเป็นในการบันทึกที่ผ่านการตรวจสอบความถูกต้องข้าม นั่นเป็นสิ่งที่ฉันพยายามทำเมื่อฉันไม่แน่ใจว่า AIC / BIC สมเหตุสมผลในบางสถานการณ์


0

โปรดทราบว่าในบางกรณี AIC ไม่สามารถเปรียบเทียบรุ่นที่มีชนิดเดียวกันได้เช่น ARIMA รุ่นที่มีลำดับความแตกต่างกัน การพยากรณ์การอ้างถึง: หลักการและการปฏิบัติโดย Rob J Hyndman และ George Athanasopoulos:

มันเป็นสิ่งสำคัญที่จะต้องทราบว่าเกณฑ์ข้อมูลเหล่านี้มีแนวโน้มที่จะไม่เป็นแนวทางที่ดีในการเลือกลำดับที่เหมาะสมในการสร้างความแตกต่าง ( ) ของแบบจำลอง แต่สำหรับการเลือกค่าของและเท่านั้น เนื่องจากความแตกต่างเปลี่ยนแปลงข้อมูลที่คำนวณความน่าจะเป็นทำให้ค่า AIC ระหว่างโมเดลที่มีคำสั่งต่างกันต่างกันไม่เท่ากัน ดังนั้นเราจึงจำเป็นต้องใช้วิธีการอื่น ๆ ในการเลือกและจากนั้นเราสามารถใช้ AICC เพื่อเลือกและQdpqdpq


แท้จริงแล้ว แต่จุดสำคัญคือมันไม่ใช่ประเภทของแบบจำลองที่ทำให้เกิดปัญหาการเปรียบเทียบมันเป็นข้อมูลที่มีการกำหนดความน่าจะเป็น
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.