เปรียบเทียบแบบจำลองที่ไม่ซ้อนกับ AIC


19

สมมติว่าเราต้องใช้ GLMM

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

โมเดลเหล่านี้ไม่ซ้อนในความหมายปกติของ:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

ดังนั้นเราไม่สามารถทำanova(mod1, mod2)ตามที่เราต้องการanova(a ,b)ได้

เราสามารถใช้ AIC เพื่อบอกว่ารุ่นใดดีที่สุดแทนได้?

คำตอบ:


24

AIC สามารถใช้กับรุ่นที่ไม่ซ้อนกันได้ ในความเป็นจริงนี่เป็นหนึ่งในตำนานที่ยืดยาวที่สุด (ความเข้าใจผิด?) เกี่ยวกับ AIC ดู:

สิ่งหนึ่งที่คุณต้องระวังเกี่ยวกับการรวมค่าคงที่ normalizing ทั้งหมดเนื่องจากสิ่งเหล่านี้แตกต่างกันสำหรับโมเดลที่แตกต่างกัน (แบบไม่ซ้อนกัน):

ดูสิ่งนี้ด้วย:

ในบริบทของ GLMM คำถามที่ละเอียดอ่อนกว่าคือความน่าเชื่อถือของ AIC ในการเปรียบเทียบแบบจำลองประเภทนี้ (ดูได้ที่ @ BenBolker's) AIC รุ่นอื่น ๆ จะกล่าวถึงและเปรียบเทียบในเอกสารต่อไปนี้:


2
โปรดทราบว่าความแตกต่างระหว่าง AIC กับเงื่อนไขนั้นสำคัญที่สุดเมื่อพยายามเปรียบเทียบแบบจำลองที่มีความแตกต่างในชุดเอฟเฟกต์แบบสุ่ม
Ben Bolker

@Channel & Ben Bolker ขอบคุณมากสำหรับคำตอบของคุณ คุณทั้งสองมีการอ้างอิงที่เป็นทางการมากขึ้นสำหรับอาร์กิวเมนต์สำหรับการใช้ AIC ด้วยวิธีนี้หรือไม่?
user1322296

2
@ user1322296 ฉันจะขอแนะนำให้ไปที่รากนี้เป็นกระดาษ Akaike ของ AIC ได้รับเป็นตัวประมาณความแตกต่างระหว่างโมเดลของคุณกับ "โมเดลจริง" ดังนั้นจึงไม่มีการสันนิษฐานว่ามีการซ้อนกันมีเพียงเงื่อนไขปกติเท่านั้น
โคมระย้า

ดังนั้นมันจึงถูกต้องในการเปรียบเทียบ AIC ของ lm1 = x ~ A + B C และ lm2 = x ~ D + B C เช่น? ขอบคุณ
crazjo

ดูเหมือนจะเป็นรุ่นที่ไม่ซ้อนกันซึ่งการใช้งาน AIC ไม่เหมาะสม นี่คือตัวอย่างที่สอง: 1และ2 คุณช่วยระบุเงื่อนไขบางอย่างภายใต้การเลือกรุ่นที่ไม่ซ้อนกันได้ไหม?
Carl

10

สำหรับการอ้างอิงเอกสารโต้แย้ง: Brian Ripley กล่าวใน"การเลือกระหว่างรุ่นขนาดใหญ่" pp. 6-7

สมมติฐานที่สำคัญ ... โมเดลต่าง ๆ ซ้อนกัน (เชิงอรรถ: ดูที่ด้านล่างของหน้า 615 ในการพิมพ์ของ Akaike (1973)) - AIC ใช้กันอย่างแพร่หลายเมื่อพวกเขาไม่ได้

(x|kθ

Ripley, BD 2004“ การเลือกระหว่างแบบจำลองขนาดใหญ่” ในวิธีการและแบบจำลองในสถิติ , แก้ไขโดย N. Adams, M. Crowder, D. J Hand, และ D. Stephens, 155–70 ลอนดอนอังกฤษ: Imperial College Press

Akaike, H. (1973) ทฤษฎีสารสนเทศและการขยายหลักการความน่าจะเป็นสูงสุด ในการประชุมวิชาการระดับนานาชาติครั้งที่สองเกี่ยวกับทฤษฎีสารสนเทศ (Eds BN Petrov and F. Cáski), หน้า 267–281, บูดาเปสต์ Akademiai Kaidó พิมพ์ซ้ำในความก้าวหน้าในสถิติ , eds Kotz, S. & Johnson, NL (1992), เล่มที่ฉัน, pp 599–624 นิวยอร์ก: สปริงเกอร์


3

ดูเหมือนว่า Akaike คิดว่า AIC เป็นเครื่องมือที่มีประโยชน์สำหรับการเปรียบเทียบแบบจำลองที่ไม่ซ้อนกัน

"การสังเกตที่สำคัญอย่างหนึ่งเกี่ยวกับ AIC ก็คือมันถูกกำหนดโดยไม่มีการอ้างอิงเฉพาะโมเดลจริง [f (x | kθ)] ดังนั้นสำหรับโมเดลพาราเมตริกใด ๆ ที่มีจำนวน จำกัด เราอาจพิจารณาแบบจำลองที่ขยายออกมาซึ่งจะมีบทบาทของ [f (x | kθ)] สิ่งนี้ชี้ให้เห็นว่า AIC สามารถเป็นประโยชน์อย่างน้อยในหลักการสำหรับการเปรียบเทียบของแบบจำลองที่ไม่ได้ซ้อนกันคือสถานการณ์ที่การทดสอบอัตราส่วนความน่าจะเป็นของบันทึกทั่วไปไม่สามารถใช้ได้ "

(Akaike 1985, pg. 399)

Akaike, Hirotugu "การทำนายและเอนโทรปี" บทความที่คัดสรรของ Hirotugu Akaike สปริงเกอร์นิวยอร์กนิวยอร์ก 2528 ได้ 387-410

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.