จะเปรียบเทียบแบบจำลองบนพื้นฐานของ AIC ได้อย่างไร


15

เรามีสองรุ่นที่ใช้วิธีการเดียวกันเพื่อคำนวณโอกาสในการบันทึกและ AIC สำหรับหนึ่งต่ำกว่าอีกรุ่นหนึ่ง อย่างไรก็ตามผู้ที่มี AIC ที่ต่ำกว่านั้นตีความได้ยากกว่ามาก

เรากำลังประสบปัญหาในการตัดสินใจว่ามันคุ้มค่าที่จะนำเสนอปัญหาและเราตัดสินโดยใช้ความแตกต่างเปอร์เซ็นต์ใน AIC เราพบว่าความแตกต่างระหว่าง AIC ทั้งสองนั้นมีเพียง 0.7% โดยมีรูปแบบที่ซับซ้อนมากขึ้นซึ่งมี AIC ที่ต่ำกว่า 0.7%

  1. ความแตกต่างเปอร์เซ็นต์ต่ำระหว่างสองเหตุผลที่ดีในการหลีกเลี่ยงการใช้แบบจำลองกับ AIC ที่ต่ำกว่าคืออะไร

  2. เปอร์เซ็นต์ของความแตกต่างอธิบายว่า 0.7% ข้อมูลหายไปในรูปแบบที่ซับซ้อนน้อยลงหรือไม่?

  3. รุ่นสองรุ่นสามารถมีผลลัพธ์ที่แตกต่างกันมากได้หรือไม่


ความเป็นไปได้ที่ซ้ำกันของการเปรียบเทียบความแตกต่างของแบบจำลองที่เกี่ยวกับ AIC คืออะไร
Arun Jose

2
@ArunJose ดูเหมือนจะไม่ซ้ำกัน คำถามที่นี่แตกต่างกันมาก
Richard Hardy

1
ไม่คำถามนี้ไม่เกี่ยวกับการเปรียบเทียบรุ่น เรารู้อยู่แล้วว่าแบบจำลองเทียบเคียงได้ คำถามนี้เกี่ยวข้องกับสิ่งที่นับว่ามีความแตกต่างอย่างมีนัยสำคัญใน AIC และการแลกเปลี่ยนระหว่างความซับซ้อนกับแบบจำลอง
Ali Turab Lotia

คำตอบ:


27

เราไม่ได้เปรียบเทียบค่าสัมบูรณ์ของ AICs สองอัน (ซึ่งอาจเหมือนกับแต่ยัง ) แต่พิจารณาถึงความแตกต่าง : ที่คือ AIC ของ -th model และเป็น AIC ที่ต่ำที่สุดที่ได้รับจากชุดของโมเดลที่ตรวจสอบ (เช่นโมเดลที่ต้องการ) กฎของหัวแม่มือที่ระบุไว้เช่นในBurnham & Anderson 2004คือ:1001000000

Δi=AICiAICmin,
AICiiAICmin
  1. ถ้ามีการสนับสนุนรูปแบบ th เป็นจำนวนมาก(หรือหลักฐานที่แสดงว่ามีค่าเพียงการกล่าวถึงเปล่า) และข้อเสนอที่เป็นคำอธิบายที่เหมาะสมมีความเป็นไปได้สูงΔi<2i
  2. ถ้าว่ามีการสนับสนุนที่แข็งแกร่งสำหรับโมเดล th;2<Δi<4i
  3. ถ้าว่ามีการสนับสนุนน้อยกว่ามากสำหรับโมเดล th;4<Δi<7i
  4. รุ่นที่มีไม่มีการสนับสนุนเป็นหลักΔi>10

ตอนนี้เกี่ยวกับ 0.7% ที่กล่าวถึงในคำถามให้พิจารณาสองสถานการณ์:

  1. AIC1=AICmin=100และมีขนาดใหญ่ 0.7%: AIC_2จากนั้นดังนั้นจึงไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างแบบจำลองAIC2AIC2=100.7Δ2=0.7<2
  2. AIC1=AICmin=100000และมีขนาดใหญ่ 0.7%: AIC_2จากนั้นดังนั้นจึงไม่รองรับรุ่นที่ 2AIC2AIC2=100700Δ2=70010

ดังนั้นการบอกว่าความแตกต่างระหว่าง AICs คือ 0.7% ไม่ได้ให้ข้อมูลใด ๆ

ค่า AIC ประกอบด้วยค่าคงที่ที่ปรับมาจาก log-likelihood และไม่มีค่าคงที่ดังกล่าว หนึ่งอาจพิจารณาการเปลี่ยนแปลง rescaling ว่ากองกำลังรุ่นที่ดีที่สุดที่จะมี0LΔiΔi=AICiAICminAICmin:=0

การกำหนดของ AIC เป็นการลงโทษการใช้พารามิเตอร์จำนวนมากเกินไปทำให้หมดกำลังใจมากเกินไป มันชอบรุ่นที่มีพารามิเตอร์น้อยกว่าตราบใดที่รุ่นอื่นไม่ได้ให้พอดีที่ดีกว่าอย่างมาก AIC พยายามที่จะเลือกแบบจำลอง (ในบรรดาแบบทดสอบ) ที่อธิบายความเป็นจริงได้อย่างเพียงพอที่สุด (ในรูปแบบของข้อมูลภายใต้การตรวจสอบ) ซึ่งหมายความว่าในความเป็นจริงรูปแบบที่เป็นคำอธิบายที่แท้จริงของข้อมูลจะไม่ถูกพิจารณา โปรดทราบว่า AIC ให้ข้อมูลซึ่งรูปแบบการอธิบายข้อมูลที่ดีกว่าก็ไม่ได้ให้การใด ๆการตีความ

โดยส่วนตัวแล้วฉันจะบอกว่าถ้าคุณมีแบบจำลองที่เรียบง่ายและแบบซับซ้อนที่มี AIC ที่ต่ำกว่ามากโมเดลแบบง่าย ๆ ก็ไม่ดีพอ ถ้าแบบจำลองที่ซับซ้อนมากขึ้นมีความซับซ้อนมากขึ้น แต่นั้นไม่ใหญ่มาก (อาจอาจจะ - ขึ้นอยู่กับสถานการณ์เฉพาะ) ฉันจะยึดแบบจำลองที่ง่ายกว่าถ้ามันง่ายกว่าที่จะทำงานด้วย .ΔiΔi<2Δi<5

นอกจากนี้คุณสามารถกำหนดความน่าจะเป็นสำหรับโมเดล th ได้i

pi=exp(Δi2),

ซึ่งให้ความน่าจะเป็นแบบสัมพัทธ์ (เทียบกับ ) ความน่าจะเป็นที่โมเดล th จะลด AIC ตัวอย่างเช่นสอดคล้องกับ (ค่อนข้างสูง) และสอดคล้องกับ (ค่อนข้างต่ำ) กรณีแรกหมายความว่ามีความน่าจะเป็น 47% ที่แบบจำลอง th อาจเป็นคำอธิบายที่ดีกว่าแบบจำลองที่ให้ผลและในกรณีที่สองความน่าจะเป็นนี้เพียง 0.05%ฉันΔ i = 1.5 p i = 0.47 Δ i = 15 p i = 0.0005 i A I C m i nAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin

ในที่สุดเกี่ยวกับสูตรสำหรับ AIC:

AIC=2k2L,

มันเป็นเรื่องสำคัญที่จะต้องทราบว่าเมื่อทั้งสองรุ่นที่มีความคล้ายคลึงกันได้รับการพิจารณาขึ้นอยู่กับจำนวนของพารามิเตอร์เนื่องจากเทอมเดียว ดังนั้นเมื่อการปรับปรุงแบบสัมพัทธ์เกิดจากการปรับปรุงแบบพอดีไม่ใช่การเพิ่มจำนวนพารามิเตอร์เท่านั้นΔ ฉัน 2 k Δ ฉันLΔi2kΔi2Δk<1

TL; DR

  1. มันเป็นเหตุผลที่ไม่ดี ใช้ความแตกต่างระหว่างค่าสัมบูรณ์ของ AICs
  2. เปอร์เซ็นต์ไม่ได้พูดอะไร
  3. ไปไม่ได้ที่จะตอบคำถามนี้เนื่องจากไม่มีข้อมูลในรูปแบบข้อมูลและสิ่งที่ไม่ผลที่แตกต่างกันหมายถึง

2
นี่คือคำอธิบายที่ชัดเจนที่สุดที่ฉันเคยเห็นเกี่ยวกับเรื่องลึกลับนี้ ฉันค้นหาบทความที่คุณอ้างถึง (หน้า 270-272) และคำอธิบายของคุณที่นี่เป็นตัวแทนที่ง่ายและชัดเจน แต่แม่นยำมากในสิ่งที่บทความอธิบาย
Tripartio

คุณอาจช่วยตอบคำถามติดตามนี้ได้ไหม stats.stackexchange.com/questions/349883/…
Tripartio
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.