เราไม่ได้เปรียบเทียบค่าสัมบูรณ์ของ AICs สองอัน (ซึ่งอาจเหมือนกับแต่ยัง ) แต่พิจารณาถึงความแตกต่าง :
ที่คือ AIC ของ -th model และเป็น AIC ที่ต่ำที่สุดที่ได้รับจากชุดของโมเดลที่ตรวจสอบ (เช่นโมเดลที่ต้องการ) กฎของหัวแม่มือที่ระบุไว้เช่นในBurnham & Anderson 2004คือ:∼100∼1000000
Δi=AICi−AICmin,
AICiiAICmin
- ถ้ามีการสนับสนุนรูปแบบ th เป็นจำนวนมาก(หรือหลักฐานที่แสดงว่ามีค่าเพียงการกล่าวถึงเปล่า) และข้อเสนอที่เป็นคำอธิบายที่เหมาะสมมีความเป็นไปได้สูงΔi<2i
- ถ้าว่ามีการสนับสนุนที่แข็งแกร่งสำหรับโมเดล th;2<Δi<4i
- ถ้าว่ามีการสนับสนุนน้อยกว่ามากสำหรับโมเดล th;4<Δi<7i
- รุ่นที่มีไม่มีการสนับสนุนเป็นหลักΔi>10
ตอนนี้เกี่ยวกับ 0.7% ที่กล่าวถึงในคำถามให้พิจารณาสองสถานการณ์:
- AIC1=AICmin=100และมีขนาดใหญ่ 0.7%: AIC_2จากนั้นดังนั้นจึงไม่มีความแตกต่างอย่างมีนัยสำคัญระหว่างแบบจำลองAIC2AIC2=100.7Δ2=0.7<2
- AIC1=AICmin=100000และมีขนาดใหญ่ 0.7%: AIC_2จากนั้นดังนั้นจึงไม่รองรับรุ่นที่ 2AIC2AIC2=100700Δ2=700≫10
ดังนั้นการบอกว่าความแตกต่างระหว่าง AICs คือ 0.7% ไม่ได้ให้ข้อมูลใด ๆ
ค่า AIC ประกอบด้วยค่าคงที่ที่ปรับมาจาก log-likelihood
และไม่มีค่าคงที่ดังกล่าว หนึ่งอาจพิจารณาการเปลี่ยนแปลง rescaling ว่ากองกำลังรุ่นที่ดีที่สุดที่จะมี0LΔiΔi=AICi−AICminAICmin:=0
การกำหนดของ AIC เป็นการลงโทษการใช้พารามิเตอร์จำนวนมากเกินไปทำให้หมดกำลังใจมากเกินไป มันชอบรุ่นที่มีพารามิเตอร์น้อยกว่าตราบใดที่รุ่นอื่นไม่ได้ให้พอดีที่ดีกว่าอย่างมาก AIC พยายามที่จะเลือกแบบจำลอง (ในบรรดาแบบทดสอบ) ที่อธิบายความเป็นจริงได้อย่างเพียงพอที่สุด (ในรูปแบบของข้อมูลภายใต้การตรวจสอบ) ซึ่งหมายความว่าในความเป็นจริงรูปแบบที่เป็นคำอธิบายที่แท้จริงของข้อมูลจะไม่ถูกพิจารณา โปรดทราบว่า AIC ให้ข้อมูลซึ่งรูปแบบการอธิบายข้อมูลที่ดีกว่าก็ไม่ได้ให้การใด ๆการตีความ
โดยส่วนตัวแล้วฉันจะบอกว่าถ้าคุณมีแบบจำลองที่เรียบง่ายและแบบซับซ้อนที่มี AIC ที่ต่ำกว่ามากโมเดลแบบง่าย ๆ ก็ไม่ดีพอ ถ้าแบบจำลองที่ซับซ้อนมากขึ้นมีความซับซ้อนมากขึ้น แต่นั้นไม่ใหญ่มาก (อาจอาจจะ - ขึ้นอยู่กับสถานการณ์เฉพาะ) ฉันจะยึดแบบจำลองที่ง่ายกว่าถ้ามันง่ายกว่าที่จะทำงานด้วย .ΔiΔi<2Δi<5
นอกจากนี้คุณสามารถกำหนดความน่าจะเป็นสำหรับโมเดล th ได้i
pi=exp(−Δi2),
ซึ่งให้ความน่าจะเป็นแบบสัมพัทธ์ (เทียบกับ ) ความน่าจะเป็นที่โมเดล th จะลด AIC ตัวอย่างเช่นสอดคล้องกับ (ค่อนข้างสูง) และสอดคล้องกับ (ค่อนข้างต่ำ) กรณีแรกหมายความว่ามีความน่าจะเป็น 47% ที่แบบจำลอง th อาจเป็นคำอธิบายที่ดีกว่าแบบจำลองที่ให้ผลและในกรณีที่สองความน่าจะเป็นนี้เพียง 0.05%ฉันΔ i = 1.5 p i = 0.47 Δ i = 15 p i = 0.0005 i A I C m i nAICminiΔi=1.5pi=0.47Δi=15pi=0.0005iAICmin
ในที่สุดเกี่ยวกับสูตรสำหรับ AIC:
AIC=2k−2L,
มันเป็นเรื่องสำคัญที่จะต้องทราบว่าเมื่อทั้งสองรุ่นที่มีความคล้ายคลึงกันได้รับการพิจารณาขึ้นอยู่กับจำนวนของพารามิเตอร์เนื่องจากเทอมเดียว ดังนั้นเมื่อการปรับปรุงแบบสัมพัทธ์เกิดจากการปรับปรุงแบบพอดีไม่ใช่การเพิ่มจำนวนพารามิเตอร์เท่านั้นΔ ฉัน 2 k Δ ฉันLΔi2kΔi2Δk<1
TL; DR
- มันเป็นเหตุผลที่ไม่ดี ใช้ความแตกต่างระหว่างค่าสัมบูรณ์ของ AICs
- เปอร์เซ็นต์ไม่ได้พูดอะไร
- ไปไม่ได้ที่จะตอบคำถามนี้เนื่องจากไม่มีข้อมูลในรูปแบบข้อมูลและสิ่งที่ไม่ผลที่แตกต่างกันหมายถึง