คำถามติดแท็ก aic

AIC ย่อมาจาก Akaike Information Criterion ซึ่งเป็นเทคนิคหนึ่งที่ใช้ในการเลือกแบบจำลองที่ดีที่สุดจากคลาสของแบบจำลองโดยใช้โอกาสในการถูกลงโทษ AIC ขนาดเล็กแสดงถึงแบบจำลองที่ดีกว่า

2
การคำนวณ AIC“ ด้วยมือ” ใน R
ฉันได้ลองคำนวณ AIC ของการถดถอยเชิงเส้นใน R แต่ไม่ได้ใช้AICฟังก์ชันเช่นนี้ lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 อย่างไรก็ตามAICให้ค่าที่แตกต่าง: AIC(lm_mtcars) [1] 190.7999 มีคนบอกฉันว่าฉันทำอะไรผิดหรือเปล่า?

1
จะเปรียบเทียบแบบจำลองบนพื้นฐานของ AIC ได้อย่างไร
เรามีสองรุ่นที่ใช้วิธีการเดียวกันเพื่อคำนวณโอกาสในการบันทึกและ AIC สำหรับหนึ่งต่ำกว่าอีกรุ่นหนึ่ง อย่างไรก็ตามผู้ที่มี AIC ที่ต่ำกว่านั้นตีความได้ยากกว่ามาก เรากำลังประสบปัญหาในการตัดสินใจว่ามันคุ้มค่าที่จะนำเสนอปัญหาและเราตัดสินโดยใช้ความแตกต่างเปอร์เซ็นต์ใน AIC เราพบว่าความแตกต่างระหว่าง AIC ทั้งสองนั้นมีเพียง 0.7% โดยมีรูปแบบที่ซับซ้อนมากขึ้นซึ่งมี AIC ที่ต่ำกว่า 0.7% ความแตกต่างเปอร์เซ็นต์ต่ำระหว่างสองเหตุผลที่ดีในการหลีกเลี่ยงการใช้แบบจำลองกับ AIC ที่ต่ำกว่าคืออะไร เปอร์เซ็นต์ของความแตกต่างอธิบายว่า 0.7% ข้อมูลหายไปในรูปแบบที่ซับซ้อนน้อยลงหรือไม่? รุ่นสองรุ่นสามารถมีผลลัพธ์ที่แตกต่างกันมากได้หรือไม่

1
สามารถแนะนำหนังสือ Burnham-Anderson เกี่ยวกับการอนุมานแบบหลายรุ่นได้หรือไม่?
จากการเปลี่ยนแปลงล่าสุดของสถิติการเลือกแบบจำลองเริ่มต้นในแพ็คเกจการพยากรณ์ของ R จาก AIC เป็น AICc ฉันสงสัยว่าอันหลังนั้นสามารถใช้งานได้ทุกที่ในอดีต ฉันมีคำถามหลายข้อเกี่ยวกับความเคารพและนี่คือคำถามแรก ฉันรู้ว่าการแทนที่ AIC ด้วย AICc ทุกที่เป็นสิ่งที่หนังสือที่มีชื่อเสียงใน (1)โดย Burnham และ Anderson (ไม่ใช่นักสถิติ) ตามที่สรุปไว้ที่นี่แนะนำ บางครั้งหนังสือเล่มนี้ถูกอ้างถึงโดยนักสถิติรุ่นเยาว์อย่างไร้ความปราณีดูความคิดเห็นต่อบล็อกโพสต์นี้โดย Rob Hyndmanแต่นักสถิติ Brian Brian Ripley ได้ให้คำแนะนำในลักษณะที่แตกต่างกันอย่างสิ้นเชิง: “Burnham and Anderson (2002) is a book I would recommend people NOT read until they have read the primary literature. I see no evidence …

5
เหตุใดการเลือกใช้แบบจำลองโดยใช้ AIC จึงให้ค่า p ที่ไม่สำคัญสำหรับตัวแปร
ฉันมีคำถามบางอย่างเกี่ยวกับ AIC และหวังว่าคุณจะสามารถช่วยฉันได้ ฉันใช้การเลือกแบบจำลอง (ย้อนกลับหรือไปข้างหน้า) ตาม AIC กับข้อมูลของฉัน และตัวแปรที่เลือกบางตัวก็จบลงด้วยค่า p> 0.05 ฉันรู้ว่าผู้คนกำลังพูดว่าเราควรเลือกแบบจำลองตาม AIC แทนค่า p ดังนั้นดูเหมือนว่า AIC และค่า p เป็นแนวคิดสองประการที่แตกต่างกัน มีคนบอกฉันว่าอะไรคือความแตกต่าง? สิ่งที่ฉันเข้าใจคือ: สำหรับการเลือกย้อนหลังโดยใช้ AIC สมมติว่าเรามี 3 ตัวแปร (var1, var2, var3) และ AIC ของรุ่นนี้คือ AIC * หากไม่รวมหนึ่งในสามของตัวแปรเหล่านี้จะไม่จบลงด้วย AIC ซึ่งต่ำกว่า AIC * อย่างมาก (ในแง่ของการกระจาย ch-square ด้วย df = 1) จากนั้นเราจะบอกว่าตัวแปรทั้งสามนี้เป็นผลลัพธ์สุดท้าย p-value ที่สำคัญสำหรับตัวแปร …

2
AIC, BIC และ GCV: อะไรที่ดีที่สุดสำหรับการตัดสินใจในวิธีการลงโทษที่ถูกลงโทษ?
ความเข้าใจทั่วไปของฉันคือAICเกี่ยวข้องกับการแลกเปลี่ยนระหว่างความดีงามของแบบและความซับซ้อนของแบบจำลอง A Iค= 2 k - 2 l n ( L )AIC=2k−2ln(L)AIC =2k -2ln(L) kkk = จำนวนพารามิเตอร์ในโมเดล LLL = ความเป็นไปได้ เกณฑ์ข้อมูล Bayesian BICนั้นเกี่ยวข้องกับ AIC อย่างมาก AIC จะลงโทษจำนวนพารามิเตอร์ที่น้อยกว่า BIC ฉันเห็นว่ามีการใช้สองสิ่งนี้ทุกที่ในอดีต แต่การตรวจสอบข้ามโดยทั่วไป (GCV) นั้นใหม่สำหรับฉัน GCV เกี่ยวข้องกับ BIC หรือ AIC ได้อย่างไร วิธีการเหล่านี้ใช้ร่วมกันหรือแยกออกจากกันในการเลือกระยะเวลาการลงโทษในการถดถอยแบบแผงเหมือนสัน? แก้ไข: นี่เป็นตัวอย่างการคิดและอภิปราย: require(lasso2) data(Prostate) require(rms) ridgefits = ols(lpsa~lcavol+lweight+age+lbph+svi+lcp+gleason+pgg45, method="qr", data=Prostate,se.fit = …

3
การถดถอยเชิงเส้นอย่างง่ายค่า p และ AIC
ฉันรู้ว่าหัวข้อนี้เกิดขึ้นหลายครั้งก่อนเช่นที่นี่แต่ฉันยังไม่แน่ใจว่าจะตีความผลลัพธ์การถดถอยของฉันได้ดีที่สุดอย่างไร ฉันมีชุดข้อมูลที่ง่ายมากประกอบด้วยคอลัมน์ของค่า xและคอลัมน์ค่า yแบ่งออกเป็นสองกลุ่มตามที่ตั้ง (loc) คะแนนมีลักษณะเช่นนี้ เพื่อนร่วมงานได้ตั้งสมมติฐานว่าเราควรใส่การถดถอยเชิงเส้นอย่างง่ายแยกกันในแต่ละกลุ่มซึ่งฉันได้ใช้y ~ x * C(loc)ไปแล้ว เอาท์พุทที่แสดงด้านล่าง OLS Regression Results ============================================================================== Dep. Variable: y R-squared: 0.873 Model: OLS Adj. R-squared: 0.866 Method: Least Squares F-statistic: 139.2 Date: Mon, 13 Jun 2016 Prob (F-statistic): 3.05e-27 Time: 14:18:50 Log-Likelihood: -27.981 No. Observations: 65 AIC: 63.96 Df Residuals: …

2
แนวทางที่ขัดแย้งกันในการเลือกตัวแปร: AIC, p-values ​​หรือทั้งสองอย่าง?
จากสิ่งที่ฉันเข้าใจการเลือกตัวแปรตามค่า p (อย่างน้อยในบริบทการถดถอย) มีข้อบกพร่องสูง ดูเหมือนว่าการเลือกตัวแปรตาม AIC (หรือคล้ายกัน) ก็ถือว่ามีข้อบกพร่องบางอย่างด้วยเหตุผลที่คล้ายกันแม้ว่าจะดูเหมือนไม่ชัดเจน (เช่นดูคำถามของฉันและลิงก์บางส่วนในหัวข้อนี้ที่นี่: "การเลือกรุ่นตามขั้นตอน" คืออะไร? ) แต่สมมติว่าคุณเลือกหนึ่งในสองวิธีนี้เพื่อเลือกชุดพยากรณ์ที่ดีที่สุดในแบบจำลองของคุณ อัมและแอนเดอร์สัน 2002 (การเลือกแบบจำลองและการอนุมานหลายรูปแบบ: วิธีปฏิบัติเชิงทฤษฎีสารสนเทศ, หน้า 83) ระบุว่าไม่ควรผสมการเลือกตัวแปรตาม AIC กับการทดสอบสมมติฐาน : "การทดสอบสมมติฐานว่างและแนวทางสารสนเทศเชิงทฤษฎีควร ไม่ใช้ร่วมกันพวกเขาเป็นกระบวนทัศน์การวิเคราะห์ที่แตกต่างกันมาก " ในอีกทางหนึ่ง Zuur และคณะ 2009 (โมเดลเอฟเฟ็กต์ผสมกับส่วนขยายในระบบนิเวศด้วย R, หน้า 541) ดูเหมือนจะสนับสนุนการใช้AIC เพื่อค้นหาแบบจำลองที่ดีที่สุดก่อนแล้วจึงทำการ "ปรับจูน" โดยใช้การทดสอบสมมติฐาน : "ข้อเสียคือ AIC และคุณอาจต้องใช้การปรับแต่งแบบละเอียด (โดยใช้การทดสอบสมมติฐานจากแนวทางที่หนึ่ง) เมื่อ AIC ได้เลือกแบบจำลองที่ดีที่สุด " คุณสามารถดูว่าสิ่งนี้ทำให้ผู้อ่านหนังสือทั้งสองเล่มสับสนอย่างไร 1) "ค่าย" …

4
มีการระบุรูปแบบโดย auto.arima () อย่างชัดเจนไหม?
ฉันพยายามเรียนรู้และนำแบบจำลอง ARIMA มาใช้ ฉันได้อ่านข้อความยอดเยี่ยมเกี่ยวกับ ARIMA โดย Pankratz - การพยากรณ์ด้วย Univariate Box - โมเดลเจนกินส์: แนวคิดและคดีต่างๆ ในข้อความที่ผู้เขียนเน้นเป็นพิเศษในการเลือกรูปแบบ ARIMA ผมเริ่มเล่นกับauto.arima()ฟังก์ชั่นในRแพคเกจการคาดการณ์ นี่คือสิ่งที่ผมทำผมจำลอง ARIMA auto.arima()และนำไปใช้แล้ว ด้านล่างเป็น 2 ตัวอย่าง อย่างที่คุณเห็นในตัวอย่างทั้งสองauto.arima()ระบุรูปแบบที่ชัดเจนว่าหลายคนอาจมองว่าไม่ใช้คำพูด โดยเฉพาะอย่างยิ่งในตัวอย่างที่ 2 ซึ่งauto.arima()ระบุ ARIMA (3,0,3) เมื่อจริง ๆ แล้ว ARIMA (1,0,1) น่าจะเพียงพอแล้ว ด้านล่างเป็นคำถามของฉัน ฉันขอขอบคุณข้อเสนอแนะและคำแนะนำใด ๆ มีคำแนะนำใดบ้างในการใช้ / แก้ไขโมเดลที่ระบุโดยใช้อัลกอริทึมอัตโนมัติเช่นauto.arima()? มีหลุมใดที่ใช้เพียง AIC (ซึ่งเป็นสิ่งที่ฉันคิดว่าauto.arima()ใช้) เพื่อระบุรูปแบบ? อัลกอริทึมอัตโนมัติที่สร้างขึ้นนั้นสามารถใช้จองหรือไม่? โดยวิธีที่ฉันใช้auto.arima()เป็นเพียงตัวอย่าง สิ่งนี้จะนำไปใช้กับอัลกอริทึมอัตโนมัติใด ๆ ด้านล่างคือตัวอย่าง …

1
AIC / BIC: การเปลี่ยนลำดับของพารามิเตอร์จะมีจำนวนเท่าใด?
สมมติว่าฉันมีปัญหาในการเลือกรุ่นและฉันพยายามใช้AICหรือBICเพื่อประเมินโมเดล ตรงไปตรงมาสำหรับรุ่นที่มีบางส่วนจำนวนของพารามิเตอร์ค่าจริงkkk อย่างไรก็ตามจะเกิดอะไรขึ้นถ้าหนึ่งในโมเดลของเรา (ตัวอย่างเช่นโมเดล Mallows ) มีการเปลี่ยนแปลงรวมถึงพารามิเตอร์ที่มีมูลค่าจริงแทนที่จะเป็นพารามิเตอร์ที่มีมูลค่าจริง ผมยังสามารถเพิ่มความเป็นไปได้มากกว่าพารามิเตอร์แบบเช่นการได้รับการเปลี่ยนแปลงและพารามิเตอร์พี แต่วิธีการที่หลายพารามิเตอร์ไม่πนับรวมในการคำนวณ AIC / BIC?ππ\piพีppππ\pi

2
การเลือกรูปแบบที่ไม่ซ้อนกัน
ทั้งการทดสอบอัตราส่วนความน่าจะเป็นและ AIC เป็นเครื่องมือสำหรับการเลือกระหว่างสองรุ่นและทั้งสองแบบนั้นขึ้นอยู่กับความน่าจะเป็นบันทึก แต่ทำไมการทดสอบอัตราส่วนความน่าจะเป็นไม่สามารถใช้ในการเลือกระหว่างแบบจำลองสองแบบที่ไม่ซ้อนกันในขณะที่ AIC สามารถทำได้

2
การทำความเข้าใจเกณฑ์ AIC และ Schwarz
ฉันกำลังใช้โมเดลโลจิสติก ชุดข้อมูลโมเดลจริงมีตัวแปรมากกว่า 100 ตัว แต่ฉันเลือกชุดข้อมูลทดสอบที่มีตัวแปรประมาณ 25 ตัว ก่อนหน้านั้นฉันยังสร้างชุดข้อมูลซึ่งมีตัวแปร 8-9 ตัว ฉันถูกบอกว่าค่า AIC และ SC สามารถนำมาใช้เพื่อเปรียบเทียบแบบจำลอง ฉันสังเกตว่าโมเดลมีค่า SC สูงกว่าแม้ว่าตัวแปรจะมีค่า p ต่ำ (เช่น 0053) สำหรับสัญชาตญาณของฉันแบบจำลองที่มีตัวแปรที่มีระดับนัยสำคัญที่ดีควรทำให้ค่า SC และ AIC ต่ำ แต่นั่นไม่ได้เกิดขึ้น ใครก็ได้ช่วยอธิบายให้ฟังหน่อยได้ไหม ในระยะสั้นฉันต้องการถามคำถามต่อไปนี้: จำนวนตัวแปรเกี่ยวข้องกับ SC AIC หรือไม่ ฉันควรมุ่งเน้นที่ค่า p หรือค่า SC AIC ต่ำหรือไม่ อะไรคือวิธีทั่วไปในการลดค่า SC AIC

1
AIC ของการถดถอยของสันเขา: องศาอิสระเทียบกับจำนวนพารามิเตอร์
ฉันต้องการคำนวณ AICc ของตัวแบบการถดถอยแนวสัน ปัญหาคือจำนวนพารามิเตอร์ สำหรับการถดถอยเชิงเส้นคนส่วนใหญ่แนะนำว่าจำนวนของพารามิเตอร์เท่ากับจำนวนของค่าสัมประสิทธิ์โดยประมาณพร้อมซิกม่า (ความแปรปรวนของข้อผิดพลาด) เมื่อพูดถึงการถดถอยของสันเขาฉันได้อ่านว่าร่องรอยของเมทริกซ์ของหมวก - ระดับความเป็นอิสระ (df) - นั้นถูกใช้เป็นจำนวนพารามิเตอร์ในสูตร AIC (เช่นที่นี่หรือที่นี่ ) ถูกต้องหรือไม่ ฉันสามารถใช้ df เพื่อคำนวณ AICc ได้หรือไม่ ฉันสามารถเพิ่ม +1 ลงในบัญชี df เพื่อดูความแปรปรวนข้อผิดพลาดได้หรือไม่

1
คุณสามารถเปรียบเทียบค่า AIC ได้หรือไม่หากโมเดลนั้นใช้ชุดข้อมูลเดียวกัน
ฉันกำลังทำการพยากรณ์ใน R โดยใช้แพ็คเกจการพยากรณ์ของ Rob Hyndman กระดาษที่อยู่ในแพคเกจที่สามารถพบได้ที่นี่ ในกระดาษหลังจากอธิบายอัลกอริทึมการพยากรณ์อัตโนมัติผู้เขียนใช้อัลกอริทึมในชุดข้อมูลเดียวกัน อย่างไรก็ตามหลังจากการประเมินทั้งการทำให้เรียบแบบเอ็กซ์โปเนนเชียลและแบบจำลอง ARIMA พวกเขาสร้างข้อความที่ฉันไม่เข้าใจ (หน้า 17): โปรดทราบว่าเกณฑ์ข้อมูลไม่สามารถเปรียบเทียบกันได้ ฉันคิดว่าข้อดีของการใช้ AIC สำหรับการเลือกแบบจำลองคือเราสามารถเปรียบเทียบค่า AIC จากแบบจำลองที่แตกต่างกันได้ตราบใดที่มีการประมาณโดยใช้ชุดข้อมูลเดียวกัน สิ่งนี้ไม่ถูกต้องหรือ เรื่องนี้เป็นเรื่องที่น่าสนใจเป็นพิเศษสำหรับฉันในขณะที่ฉันกำลังวางแผนในการรวมการคาดการณ์จากคลาสรุ่นต่างๆ (เช่นการทำให้เรียบแบบเอกซ์โพเนนเชียลและ ARIMA) โดยใช้ที่เรียกว่าน้ำหนัก Akaike (ดู Burnham and Anderson, 2002) อ้างอิง Burnham, KP, & Anderson, DR (2002) การเลือกรูปแบบและการอนุมานหลายรูปแบบ: วิธีการเชิงทฤษฎีและสารสนเทศ Springer Verlag

2
เป็นไปได้หรือไม่ที่ AIC และ BIC ให้การเลือกรุ่นที่แตกต่างกันโดยสิ้นเชิง?
ฉันกำลังแสดงแบบจำลองการถดถอยปัวซองด้วย 1 ตัวแปรการตอบสนองและ 6 ตัวแปร การเลือกแบบจำลองโดยใช้ผลลัพธ์ AIC ในแบบจำลองที่มี covariates ทั้งหมดรวมถึง 6 เงื่อนไขการโต้ตอบ อย่างไรก็ตาม BIC ส่งผลให้แบบจำลองมี covariates เพียง 2 ตัวและไม่มีเงื่อนไขการโต้ตอบ เป็นไปได้หรือไม่ที่ทั้งสองเกณฑ์นั้นดูคล้ายกันมากให้ผลการเลือกแบบจำลองต่างกันโดยสิ้นเชิง?

1
เป็นแปลงราก -th แนะนำ?
เพื่อนร่วมงานของฉันต้องการวิเคราะห์ข้อมูลบางอย่างหลังจากเปลี่ยนตัวแปรการตอบสนองด้วยการเพิ่มเป็น (นั่นคือ )1818\frac18y0.125y0.125y^{0.125} ฉันรู้สึกไม่สบายใจกับสิ่งนี้ แต่การดิ้นรนเพื่ออธิบายว่าทำไม ฉันไม่สามารถนึกถึงเหตุผลเชิงกลไกใด ๆ สำหรับการเปลี่ยนแปลงนี้ ฉันไม่เคยเห็นมาก่อนและฉันกังวลว่าบางทีมันอาจทำให้อัตราความผิดพลาดของ Type I หรือบางอย่างเพิ่มขึ้น - แต่ฉันไม่มีอะไรจะสนับสนุนข้อกังวลเหล่านี้! นอกจากนี้เพื่อนร่วมงานของฉันพบว่าโมเดลที่แปลงเหล่านี้มีประสิทธิภาพสูงกว่าโมเดลที่ไม่ได้รับการแปลงในการเปรียบเทียบ AIC ในตัวมันเองปรับการใช้งานให้เหมาะสมหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.