คำถามติดแท็ก aic

AIC ย่อมาจาก Akaike Information Criterion ซึ่งเป็นเทคนิคหนึ่งที่ใช้ในการเลือกแบบจำลองที่ดีที่สุดจากคลาสของแบบจำลองโดยใช้โอกาสในการถูกลงโทษ AIC ขนาดเล็กแสดงถึงแบบจำลองที่ดีกว่า

1
การเลือกตัวแปรเทียบกับการเลือกรุ่น
ฉันเข้าใจว่าการเลือกตัวแปรเป็นส่วนหนึ่งของการเลือกแบบจำลอง แต่การเลือกแบบจำลองนั้นประกอบด้วยอะไรบ้าง? มันเป็นมากกว่าต่อไปนี้: 1) เลือกการกระจายสำหรับรุ่นของคุณ 2) เลือกตัวแปรอธิบาย? ฉันถามสิ่งนี้เพราะฉันกำลังอ่านบทความBurnham & Anderson: AIC กับ BICที่พวกเขาพูดคุยเกี่ยวกับ AIC และ BIC ในการเลือกรูปแบบ การอ่านบทความนี้ฉันรู้ว่าฉันกำลังคิดถึง 'การเลือกแบบจำลอง' เป็น 'การเลือกตัวแปร' (อ้างอิงความคิดเห็นBIC พยายามค้นหาแบบจำลองที่แท้จริงหรือไม่ ) ข้อความที่ตัดตอนมาจากบทความที่พวกเขาพูดคุยเกี่ยวกับ 12 รุ่นที่มีระดับ "ทั่วไป" ที่เพิ่มขึ้นและโมเดลเหล่านี้แสดง "เอฟเฟกต์การเรียว" (รูปที่ 1) เมื่อ KL-Information ถูกพล็อตกับ 12 โมเดล: ปรัชญาและรุ่นเป้าหมายที่แตกต่าง ... แม้ว่าเป้าหมายของ BIC จะเป็นรูปแบบทั่วไปมากกว่าแบบเป้าหมายสำหรับ AIC แต่แบบจำลองที่เลือกโดย BIC ส่วนใหญ่มักจะน้อยกว่ารุ่น 7 ยกเว้นว่าnมีขนาดใหญ่มาก มันอาจจะเป็นแบบ 5 …

2
นิยาม AIC ที่แตกต่าง
จากวิกิพีเดียมีคำนิยามของ Akaike's Information Criterion (AIC) เป็นโดยที่kคือจำนวนพารามิเตอร์และlog Lคือความเป็นไปได้ของโมเดลA Iค= 2 k - 2 บันทึกLAIC=2k−2log⁡L AIC = 2k -2 \log L kkkเข้าสู่ระบบLlog⁡L\log L อย่างไรก็ตามบันทึกเศรษฐเราในมหาวิทยาลัยของรัฐที่นับหน้าถือตาที่ฉันC = บันทึก( σ 2 ) + 2 ⋅ k . นี่ σ 2คือความแปรปรวนโดยประมาณสำหรับข้อผิดพลาดในรูปแบบ ARMA และTคือจำนวนของการสังเกตในชุดข้อมูลชุดเวลาA Iค= บันทึก( σ^2) + 2 ⋅ kTAIC=log⁡(σ^2)+2⋅kT AIC = \log (\hat{\sigma}^2) + \frac{2 …

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
เกณฑ์สำหรับการเลือกโมเดล“ ดีที่สุด” ในโมเดลมาร์คอฟที่ซ่อนอยู่
ฉันมีชุดข้อมูลอนุกรมเวลาที่ฉันพยายามจัดวางแบบซ่อนมาร์คอฟ (HMM) เพื่อประเมินจำนวนสถานะแฝงในข้อมูล รหัสหลอกของฉันสำหรับทำสิ่งนี้มีดังต่อไปนี้: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } ตอนนี้ในรูปแบบการถดถอยปกติ BIC มีแนวโน้มที่จะชอบรูปแบบที่น่าสังเวชมากที่สุด แต่ในกรณีของ HMM ฉันไม่แน่ใจว่ามันคือสิ่งที่ทำ มีใครบ้างที่ทราบว่าเกณฑ์ BIC ของ HMM ประเภทใดมีแนวโน้มเป็นจริง? ฉันยังสามารถได้รับ AIC และค่าความน่าจะเป็นเช่นกัน เนื่องจากฉันพยายามที่จะอนุมานจำนวนจริงของรัฐเป็นหนึ่งในเกณฑ์เหล่านี้ "ดีกว่า" เพื่ออื่น ๆ สำหรับวัตถุประสงค์นี้หรือไม่

2
ปัญหาในการเปรียบเทียบแบบจำลอง GLM ที่มีฟังก์ชั่นลิงก์แตกต่างกัน
ด้วยชุดโควารีและชุดการกระจายเดียวกันฉันจะเปรียบเทียบรุ่นที่มีฟังก์ชั่นลิงค์ต่างกันได้อย่างไร ฉันคิดว่าคำตอบที่ถูกต้องคือ "AIC / BIC" แต่ฉันไม่แน่ใจ 100% เป็นไปได้ไหมที่จะมีรุ่นที่ซ้อนกันหากมีลิงค์อื่นอยู่?

1
AIC สำหรับรุ่นที่ไม่ซ้อนกัน: normalizing ค่าคงที่
เอไอซีถูกกำหนดให้เป็นฉันC = - 2 เข้าสู่ระบบ( L ( θ ) ) + 2 Pที่θเป็นประมาณการความน่าจะเป็นสูงสุดและPเป็นมิติของพื้นที่พารามิเตอร์ สำหรับการประมาณθAIC=−2log(L(θ^))+2pAIC=−2log⁡(L(θ^))+2pAIC=-2 \log(L(\hat\theta))+2pθ^θ^\hat\thetapppθθ\thetaมักจะละเลยปัจจัยคงที่ของความหนาแน่น นี่คือปัจจัยที่ไม่ได้ขึ้นอยู่กับพารามิเตอร์เพื่อลดความซับซ้อนของโอกาส ในทางกลับกันปัจจัยนี้มีความสำคัญมากสำหรับการคำนวณ AIC เนื่องจากเมื่อเปรียบเทียบแบบจำลองที่ไม่ซ้อนกันปัจจัยนี้ไม่ธรรมดาและลำดับของ AIC ที่เกี่ยวข้องอาจแตกต่างกันหากไม่ได้พิจารณา คำถามของฉัน , เราจะต้องคำนวณรวมทั้งแง่ของความหนาแน่นเมื่อเปรียบเทียบกับรุ่นที่ไม่ซ้อนกันทั้งหมดหรือไม่log(L(θ^))log⁡(L(θ^))\log(L(\hat\theta))

2
ทดสอบความแตกต่างใน AIC ของรุ่นที่ไม่ซ้อนกันสองแบบ
จุดรวมของ AIC หรือเกณฑ์ข้อมูลอื่น ๆ นั้นดีกว่าน้อยกว่า ดังนั้นถ้าฉันมีสองรุ่น M1: y = a0 + XA + e และ M2: y = b0 + ZB + u และถ้า AIC ของรุ่นแรก (A1) น้อยกว่ารุ่นที่สอง (A2) ดังนั้น M1 จะมี แบบที่ดีขึ้นจากมุมมองของทฤษฎีข้อมูล แต่มีเกณฑ์มาตรฐานลัดสำหรับความแตกต่างของ A1-A2 หรือไม่? จริง ๆ แล้วมีจำนวนน้อยเท่าใด อีกนัยหนึ่งมีการทดสอบสำหรับ (A1-A2) ที่นอกเหนือจากการมองด้วยตาหรือไม่ แก้ไข: Peter / Dmitrij ... ขอบคุณที่ตอบกลับ ที่จริงนี่เป็นกรณีที่ความเชี่ยวชาญที่สำคัญของฉันขัดแย้งกับความเชี่ยวชาญทางสถิติของฉัน โดยพื้นฐานแล้วปัญหาไม่ได้เลือกระหว่างสองรุ่น …
12 regression  aic 

3
เมื่อใดจึงเหมาะสมที่จะเลือกรุ่นโดยการลด AIC
เป็นที่ยอมรับกันอย่างน้อยในหมู่นักสถิติที่มีความสามารถสูงกว่านั้นแบบจำลองที่มีค่าของสถิติ AIC ภายในขีด จำกัด ที่แน่นอนของค่าต่ำสุดควรได้รับการพิจารณาตามความเหมาะสมเช่นเดียวกับแบบจำลองที่ลดสถิติ AIC ตัวอย่างเช่นใน [1, p.221] เราพบ จากนั้นแบบจำลองที่มี GCV ขนาดเล็กหรือ AIC ก็ถือว่าดีที่สุด แน่นอนว่าไม่ควรลด GCV หรือ AIC เพียงเล็กน้อย ค่อนข้างทุกรุ่นที่มีค่า GCV หรือ AIC ขนาดเล็กพอสมควรควรพิจารณาว่าเหมาะสมและประเมินตามความเรียบง่ายและความเกี่ยวข้องทางวิทยาศาสตร์ ในทำนองเดียวกันใน [2, p.144] เรามี มันได้รับการแนะนำ (Duong, 1984) ว่ารูปแบบที่มีค่า AIC ภายใน c ของค่าต่ำสุดควรได้รับการพิจารณาการแข่งขัน (กับ c = 2 เป็นค่าทั่วไป) การคัดเลือกจากแบบจำลองการแข่งขันนั้นจะขึ้นอยู่กับปัจจัยต่าง ๆ เช่นความขาวของสารตกค้าง (ส่วนที่ 5.3) และความเรียบง่ายของแบบจำลอง อ้างอิง: รัพเพอร์, …

1
ความแตกต่างระหว่าง AIC () และ extractAIC () ใน R คืออะไร?
เอกสาร R สำหรับทั้งไม่ส่องแสงมาก สิ่งที่ฉันได้รับจากลิงค์นี้คือการใช้อย่างใดอย่างหนึ่งควรจะดี สิ่งที่ฉันไม่ได้รับคือทำไมพวกเขาไม่เท่ากัน ความจริง: ฟังก์ชั่นแบบขั้นตอนการถดถอยในการวิจัย, การใช้งานstep()extractAIC() ที่น่าสนใจการทำงานlm()รูปแบบและglm()'null' รุ่น (เฉพาะตัด) ในชุดข้อมูล 'mtcars ของ R ให้ผลลัพธ์ที่แตกต่างกันสำหรับและAICextractAIC() > null.glm = glm(mtcars$mpg~1) > null.lm = lm(mtcars$mpg~1) > AIC(null.glm) [1] 208.7555 > AIC(null.lm) [1] 208.7555 > extractAIC(null.glm) [1] 1.0000 208.7555 > extractAIC(null.lm) [1] 1.0000 115.9434 เป็นเรื่องแปลกเพราะทั้งสองรุ่นข้างต้นเหมือนกันและAIC()ให้ผลลัพธ์ที่เหมือนกันสำหรับทั้งคู่ ทุกคนสามารถโยนแสงในปัญหาหรือไม่

1
ฉันควรทำอย่างไรเมื่อค่าของ AIC ต่ำและใกล้เคียงกัน?
Chris Chatfield ซึ่งมีหนังสือและเอกสารคุณภาพมากมายที่ฉันชอบอ่านใน (1) ให้คำแนะนำต่อไปนี้: ตัวอย่างเช่นควรเลือกตัวเลือกระหว่างรุ่นอนุกรมเวลาของ ARIMA ที่มีค่า AIC ต่ำและประมาณเท่ากันโดยไม่เกิดขึ้นกับ AIC ขั้นต่ำ แต่จะให้การคาดการณ์ที่ดีที่สุดสำหรับข้อมูลล่าสุดของปีที่ผ่านมา เหตุผลสำหรับคำแนะนำดังกล่าวคืออะไร? หากเป็นเสียงเหตุใดการคาดการณ์ :: auto.arima และรูทีนการพยากรณ์อื่นจึงไม่ทำตาม ยังไม่ได้ใช้งาน? มันได้รับการกล่าวถึงที่นี่ว่าจะมองหารูปแบบที่เกิดขึ้นเพียงเพื่อให้ขั้นต่ำ AIC อาจจะไม่ได้เป็นความคิดที่ดี เหตุใดตัวเลือกในการมีโมเดล ARIMA ที่มีค่าต่ำ แต่ประมาณเท่ากัน (เช่นภายใน 1 หรือ 2 ค่าของ AIC ขั้นต่ำ) ไม่ได้เป็นค่าเริ่มต้นในซอฟต์แวร์การพยากรณ์อนุกรมเวลาส่วนใหญ่n≥1n≥1n\ge1 (1) Chatfield, C. (1991) หลีกเลี่ยงข้อผิดพลาดทางสถิติ วิทยาศาสตร์สถิติ, 6 (3), 240–252 ออนไลน์ที่มีอยู่ URL: https://projecteuclid.org/euclid.ss/1177011686

1
เปรียบเทียบความพอดีของโมเดลกับการตอบสนองที่เปลี่ยนแปลงและไม่แปลงรูปแบบ
ฉันต้องการเปรียบเทียบข้อมูลที่มีสัดส่วนระหว่างกลุ่มต่าง ๆ สามกลุ่มเช่น: ID Group Prop.Nitrogen 1 A 0.89 2 A 0.85 3 B 0.92 4 B 0.97 ติดตาม Wharton และ Hui (ดอย: 10.1890 / 10-0340.1 1 ) ฉันว่าฉันจะดูว่าข้อมูลเหล่านี้จะจัดการกับการใช้ logit ที่ดีขึ้นหรือไม่ เมื่อฉันดูพล็อตการวินิจฉัยสำหรับตัวแบบเชิงเส้นบนข้อมูลที่ถูกแปลงและไม่ถูกแปลงพวกมันดูคล้ายกันมากโดยไม่มีปัญหาที่ชัดเจนและมีความแตกต่างเพียงเล็กน้อยในพารามิเตอร์ที่ประมาณไว้ อย่างไรก็ตามฉันยังต้องการที่จะพูดอะไรบางอย่างเกี่ยวกับรูปแบบที่เหมาะกับข้อมูลที่ถูกแปลงและไม่มีการแปลงรูปแบบได้อย่างไร - ฉันรู้ว่าฉันไม่สามารถเปรียบเทียบค่า AIC ได้โดยตรง มีการแก้ไขและฉันสามารถตรวจสอบสิ่งนี้ได้หรือไม่? หรือฉันควรจะใช้วิธีการที่แตกต่างกันอย่างไร

3
การเปรียบเทียบตัวแบบการถดถอยกับข้อมูลการนับ
ฉันเพิ่งพอดีแบบจำลองการถดถอย 4 แบบสำหรับข้อมูลตัวทำนาย / ตอบกลับเดียวกัน รุ่นที่ฉันพอดีกับการถดถอยของปัวซอง model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...) model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...) แบบจำลองสองแบบที่ฉันพอดีกับการถดถอยแบบทวินาม library(MASS) model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...) model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...) …


2
อะไรคือวิธี Box-Jenkins สำหรับกระบวนการ ARIMA
วิกิพีเดียหน้าบอกว่ากล่องเจนกินส์เป็นวิธีการที่เหมาะสมรูปแบบ ARIMA ชุดเวลา ตอนนี้ถ้าฉันต้องการให้พอดีกับแบบจำลอง ARIMA กับอนุกรมเวลาฉันจะเปิด SAS, โทรproc ARIMA, จัดหาพารามิเตอร์และ SAS จะให้ค่าสัมประสิทธิ์ AR และ MA ตอนนี้ฉันสามารถลองชุดค่าผสมของp , d , qและ SAS ที่แตกต่างกันจะให้ค่าสัมประสิทธิ์ในแต่ละกรณี ฉันเลือกชุดที่มีเกณฑ์ข้อมูล Akaike ต่ำสุดP , d, qพี,d,Qp,d,qP , d, qพี,d,Qp,d,q คำถามของฉันคือ: ฉันใช้ Box-Jenkins ในกระบวนการข้างต้นได้ที่ไหน ฉันควรจะใช้ Box-Jenkins เพื่อหาค่าประมาณหรือไม่ หรือ SAS ใช้ภายในอย่างใด?P , d, qพี,d,Qp,d,q

2
มีแบบจำลองสถิติพอดี (เช่น AIC หรือ BIC) ที่สามารถใช้สำหรับสัมบูรณ์แทนการเปรียบเทียบแบบเปรียบเทียบได้หรือไม่
ฉันไม่คุ้นเคยกับวรรณกรรมนี้ดังนั้นโปรดยกโทษให้ฉันถ้านี่เป็นคำถามที่ชัดเจน เนื่องจาก AIC และ BIC ขึ้นอยู่กับการเพิ่มโอกาสให้มากที่สุดดูเหมือนว่าพวกเขาสามารถนำมาใช้เพื่อทำการเปรียบเทียบแบบเปรียบเทียบระหว่างชุดของแบบจำลองที่พยายามให้พอดีกับชุดข้อมูลที่กำหนด ตามความเข้าใจของฉันมันไม่สมเหตุสมผลเลยที่จะคำนวณ AIC สำหรับรุ่น A บนชุดข้อมูล 1 คำนวณ AIC สำหรับรุ่น B ในชุดข้อมูล 2 จากนั้นเปรียบเทียบค่า AIC ทั้งสองและตัดสินว่า (เช่น) รุ่น A เหมาะกับชุดข้อมูล 1 ดีกว่ารุ่น B เหมาะกับชุดข้อมูล 2 หรือบางทีฉันเข้าใจผิดและนั่นเป็นสิ่งที่สมเหตุสมผลที่ต้องทำ โปรดแจ้งให้เราทราบ คำถามของฉันคือ: มีแบบจำลองสถิติพอดีที่สามารถใช้สำหรับสัมบูรณ์แทนการเปรียบเทียบแบบเปรียบเทียบได้หรือไม่ สำหรับโมเดลเชิงเส้นบางอย่างเช่นจะทำงานได้ มันมีช่วงที่กำหนดไว้และมีระเบียบวินัยความคิดเฉพาะเกี่ยวกับสิ่งที่เป็นค่า "ดี" ฉันกำลังมองหาบางอย่างที่กว้างกว่าและคิดว่าฉันสามารถเริ่มต้นด้วยการส่งผู้เชี่ยวชาญมาที่นี่ ฉันแน่ใจว่ามีบางคนเคยคิดเกี่ยวกับสิ่งนี้มาก่อน แต่ฉันไม่รู้จักคำศัพท์ที่เหมาะสมเพื่อทำการค้นหาที่มีประสิทธิภาพใน Google ScholarR2R2R^2 ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.