คำถามติดแท็ก aic

AIC ย่อมาจาก Akaike Information Criterion ซึ่งเป็นเทคนิคหนึ่งที่ใช้ในการเลือกแบบจำลองที่ดีที่สุดจากคลาสของแบบจำลองโดยใช้โอกาสในการถูกลงโทษ AIC ขนาดเล็กแสดงถึงแบบจำลองที่ดีกว่า

5
ข้อดีของการรักษาแบบสุ่มในแบบผสมคืออะไร
ฉันมีปัญหาในการใช้ประโยชน์จากการติดฉลากแบบจำลองด้วยเหตุผลแบบสุ่มด้วยเหตุผลบางประการ สำหรับฉันดูเหมือนว่าในเกือบทุกกรณีทางออกที่ดีที่สุดคือการรักษาปัจจัยทั้งหมดตามที่ได้รับการแก้ไข ครั้งแรกความแตกต่างของการจับคู่เทียบกับการสุ่มค่อนข้างสุ่ม คำอธิบายมาตรฐานคือหากมีใครสนใจในหน่วยทดลองเฉพาะต่อหนึ่งคนก็ควรใช้เอฟเฟกต์คงที่และหากใครสนใจประชากรที่เป็นตัวแทนของหน่วยทดลองก็ควรใช้เอฟเฟกต์แบบสุ่ม สิ่งนี้ไม่ได้ช่วยอะไรมากเพราะมันบอกเป็นนัย ๆ ว่าสามารถสลับกันระหว่างมุมมองแบบคงที่และแบบสุ่มแม้ว่าข้อมูลและการออกแบบการทดลองยังคงเหมือนเดิม นอกจากนี้คำจำกัดความนี้ส่งเสริมภาพลวงตาว่าหากปัจจัยถูกระบุว่าเป็นแบบสุ่มการอนุมานที่ดึงมาจากตัวแบบนั้นมีความเหมาะสมกับประชากรมากกว่าในกรณีที่ตัวประกอบถูกระบุว่าเป็นแบบคงที่ ในที่สุดGelman แสดงให้เห็นว่าความแตกต่างแบบสุ่มคงที่ทำให้เกิดความสับสน แม้ในระดับคำจำกัดความเนื่องจากมีคำจำกัดความเพิ่มเติมอีกสี่คำของเอฟเฟกต์แบบคงที่และแบบสุ่ม ประการที่สองการประมาณค่าของตัวแบบผสมค่อนข้างซับซ้อน ซึ่งแตกต่างจากโมเดล "คงที่หมดจด" มีมากกว่าสองสามวิธีในการรับค่า p ศาสตราจารย์ Prof. Bates ที่ใช้การประมาณค่า REML ในแพ็คเกจ lme4 ใน R ไปไกลจนปฏิเสธที่จะรายงานค่า p ทั้งหมด . ประการที่สามมีปัญหาที่มืดของจำนวนพารามิเตอร์โดยนัยที่นำมาใช้โดยปัจจัยสุ่ม ตัวอย่างต่อไปนี้คือการปรับตัวของฉันที่อยู่ในอัม & Anderson, รุ่นการคัดเลือกและมีหลายรุ่นอนุมาน: วิธีการข้อมูลตามทฤษฎีปฏิบัติ จากมุมมองการแลกเปลี่ยนความแปรปรวนแบบอคติบทบาทของเอฟเฟกต์แบบสุ่มสามารถแสดงได้ดังนี้ พิจารณาการวิเคราะห์ความแปรปรวนแบบทางเดียวกับรีทเม้นต์และKปัจจัยหลักซึ่งK - 1สามารถประมาณได้ คำผิดพลาดมีN ( 0 , σ 2 )เพิ่มขึ้น สมมติว่าเราบอกว่าKผลกระทบหลักมาจากN (KKKKKKK−1K−1K - 1N(0,σ2)N(0,σ2)\mathcal …

3
AIC กับการตรวจสอบความถูกต้องข้ามในอนุกรมเวลา: กรณีตัวอย่างขนาดเล็ก
ฉันสนใจในการเลือกรูปแบบในการตั้งค่าอนุกรมเวลา เพื่อความเป็นรูปธรรมสมมติว่าฉันต้องการเลือกรุ่น ARMA จากกลุ่มของรุ่น ARMA ที่มีคำสั่งซื้อล่าช้าต่างกัน สุดยอดความตั้งใจคือการคาดการณ์ การเลือกรุ่นสามารถทำได้โดย การตรวจสอบข้าม การใช้เกณฑ์ข้อมูล (AIC, BIC) ท่ามกลางวิธีอื่น ๆ ร็อบเจ Hyndman มีวิธีการทำการตรวจสอบข้ามอนุกรมเวลา สำหรับตัวอย่างที่มีขนาดค่อนข้างเล็กขนาดของตัวอย่างที่ใช้ในการตรวจสอบความถูกต้องไขว้อาจมีคุณภาพแตกต่างจากขนาดตัวอย่างดั้งเดิม ตัวอย่างเช่นหากขนาดตัวอย่างดั้งเดิมคือ 200 การสังเกตดังนั้นใครจะคิดว่าจะเริ่มการตรวจสอบข้ามโดยการสังเกต 101 ครั้งแรกและขยายหน้าต่างเป็น 102, 103, ... , 200 การสังเกตเพื่อให้ได้ 100 ผลการตรวจสอบข้าม เห็นได้ชัดว่าแบบจำลองที่มีเหตุผลพอสมควรสำหรับการสังเกต 200 ครั้งอาจใหญ่เกินไปสำหรับการสังเกต 100 ครั้งดังนั้นข้อผิดพลาดในการตรวจสอบจะมีขนาดใหญ่ ดังนั้นการตรวจสอบข้ามจึงมีแนวโน้มที่จะสนับสนุนรูปแบบที่ไม่สุภาพ นี่คือผลกระทบที่ไม่พึงประสงค์เกิดจากการไม่ตรงกันในขนาดตัวอย่าง ทางเลือกอื่นในการตรวจสอบข้ามคือการใช้เกณฑ์ข้อมูลสำหรับการเลือกแบบจำลอง เนื่องจากฉันสนใจเกี่ยวกับการคาดการณ์ฉันจะใช้ AIC ถึงแม้ว่า AIC นั้นจะเทียบเท่ากับ asymptotically ในการลดการคาดการณ์ MSE แบบขั้นตอนเดียวให้น้อยที่สุดสำหรับแบบจำลองอนุกรมเวลา (อ้างอิงจาก Rob …

3
การตีความหมายเลข AIC & BIC
ฉันกำลังมองหาตัวอย่างของวิธีการตีความ AIC (เกณฑ์ข้อมูล Akaike) และการประเมิน BIC (เกณฑ์ข้อมูล Bayesian) ความแตกต่างเชิงลบระหว่าง BIC สามารถตีความได้ว่าเป็นราคาต่อรองของรุ่นหนึ่งมากกว่าอีกรุ่นหนึ่งหรือไม่ ฉันจะใส่คำนี้เป็นคำพูดได้อย่างไร ตัวอย่างเช่น BIC = -2 อาจบอกเป็นนัยว่าอัตราต่อรองของแบบจำลองที่ดีกว่ารุ่นอื่น ๆ คือประมาณ ?อี2= 7.4e2=7.4e^2= 7.4 คำแนะนำพื้นฐานใด ๆ ที่ชื่นชมโดย neophyte นี้

2
ควรเปรียบเทียบแบบจำลองเอฟเฟกต์ผสมและหรือตรวจสอบความถูกต้องอย่างไร
รุ่นเอฟเฟกต์ผสม (เชิงเส้น) เป็นอย่างไรเมื่อเปรียบเทียบกับแบบอื่น ฉันรู้ว่าสามารถใช้การทดสอบอัตราส่วนความน่าจะเป็นได้ แต่วิธีนี้ไม่ได้ผลหากแบบจำลองหนึ่งไม่ใช่ 'ส่วนย่อย' ของแบบจำลองอื่นที่ถูกต้องหรือไม่ การประมาณของตัวแบบ df นั้นตรงไปตรงมาเสมอหรือไม่? จำนวนผลกระทบคงที่ + จำนวนองค์ประกอบความแปรปรวนโดยประมาณ? เราเพิกเฉยต่อการประมาณผลกระทบแบบสุ่มหรือไม่? สิ่งที่เกี่ยวกับการตรวจสอบ? ความคิดแรกของฉันคือการตรวจสอบข้าม แต่การพับแบบสุ่มอาจไม่ทำงานเนื่องจากโครงสร้างของข้อมูล วิธีการของ 'ปล่อยให้หนึ่งวิชา / กลุ่มออก' เหมาะสมหรือไม่? สิ่งที่เกี่ยวกับการออกจากการสังเกตหนึ่ง Mallows Cp สามารถตีความได้ว่าเป็นการประมาณการข้อผิดพลาดในการทำนายแบบจำลอง การเลือกแบบจำลองผ่าน AIC พยายามลดข้อผิดพลาดในการคาดการณ์ให้น้อยที่สุด (ดังนั้น Cp และ AIC ควรเลือกแบบจำลองเดียวกันหากข้อผิดพลาดคือ Gaussian ฉันเชื่อ) นี่หมายความว่า AIC หรือ Cp สามารถใช้เพื่อเลือกโมเดลเอฟเฟกต์เชิงเส้น 'ที่ดีที่สุด' จากการรวบรวมโมเดลที่ไม่ซ้อนกันบางส่วนในแง่ของการคาดการณ์ข้อผิดพลาดหรือไม่? (หากพวกเขาสอดคล้องกับข้อมูลเดียวกัน) BIC ยังคงมีแนวโน้มที่จะเลือกรูปแบบ 'ของจริง' ในบรรดาผู้สมัครหรือไม่? ฉันยังอยู่ภายใต้ความประทับใจว่าเมื่อเปรียบเทียบโมเดลเอฟเฟกต์ผสมผ่าน AIC …

3
AIC หรือ p-value: อันไหนที่จะเลือกสำหรับการเลือกรูปแบบ?
ฉันใหม่เอี่ยมกับสิ่ง R นี้ แต่ไม่แน่ใจว่าจะเลือกรุ่นใด ฉันทำการถดถอยไปข้างหน้าทีละขั้นตอนเลือกตัวแปรแต่ละตัวตาม AIC ที่ต่ำที่สุด ฉันมากับ 3 แบบที่ฉันไม่แน่ใจซึ่งเป็น "ดีที่สุด" Model 1: Var1 (p=0.03) AIC=14.978 Model 2: Var1 (p=0.09) + Var2 (p=0.199) AIC = 12.543 Model 3: Var1 (p=0.04) + Var2 (p=0.04) + Var3 (p=0.06) AIC= -17.09 ฉันอยากจะไปกับ Model # 3 เพราะมันมี AIC ต่ำที่สุด (ฉันได้ยินว่าเป็นลบก็โอเค) และค่า p ยังค่อนข้างต่ำ ฉันใช้ตัวแปร …

1
การเลือกรูปแบบที่มีการถดถอยโลจิสติก Firth
ในชุดข้อมูลขนาดเล็ก ( ) ที่ฉันทำงานกับหลายตัวแปรให้ฉันที่สมบูรณ์แบบการทำนาย / แยก ฉันจึงใช้การถดถอยโลจิสติก Firthเพื่อจัดการกับปัญหาn∼100n∼100n\sim100 หากฉันเลือกแบบจำลองที่ดีที่สุดโดยAICหรือBICฉันควรรวมคำว่าโทษ Firth ไว้ในความน่าจะเป็นเมื่อคำนวณเกณฑ์ข้อมูลเหล่านี้หรือไม่

3
ความหมายของ 'จำนวนพารามิเตอร์' ใน AIC
เมื่อคำนวณ AIC AIC=2k−2lnLAIC=2k−2lnLAIC = 2k - 2 ln L k หมายถึง 'จำนวนพารามิเตอร์' แต่สิ่งที่นับเป็นพารามิเตอร์ ตัวอย่างเช่นในโมเดล y=ax+by=ax+by = ax + b a และ b ถูกนับเป็นพารามิเตอร์เสมอหรือไม่ ถ้าฉันไม่สนใจเกี่ยวกับคุณค่าของการสกัดกั้นฉันจะเพิกเฉยหรือไม่ก็นับได้หรือไม่ เกิดอะไรขึ้นถ้า y=af(c,x)+by=af(c,x)+by = a f(c,x) + b โดยที่fffคือฟังก์ชันของ c และ x ตอนนี้ฉันจะนับ 3 พารามิเตอร์หรือไม่
21 aic 

3
เปรียบเทียบแบบจำลองที่ไม่ซ้อนกับ AIC
สมมติว่าเราต้องใช้ GLMM mod1 <- glmer(y ~ x + A + (1|g), data = dat) mod2 <- glmer(y ~ x + B + (1|g), data = dat) โมเดลเหล่านี้ไม่ซ้อนในความหมายปกติของ: a <- glmer(y ~ x + A + (1|g), data = dat) b <- glmer(y ~ x + A + B + (1|g), …

1
ความขัดแย้งในการเลือกรูปแบบ (AIC, BIC, เพื่ออธิบายหรือทำนาย)
หลังจากอ่าน Galit Shmueli "เพื่ออธิบายหรือทำนาย" (2010) ฉันรู้สึกสับสนกับความขัดแย้งที่เห็นได้ชัด มีสามสถานที่ AIC- เมื่อเทียบกับ BIC ตามทางเลือกรูปแบบ (ในตอนท้ายของหน้า 300 - จุดเริ่มต้นของ P 301..) ใส่เพียง AIC ควรจะใช้สำหรับการเลือกรูปแบบที่มีไว้สำหรับการคาดการณ์ในขณะที่ BIC ควรจะใช้สำหรับการเลือกรูปแบบการหาคำอธิบาย นอกจากนี้ (ไม่ใช่ในกระดาษด้านบน) เรารู้ว่าภายใต้เงื่อนไขบางอย่าง BIC เลือกรูปแบบที่แท้จริงในชุดของแบบจำลองที่มีตัวเลือก; รูปแบบที่แท้จริงคือสิ่งที่เราแสวงหาในการสร้างแบบจำลองที่อธิบาย (ตอนท้ายของหน้า 293) Simple arithmetics: AIC จะเลือกแบบจำลองที่มีขนาดใหญ่กว่า BIC สำหรับตัวอย่างที่มีขนาด 8 หรือใหญ่กว่า (ที่น่าพอใจln(n)>2ln(n)>2\text{ln}(n)>2เนื่องจากการปรับความซับซ้อนแตกต่างกันใน AIC กับ BIC) "true"รูปแบบ (เช่นรุ่นที่มี regressors ที่ถูกต้องและรูปแบบการทำงานที่ถูกต้อง แต่ค่าสัมประสิทธิ์ประมาณไม่สมบูรณ์) อาจจะไม่เป็นแบบที่ดีที่สุดในการทำนาย (หน้า 307.) …

1
Stepwise AIC - มีข้อโต้แย้งรอบ ๆ หัวข้อนี้หรือไม่?
ฉันได้อ่านโพสต์นับไม่ถ้วนในเว็บไซต์นี้ซึ่งต่อต้านการเลือกตัวแปรแบบขั้นตอนโดยใช้เกณฑ์ใด ๆ ไม่ว่าจะเป็นค่า p ตาม AIC, BIC เป็นต้น ฉันเข้าใจว่าทำไมขั้นตอนเหล่านี้โดยทั่วไปค่อนข้างยากจนสำหรับการเลือกตัวแปร โพสต์ที่มีชื่อเสียงอาจเป็นของ gung ที่นี่แสดงให้เห็นอย่างชัดเจนว่าทำไม; ท้ายที่สุดเรากำลังตรวจสอบสมมติฐานบนชุดข้อมูลเดียวกับที่เราเคยทำกับสมมติฐานซึ่งเป็นเพียงการขุดลอกข้อมูล นอกจากนี้ค่า p จะได้รับผลกระทบจากปริมาณเช่น collinearity และค่าผิดปกติซึ่งทำให้ผลลัพธ์เบ้หนักเป็นต้น แต่ผมได้รับการศึกษาการพยากรณ์อนุกรมเวลาไม่น้อยเมื่อเร็ว ๆ นี้และได้เจอตำรานับหน้าถือตา Hyndman ของที่เขากล่าวถึงที่นี่ใช้ตัวเลือกแบบขั้นตอนที่จะหาคำสั่งซื้อที่เหมาะสมของแบบจำลอง ARIMA โดยเฉพาะอย่างยิ่ง ในความเป็นจริงในforecastแพคเกจใน R อัลกอริทึมที่รู้จักกันดีที่รู้จักกันเป็นauto.arimaค่าเริ่มต้นใช้การเลือกแบบขั้นตอน (กับ AIC ไม่ใช่ค่า p) นอกจากนี้เขายังวิจารณ์การเลือกคุณสมบัติตามค่า p ซึ่งสอดคล้องกับโพสต์หลายรายการในเว็บไซต์นี้ ในที่สุดเราควรข้ามการตรวจสอบในบางวิธีในตอนท้ายถ้าเป้าหมายคือการพัฒนาแบบจำลองที่ดีสำหรับการพยากรณ์ / การทำนาย อย่างไรก็ตามแน่นอนว่านี่เป็นสิ่งที่ไม่เห็นด้วยที่นี่เมื่อพูดถึงขั้นตอนการประเมินตัวชี้วัดอื่น ๆ นอกเหนือจากค่า p ไม่มีใครมีความคิดเห็นใด ๆ เกี่ยวกับการใช้ AIC แบบขั้นตอนในบริบทนี้ แต่โดยทั่วไปยังอยู่นอกบริบทนี้ด้วย ฉันได้รับการสอนให้เชื่อว่าการเลือกตามขั้นตอนใด ๆ …

1
BIC ลองค้นหานางแบบตัวจริงหรือไม่?
คำถามนี้เป็นการติดตามหรือพยายามที่จะกำจัดความสับสนที่เป็นไปได้เกี่ยวกับหัวข้อที่ฉันและคนอื่น ๆ อีกหลายคนพบว่ายากเล็กน้อยเกี่ยวกับความแตกต่างระหว่าง AIC และ BIC ในคำตอบที่ดีมากโดย @Dave Kellen ในหัวข้อนี้ ( /stats//a/767/30589 ) เราอ่าน: คำถามของคุณหมายความว่า AIC และ BIC พยายามตอบคำถามเดียวกันซึ่งไม่เป็นความจริง AIC พยายามเลือกแบบจำลองที่อธิบายความเป็นจริงในมิติที่สูงที่ไม่รู้จักอย่างเพียงพอ ซึ่งหมายความว่าความเป็นจริงไม่เคยอยู่ในชุดของแบบจำลองผู้สมัครที่กำลังพิจารณา ในทางตรงกันข้าม BIC พยายามหาโมเดล TRUE ท่ามกลางกลุ่มผู้สมัคร ฉันคิดว่ามันค่อนข้างแปลกที่สมมติฐานว่าความเป็นจริงนั้นถูกยกตัวอย่างในแบบจำลองที่นักวิจัยสร้างขึ้นไปพร้อม นี่เป็นปัญหาที่แท้จริงสำหรับ BIC ในความคิดเห็นด้านล่างโดย @ gui11aume เราอ่าน: (-1) คำอธิบายที่ดี แต่ฉันต้องการท้าทายการยืนยัน @Dave Kellen คุณช่วยอ้างอิงถึงความคิดที่ว่าโมเดล TRUE นั้นอยู่ในกลุ่ม BIC ได้หรือไม่? ฉันต้องการตรวจสอบเรื่องนี้เนื่องจากในหนังสือเล่มนี้ผู้เขียนให้หลักฐานที่น่าเชื่อถือว่านี่ไม่ใช่กรณี - gui11aume 27 พฤษภาคม '12 …

2
การเปรียบเทียบ AIC ของรุ่นและรุ่นที่แปลงเป็นไฟล์บันทึก
สาระสำคัญของคำถามของฉันคือ: Letเป็นหลายตัวแปรตัวแปรสุ่มปกติที่มีค่าเฉลี่ยและความแปรปรวนเมทริกซ์\ให้Z = \ ล็อก (Y)คือZ_i = \ ล็อก (Y_i) ผม \ in \ {1 \ ldots, n \} ฉันจะเปรียบเทียบ AIC ของแบบจำลองที่เหมาะกับการรับรู้ของYกับแบบจำลองที่ตรงกับการรับรู้ของZ ที่สังเกตได้อย่างไร μ Σ Z : = บันทึก( Y ) Z ฉัน = บันทึก( Y ฉัน ) , ฉัน∈ { 1 , ... , n } Y ZY∈RnY∈RnY \in …

4
บนกล่องจอร์จ Galit Shmueli และวิธีการทางวิทยาศาสตร์?
(คำถามนี้ดูเหมือนว่าจะเหมาะกว่าสำหรับปรัชญา SE ฉันหวังว่านักสถิติสามารถอธิบายความเข้าใจที่คลาดเคลื่อนเกี่ยวกับคำแถลงของ Box และ Shmueli ได้ดังนั้นฉันจึงโพสต์ไว้ที่นี่) George Box (จากชื่อเสียงของ ARIMA) กล่าวว่า: "ทุกรุ่นผิด แต่บางรุ่นก็มีประโยชน์" Galit Shmueli ในกระดาษชื่อดังของเธอ"เพื่ออธิบายหรือทำนาย" , (และอ้างอิงคนอื่นที่เห็นด้วยกับเธอ) ระบุว่า: การอธิบายและการทำนายไม่เหมือนกันและบางรุ่นทำหน้าที่อธิบายได้ดีถึงแม้ว่าพวกเขาจะทำงานได้ดีในการทำนาย ฉันรู้สึกว่าหลักการเหล่านี้ขัดแย้งกับสิ่งใด หากแบบจำลองไม่สามารถคาดเดาได้ดีจะเป็นประโยชน์หรือไม่ ที่สำคัญกว่านั้นถ้าแบบจำลองอธิบายได้ดี (แต่ไม่จำเป็นต้องคาดเดาได้ดี) มันจะต้องเป็นจริง (เช่นไม่ผิด) ไม่ทางใดก็ทางหนึ่ง แล้วตาข่ายกับกล่องของ "ทุกรุ่นผิด" อย่างไร ท้ายที่สุดถ้าแบบจำลองอธิบายได้ดี แต่ไม่คาดการณ์ได้ดีมันจะเป็นไปได้อย่างไรทางวิทยาศาสตร์? เกณฑ์การแบ่งเขตทางวิทยาศาสตร์ส่วนใหญ่ (การตรวจสอบยืนยันการปลอมแปลง ฯลฯ ) หมายถึงว่าคำสั่งทางวิทยาศาสตร์จะต้องมีอำนาจการทำนายหรือเรียกขาน: ทฤษฎีหรือรูปแบบที่ถูกต้องเฉพาะถ้ามันสามารถทดสอบเชิงประจักษ์ (หรือเท็จ) ซึ่งหมายความว่ามัน ต้องทำนายผลลัพธ์ในอนาคต คำถามของฉัน: คำแถลงของ Box และความคิดของ Shmueli ขัดแย้งหรือไม่หรือฉันขาดบางสิ่งบางอย่างเช่นแบบจำลองไม่มีพลังการทำนาย แต่ยังคงมีประโยชน์หรือไม่? หากคำแถลงของ …

1
เหตุใดเกณฑ์ข้อมูล Akaike จึงไม่ใช้ในการเรียนรู้ของเครื่องมากกว่า
ฉันเพิ่งพบกับ "เกณฑ์ข้อมูล Akaike" และฉันสังเกตเห็นวรรณคดีจำนวนมากเกี่ยวกับการเลือกแบบจำลอง (เช่นสิ่งที่ดูเหมือน BIC มีอยู่) เหตุใดจึงไม่วิธีการเรียนรู้ด้วยเครื่องจักรร่วมสมัยใช้ประโยชน์จากเกณฑ์การเลือกรูปแบบ BIC และ AIC เหล่านี้

2
ควรหยุดการปรับแต่งโมเดลเมื่อใด
ฉันเรียนสถิติจากหนังสือหลายเล่มในช่วง 3 ปีที่ผ่านมาและขอบคุณเว็บไซต์นี้ที่ฉันได้เรียนรู้มากมาย อย่างไรก็ตามคำถามพื้นฐานหนึ่งข้อยังคงไม่ได้รับคำตอบสำหรับฉัน อาจมีคำตอบที่ง่ายหรือยากมาก แต่ฉันรู้ว่าต้องใช้ความเข้าใจอย่างลึกซึ้งเกี่ยวกับสถิติ เมื่อปรับแบบจำลองให้สอดคล้องกับข้อมูลไม่ว่าจะเป็นวิธีการแบบประจำหรือแบบเบย์เราขอเสนอแบบจำลองซึ่งอาจประกอบด้วยรูปแบบการทำงานสำหรับความน่าจะเป็นรูปแบบก่อนหน้าหรือเคอร์เนล (ไม่ใช่พารามิเตอร์) เป็นต้นปัญหาคือโมเดลใด ๆ เหมาะกับตัวอย่างที่มีระดับดี เราสามารถค้นหาแบบจำลองที่ดีกว่าหรือแย่กว่าเสมอเมื่อเทียบกับสิ่งที่อยู่ในมือ ในบางจุดที่เราหยุดและเริ่มต้นการสรุปสรุปพารามิเตอร์ของประชากรรายงานช่วงความเชื่อมั่นคำนวณความเสี่ยง ฯลฯ ดังนั้นไม่ว่าข้อสรุปใดที่เราวาดจะมีเงื่อนไขตามแบบจำลองที่เราตัดสินใจเลือกเสมอ แม้ว่าเราจะใช้เครื่องมือในการประมาณระยะทาง KL ที่คาดหวังเช่น AIC, MDL เป็นต้น แต่ก็ไม่ได้พูดอะไรเกี่ยวกับตำแหน่งที่เรายืนอยู่บนพื้นฐานแบบสัมบูรณ์ แต่เพียงปรับปรุงการประมาณค่าแบบสัมพันธ์ ตอนนี้สมมติว่าเราต้องการกำหนดขั้นตอนตามขั้นตอนเพื่อนำไปใช้กับชุดข้อมูลใด ๆ เมื่อสร้างแบบจำลอง เราควรระบุอะไรเป็นกฏการหยุด? อย่างน้อยเราสามารถผูกข้อผิดพลาดของแบบจำลองซึ่งจะทำให้เรามีจุดหยุดตามวัตถุประสงค์ (ซึ่งแตกต่างจากการหยุดการฝึกอบรมโดยใช้ตัวอย่างการตรวจสอบความถูกต้องเนื่องจากมันให้จุดหยุดภายในคลาสโมเดลที่ประเมินมากกว่า wrt DGP จริง)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.