ความขัดแย้งในการเลือกรูปแบบ (AIC, BIC, เพื่ออธิบายหรือทำนาย)


18

หลังจากอ่าน Galit Shmueli "เพื่ออธิบายหรือทำนาย" (2010) ฉันรู้สึกสับสนกับความขัดแย้งที่เห็นได้ชัด มีสามสถานที่

  1. AIC- เมื่อเทียบกับ BIC ตามทางเลือกรูปแบบ (ในตอนท้ายของหน้า 300 - จุดเริ่มต้นของ P 301..) ใส่เพียง AIC ควรจะใช้สำหรับการเลือกรูปแบบที่มีไว้สำหรับการคาดการณ์ในขณะที่ BIC ควรจะใช้สำหรับการเลือกรูปแบบการหาคำอธิบาย นอกจากนี้ (ไม่ใช่ในกระดาษด้านบน) เรารู้ว่าภายใต้เงื่อนไขบางอย่าง BIC เลือกรูปแบบที่แท้จริงในชุดของแบบจำลองที่มีตัวเลือก; รูปแบบที่แท้จริงคือสิ่งที่เราแสวงหาในการสร้างแบบจำลองที่อธิบาย (ตอนท้ายของหน้า 293)
  2. Simple arithmetics: AIC จะเลือกแบบจำลองที่มีขนาดใหญ่กว่า BIC สำหรับตัวอย่างที่มีขนาด 8 หรือใหญ่กว่า (ที่น่าพอใจln(n)>2เนื่องจากการปรับความซับซ้อนแตกต่างกันใน AIC กับ BIC)
  3. "true"รูปแบบ (เช่นรุ่นที่มี regressors ที่ถูกต้องและรูปแบบการทำงานที่ถูกต้อง แต่ค่าสัมประสิทธิ์ประมาณไม่สมบูรณ์) อาจจะไม่เป็นแบบที่ดีที่สุดในการทำนาย (หน้า 307.) รูปแบบการถดถอยที่มีการทำนายที่หายไปอาจจะเป็นรูปแบบการคาดการณ์ที่ดีกว่า - การแนะนำของอคติเนื่องจากการคาดการณ์ที่ขาดหายไปอาจมีน้ำหนักเกินโดยการลดลงของความแปรปรวนเนื่องจากความไม่แน่นอนของการประมาณ

คะแนน 1 และ 2 แนะนำว่าแบบจำลองขนาดใหญ่อาจจะดีกว่าสำหรับการทำนายแบบจำลองแบบจำลอง ในขณะเดียวกันประเด็นที่ 3 ให้ตัวอย่างที่ตรงกันข้ามซึ่งแบบจำลองที่ดีกว่าสำหรับการคาดการณ์ดีกว่าแบบจำลองขนาดใหญ่ ฉันพบว่ามันทำให้งง

คำถาม:

  1. ความแตกต่างที่ชัดเจนระหว่างคะแนน {1 ได้อย่างไร และ 2. } และ 3 ถูกอธิบาย / แก้ไข?
  2. ในแง่ของจุดที่ 3 คุณสามารถให้คำอธิบายที่เข้าใจง่ายสำหรับสาเหตุและรูปแบบที่เลือกโดย AIC ที่ดีกว่าสำหรับการคาดการณ์ได้ดีกว่าแบบจำลองที่มีการเลือกโดย BIC หรือไม่

2
ฉันไม่ได้รับความขัดแย้ง / ความขัดแย้ง AIC นั้นมีประสิทธิภาพ (asymptotically ลดข้อผิดพลาดที่คาดการณ์ไว้ให้น้อยที่สุด) และ BIC นั้นสอดคล้องกัน (เลือกลำดับที่แท้จริงของ asymptotically) จุดที่ 3) บอกว่าอคติอาจมีน้ำหนักเกินตามความแปรปรวน เห็นได้ชัดว่าไม่มีการรับประกันว่าจะดีกว่าอีกตัวอย่างในตัวอย่าง ดังนั้น "บุคคลที่ผิดธรรมดา" ของคุณดูเหมือนจะเป็นเช่นนั้นสำหรับตัวอย่างที่กำหนด AIC อาจไม่ดีที่สุดสำหรับการทำนายซึ่งไม่น่าแปลกใจ สำหรับไตรมาสที่ 2 ของคุณ: หากค่าเบี่ยงเบนที่เพิ่มขึ้นเกิดจากโมเดลขนาดเล็กของ BIC นั้นใหญ่กว่าการเพิ่มความแปรปรวนของ AIC ที่ใหญ่กว่า AIC ก็จะดีกว่า
hejseb

2
ฉันขอแนะนำให้คุณดูบทแรกใน "การเลือกแบบจำลองและการหาค่าเฉลี่ยแบบจำลอง" โดย Nils Hjort และ Gerda Claeskens บางทีนั่นอาจจะทำให้สิ่งต่าง ๆ ชัดเจนขึ้น
hejseb

คำตอบ:


1

ไม่ควรนำมาใช้ในบริบทเดียวกัน คะแนน 1 และ 2 มีบริบทแตกต่างกัน สำหรับทั้ง AIC และ BIC ก่อนอื่นให้สำรวจว่าการรวมกันของพารามิเตอร์ที่จำนวนใดให้ดัชนีที่ดีที่สุด (ผู้เขียนบางคนมีโรคลมชักพอดีเมื่อฉันใช้ดัชนีคำในบริบทนี้. เพิกเฉยพวกเขาหรือค้นหาดัชนีในพจนานุกรม) ในจุดที่ 2 AIC คือโมเดลที่สมบูรณ์ยิ่งขึ้นโดยที่ Richer หมายถึงการเลือกรุ่นที่มีพารามิเตอร์มากขึ้นบางครั้งเท่านั้นเพราะรูปแบบ AIC ที่เหมาะสมที่สุดบ่อยครั้งคือ BIC การเลือก นั่นคือถ้า AIC และ BIC เลือกรุ่นที่มีจำนวนพารามิเตอร์เหมือนกันการอ้างสิทธิ์คือ AIC จะดีกว่าสำหรับการทำนายกว่า BIC อย่างไรก็ตามสิ่งที่ตรงกันข้ามอาจเกิดขึ้นได้หาก BIC สูงสุดด้วยรูปแบบพารามิเตอร์ที่เลือกน้อยลง (แต่ไม่รับประกัน) Sober (2002) ได้ข้อสรุปว่า AIC ทำการวัดความแม่นยำในการทำนายในขณะที่ BIC ทำการวัดความดีของความพอดี เมื่ออยู่ข้างนอก บ่อยครั้งที่ AIC ที่ดีที่สุดที่น้อยกว่าที่มีพารามิเตอร์การคาดการณ์ที่อ่อนแอลดลงจะทำนายค่าการคาดการณ์ได้ดีกว่าดัชนี AIC ที่ดีที่สุดจากพารามิเตอร์เพิ่มเติมในรูปแบบที่เลือก ฉันทราบว่าในการผ่าน AIC และ ML ไม่ได้ยกเลิกความจำเป็นในการทดสอบข้อผิดพลาดการคาดการณ์ซึ่งเป็นการทดสอบแยกต่างหากสำหรับแบบจำลอง สิ่งนี้สามารถทำได้โดยการหักล้างค่าสุดขีดจากชุด "การฝึกอบรม" และคำนวณข้อผิดพลาดระหว่างแบบจำลอง "หลังการฝึกอบรม" และข้อมูลที่ถูกระงับ

(x)-Yของเหลือ (คิดว่ามีของเหลือตกค้างที่เป็นลบมากกว่าด้านหนึ่งและอีกด้านที่เหลืออีกบวก) ซึ่งจะช่วยลดข้อผิดพลาดทั้งหมด ดังนั้นในกรณีนี้เราจะถามหาค่า y ที่ดีที่สุดที่ได้รับค่า x และสำหรับ AIC เราจะขอความสัมพันธ์การทำงานที่ดีที่สุดระหว่าง x และ y หนึ่งความแตกต่างระหว่างสิ่งเหล่านี้คือตัวอย่างเช่น BIC ตัวเลือกพารามิเตอร์อื่น ๆ ที่เท่ากันจะมีค่าสัมประสิทธิ์สหสัมพันธ์ที่ดีขึ้นระหว่างแบบจำลองและข้อมูลและ AIC จะมีข้อผิดพลาดการคาดการณ์ที่ดีกว่าวัดเป็นข้อผิดพลาด

จุดที่ 3 เป็นข้อความบางครั้งภายใต้เงื่อนไขบางอย่าง

  • σ


  • β2

  • เมื่อตัวทำนายมีความสัมพันธ์สูง และ

  • เมื่อขนาดตัวอย่างมีขนาดเล็กหรือช่วงของตัวแปรซ้ายออกมีขนาดเล็ก

2222

ฉันอยากจะชี้ให้เห็นว่าข้อความเหล่านี้เป็นแง่ดี โดยทั่วไปแล้วตัวแบบผิดและบ่อยครั้งที่ตัวแบบที่ดีกว่านั้นจะบังคับใช้บรรทัดฐานที่ไม่สามารถใช้กับ AIC หรือ BIC ได้หรือมีการสันนิษฐานว่ามีโครงสร้างตกค้างที่ไม่ถูกต้องสำหรับการใช้งานของพวกเขา ในงานของฉันนี่เป็นกรณีเสมอ


1
ฉันไม่แน่ใจว่าคุณกำลังตอบคำถาม ฉันตระหนักถึงข้อ จำกัด ทั่วไปของเกณฑ์ข้อมูล แต่นั่นไม่ใช่สิ่งที่ฉันถาม นอกจากนี้ผมไม่เข้าใจจุดของคุณถ้า AIC และ BIC มีหมายเลขเดียวกันของพารามิเตอร์แล้วการเรียกร้องที่เป็นที่ AIC จะดีกว่าการทำนาย BIC เมื่อโมเดลทางเลือกมีจำนวนพารามิเตอร์เท่ากันการเปรียบเทียบ AIC และ BIC จะลดลงเพื่อเปรียบเทียบความเป็นไปได้และทั้ง AIC และ BIC จะเลือกทางเลือกเดียวกัน คุณสามารถอธิบายสิ่งที่คุณหมายถึงโดยแบบจำลองที่ดีขึ้นได้หรือไม่ที่จะบังคับใช้บรรทัดฐานที่ไม่สามารถใช้กับ AIC หรือ BIC ได้ ?
Richard Hardy

ดำเนินการต่อ: ตราบใดที่เรามีโอกาสและระดับความเป็นอิสระเราสามารถคำนวณ AIC และ BIC
Richard Hardy

@RichardHardy จริง: ตราบใดที่เรามีโอกาสและองศาอิสระเราสามารถคำนวณ AIC และ BIC อย่างไรก็ตามการคำนวณจะเหมาะสมที่สุดและสร้างความเข้าใจผิดหากส่วนที่เหลือเป็น Student's-T และเราไม่ได้ใช้ AIC และ BIC สำหรับ Student's-T ซึ่งแตกต่างจาก Student-T มีการแจกแจงของส่วนที่เหลือซึ่ง ML อาจไม่ถูกเผยแพร่เช่น Gamma, Beta เป็นต้น
Carl

ขอบคุณสำหรับการชี้แจง! ฉันเชื่อว่าควรมีคำตอบสำหรับคำถามข้างต้นที่ค่อนข้างง่ายและทั่วไป โดยเฉพาะอย่างยิ่งฉันไม่คิดว่าจะต้องเกี่ยวข้องกับคดี "น่าเกลียด" และความล้มเหลวของ AIC และ BIC ในทางตรงกันข้ามฉันรู้สึกว่าควรมีกรณีพื้นฐานที่สามารถอธิบายได้ว่าทำไมบุคคลที่ผิดธรรมดาเป็นเพียงชัดเจนมากกว่าของจริง ในขณะเดียวกันย่อหน้าที่สองของคุณดูเหมือนจะไปในทิศทางตรงกันข้าม ไม่ใช่ว่ามันจะไม่มีค่าในตัวเอง แต่ฉันเกรงว่ามันอาจเบี่ยงเบนความสนใจของเราจากคำถามพื้นฐานจริงที่นี่
Richard Hardy

@RichardHardy บ่อยครั้งที่คำถามที่ปฏิบัติได้ยากสำหรับ AIC ตัวอย่างเช่นการเปรียบเทียบแบบจำลองเดียวกันหรือต่างกันที่มีบรรทัดฐานที่แตกต่างกันและ / หรือการแปลงข้อมูลหรือการวิเคราะห์บรรทัดฐานที่ซับซ้อนเช่นการลดข้อผิดพลาด Tikhonov normalization ของพารามิเตอร์ที่ได้รับ, ผกผันทั่วไปเป็นต้น BIC ไม่ถูกต้อง
Carl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.