วิธีการตรวจสอบเมื่อแบบจำลองการถดถอยมีความเหมาะสมมากเกินไป?


14

เมื่อคุณเป็นคนหนึ่งในการทำงานตระหนักถึงสิ่งที่คุณกำลังทำอยู่คุณพัฒนาความรู้สึกเมื่อคุณมีแบบจำลองที่พอดี สิ่งหนึ่งที่คุณสามารถติดตามแนวโน้มหรือการเสื่อมสภาพได้ใน Adjusted R Square ของโมเดล คุณสามารถติดตามการเสื่อมสภาพที่คล้ายกันในค่า p ของสัมประสิทธิ์การถดถอยของตัวแปรหลัก

แต่เมื่อคุณเพิ่งอ่านคนอื่นศึกษาและคุณไม่มีความเข้าใจในกระบวนการพัฒนาแบบจำลองภายในของพวกเขาเองคุณจะสามารถตรวจพบอย่างชัดเจนว่าแบบจำลองนั้นเหมาะสมหรือไม่อย่างไร


เพียงเพื่อแสดงความคิดเห็นสองสามข้อในหัวข้อหากการศึกษาเปิดเผยสถิติการถดถอยมาตรฐานคุณสามารถมุ่งเน้นไปที่สถิติ t และค่า p ของสัมประสิทธิ์ ถ้า RSquare ของโมเดลสูง แต่มีตัวแปรอย่างน้อยหนึ่งตัวที่สถิติ <2.0; นี่อาจเป็นธงสีแดง นอกจากนี้หากเครื่องหมายของสัมประสิทธิ์ของตัวแปรบางตัวขัดแย้งกับลอจิกที่อาจเป็นธงสีแดงอีกอัน หากการศึกษาไม่ได้เปิดเผยช่วงเวลาที่ระงับไว้สำหรับโมเดลนั่นอาจเป็นอีกธงสีแดง หวังว่าคุณจะมีความคิดอื่น ๆ และดีกว่า
Sympa

วิธีหนึ่งคือดูว่าแบบจำลองทำงานกับข้อมูลอื่น ๆ (แต่คล้ายกัน) อย่างไร
เชน

คำตอบ:


15

การตรวจสอบข้ามและการทำให้เป็นมาตรฐานเป็นเทคนิคทั่วไปที่ใช้กันทั่วไปเพื่อป้องกันการ overfitting เพื่อความรวดเร็วฉันขอแนะนำสไลด์การสอนของ Andrew Moore เกี่ยวกับการใช้cross-validation ( mirror ) - ให้ความสนใจเป็นพิเศษกับ caveats อ่านรายละเอียดเพิ่มเติมได้ที่บทที่ 3 และ 7 ของEOSLซึ่งครอบคลุมหัวข้อและเนื้อหาที่เกี่ยวข้องในเชิงลึก


2
ว้าวขอบคุณการสอนของ Andrew Moore เกี่ยวกับการตรวจสอบข้ามเป็นระดับโลก
Sympa

7

เมื่อฉันติดตั้งแบบจำลองด้วยตัวเองฉันมักใช้เกณฑ์ข้อมูลในระหว่างขั้นตอนการติดตั้งเช่นAICหรือBICหรือการทดสอบอัตราส่วนความน่าจะเป็นสำหรับรูปแบบที่เหมาะสมโดยขึ้นอยู่กับความน่าจะเป็นสูงสุดหรือการทดสอบแบบ Fสำหรับรุ่นที่เหมาะสม

ทั้งหมดมีแนวคิดที่คล้ายคลึงกันในการที่พวกเขาลงโทษพารามิเตอร์เพิ่มเติม พวกเขาตั้งค่าขีด จำกัด ของ "กำลังอธิบายเพิ่มเติม" สำหรับพารามิเตอร์ใหม่แต่ละตัวที่เพิ่มเข้ากับโมเดล พวกเขาทั้งหมดเป็นรูปแบบของการทำให้เป็นมาตรฐาน

สำหรับโมเดลของผู้อื่นฉันดูที่ส่วนวิธีการเพื่อดูว่ามีการใช้เทคนิคดังกล่าวหรือไม่และใช้กฎของหัวแม่มือเช่นจำนวนการสังเกตต่อพารามิเตอร์ - ถ้ามีการสังเกตประมาณ 5 (หรือน้อยกว่า) ต่อพารามิเตอร์ที่ฉันเริ่มสงสัย

โปรดจำไว้เสมอว่าตัวแปรไม่จำเป็นต้องมี "นัยสำคัญ" ในแบบจำลองที่มีความสำคัญ ฉันอาจจะเป็นสับสนและควรรวมไว้ในนั้นหากเป้าหมายของคุณคือการประเมินผลกระทบของตัวแปรอื่น ๆ


ขอบคุณสำหรับลิงก์ไปยังการทดสอบ AIC และ BIC พวกเขาเพิ่มมูลค่ามากขึ้นหรือไม่เมื่อปรับ R Square ซึ่งทำสิ่งที่คล้ายกันโดยการลงโทษแบบจำลองสำหรับการเพิ่มตัวแปรหรือไม่?
Sympa

1
@Gaeten, R-squared ที่ปรับแล้วจะเพิ่มขึ้นเมื่อการทดสอบ F ของการทดสอบก่อนหน้าและหลังมีความสำคัญดังนั้นพวกมันจึงเทียบเท่ากันยกเว้นการคำนวณปกติที่ปรับ R-squared จะไม่ส่งคืนค่า p
Thylacoleo

1
@Gaeten - AIC & BIC นั้นกว้างกว่าการทดสอบ F และปรับ R-squared ซึ่งโดยปกติจะ จำกัด อยู่ที่รุ่นที่พอดีโดยกำลังสองน้อยที่สุด AIC & BIC สามารถนำไปใช้กับรูปแบบใดก็ได้ที่สามารถคำนวณความน่าจะเป็นได้และสามารถรู้ระดับความเป็นอิสระได้ (หรือโดยประมาณ)
Thylacoleo

การทดสอบชุดของตัวแปรไม่ใช่รูปแบบของการทำให้เป็นปกติ (การหดตัว) และการทดสอบให้สิ่งล่อใจในการลบตัวแปรซึ่งไม่มีส่วนเกี่ยวข้องกับการลดการ overfitting
Frank Harrell

@FrankHarrell คุณช่วยอธิบายความคิดเห็นเก่า ๆ ของคุณได้ไหม? ดูเหมือนว่าสำหรับฉันแล้วการลบตัวแปรจะช่วยลดการ overfitting สิ่งอื่น ๆ ทั้งหมดจะเท่าเทียมกันเนื่องจากระดับความอิสระที่มีให้ overfit ลดลง ฉันแน่ใจว่าฉันพลาดอะไรบางอย่างที่นี่
Lepidopterist

5

ฉันขอแนะนำว่านี่เป็นปัญหากับวิธีรายงานผลลัพธ์ ที่จะไม่ "เอาชนะ the Bayesian drum" แต่การเข้าใกล้ความไม่แน่นอนของแบบจำลองจากมุมมองของ Bayesian ว่าเป็นปัญหาการอนุมานจะช่วยได้อย่างมากที่นี่ และก็ไม่จำเป็นต้องมีการเปลี่ยนแปลงครั้งใหญ่เช่นกัน หากรายงานนั้นมีความน่าจะเป็นที่แบบจำลองนี้จะเป็นประโยชน์อย่างมาก นี่เป็นปริมาณที่ง่ายต่อการประมาณโดยใช้ BIC โทร BIC สำหรับรุ่นเดือนเมตร จากนั้นความน่าจะเป็นที่โมเดล mth เป็นแบบ "ของจริง" เนื่องจากMโมเดลนั้นเหมาะสม (และหนึ่งในโมเดลนั้นเป็นจริง) ให้โดย:BICmM

=1

P(model m is true|one of the M models is true)wmexp(12BICm)j=1Mwjexp(12BICj)
=11+jmMwjwmexp(12(BICjBICm))

wjwj=1

BICfinal<BICjpd

M1+p+(p1)++(pd+1)=1+p(p1)(pd)(pd1)2

M1+p+(p1)++(d+1)=1+p(p1)d(d1)2

MBICjλBICm=BICjλ

11+(M1)exp(λ2)

λMM

11+p(p1)d(d1)2exp(λ2)

p=50d=20λP0

λ>2log(2(1P0)P0[p(p1)d(d1)])

Setting P0=0.9 we get λ>18.28 - so BIC of the winning model has to win by a lot for the model to be certain.


+1, this is really clever. Is this published somewhere? Is there an 'official' reference for this?
gung - Reinstate Monica

@gung - why thank you. Unfortunately, this was a "back of the envelope" answer. I'm sure there's problems with it, if you were to investigate in more detail.
probabilityislogic
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.