ทำไมการกำจัดย้อนหลังจึงมีเหตุผลเมื่อทำการถดถอยหลายครั้ง?


9

มันไม่ได้ส่งผลให้กระชับหรือไม่? ผลลัพธ์ของฉันจะเชื่อถือได้มากขึ้นหรือไม่ถ้าฉันเพิ่มขั้นตอนแจ็คมีดหรือ bootstrap เป็นส่วนหนึ่งของการวิเคราะห์


8
ใครบอกว่ามันเป็นธรรม? แน่นอนมันควรนำไปสู่การ overfitting
gung - Reinstate Monica

2
จะชี้ให้เห็นจริงในหนังสือหลายเล่ม (ยัง?) เช่นamazon.com/Statistics-Explained-Introductory-Guide-Scientists/... ฉันได้คิดเรื่องเดียวกันตัวเอง ฉันคิดว่าฉันมีหนังสือสถิติอย่างน้อย 3-4 เล่มที่ไม่ได้หารือเกี่ยวกับปัญหา overfitting เลยเมื่อมีการถดถอยหลายครั้ง
mmh

5
โดยสุจริตหากหนังสือสถิติเบื้องต้นไม่ได้พูดถึงเรื่องการทดสอบเกินกำลังและทดสอบฉันจะอ่านหนังสือเล่มอื่น
Matthew Drury

3
การกำจัดแบบย้อนหลัง (และการเลือกไปข้างหน้า) ยังคงมีความเหมาะสมมากกว่าหากใช้การตรวจสอบความถูกต้องแบบข้ามครั้งเดียว (เช่น PRESS) เป็นเกณฑ์ในการเลือกคุณลักษณะ
Dikran Marsupial

5
@ mmh ไม่ได้เป็นการเกริ่นนำ แต่ฉันขอแนะนำให้อ่านบทที่ 4 ของกลยุทธ์การสร้างแบบจำลองการถดถอยของ Frank Harrell (ไม่ใช่แค่บทที่ 4 ที่ควรค่าแก่การอ่าน
Glen_b

คำตอบ:


2

ฉันคิดว่าการสร้างแบบจำลองและทดสอบมันแตกต่างกัน การกำจัดถอยหลังเป็นส่วนหนึ่งของการสร้างแบบจำลอง มีดแจ็คและ bootstrap ใช้ในการทดสอบมากขึ้น

แน่นอนคุณสามารถประมาณการที่เชื่อถือได้มากขึ้นด้วย bootstrap และ jack knife มากกว่าการทดสอบแบบเรียบง่ายแบบย้อนหลัง แต่ถ้าคุณต้องการทดสอบการ overfitting จริง ๆ การทดสอบขั้นสุดท้ายคือการแยกตัวอย่างฝึกในบางการทดสอบกับผู้อื่น การลาออกครั้งเดียวไม่เสถียร / ไม่น่าเชื่อถือสำหรับจุดประสงค์นี้: http://www.russpoldrack.org/2012/12/12/the-perils-of-leave-one-out.html

ฉันคิดว่าอย่างน้อย 10% ของอาสาสมัครจะต้องออกไปเพื่อให้การประเมินความมีเสถียรภาพของโมเดลมีความเสถียร และถ้าคุณมี 20 วิชา 2 วิชาก็ยังน้อยมาก แต่คำถามก็กลายเป็นว่าคุณมีตัวอย่างมากพอที่จะสร้างแบบจำลองที่สามารถนำไปใช้กับประชากรส่วนที่เหลือได้หรือไม่

หวังว่ามันจะตอบคำถามของคุณอย่างน้อยก็บางส่วน


ดังนั้นหนึ่งสามารถใช้การตรวจสอบข้ามกับ k<n (หรือ k<<n)?
mmh

บทนำเกี่ยวกับการเรียนรู้เชิงสถิติกล่าวถึงวิธีการที่แตกต่างกันในการสุ่มตัวอย่างใหม่ (ชุดการตรวจสอบการตรวจสอบข้ามกับจำนวนกลุ่มที่แตกต่างกัน bootstrapping) ในบทที่ 5 และการเลือกรูปแบบในบทที่ 6
EdM
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.