การตรวจสอบความถูกต้องไขว้ 10 เท่าเทียบกับการตรวจสอบความถูกต้องข้ามแบบครั้งเดียว


25

ฉันกำลังทำการตรวจสอบข้ามแบบซ้อนกัน ฉันได้อ่านแล้วว่าการตรวจสอบไขว้แบบลาออกหนึ่งครั้งสามารถมีอคติได้ (จำไม่ได้ว่าทำไม)

จะเป็นการดีกว่าหรือไม่ที่จะใช้การตรวจสอบความถูกต้องไขว้ 10 เท่าหรือการตรวจสอบความถูกต้องแบบ cross-one-out นอกเหนือจากการรันไทม์ที่นานขึ้นสำหรับการตรวจสอบความถูกต้องแบบ cross-one-out?


1
คุณจำที่คุณอ่านได้หรือไม่
Richard Hardy

5
คุณเคยเห็นโพสต์นี้เกี่ยวกับอคติหรือไม่? นอกจากนี้คำตอบนี้มีคำพูดจากหนังสือที่ดีมากที่แนะนำการตรวจสอบข้าม 5 เท่าหรือ 10 เท่า
Eric Farng

1
โพสต์นี้มีความเกี่ยวข้องเล็กน้อย
Richard Hardy

1
ขอขอบคุณ. ดังนั้นทั้งหมดสามารถกล่าวได้ว่าฉันควรใช้ CV แบบ 10 เท่าแทน CV แบบครั้งเดียว สิ่งนี้มีไว้สำหรับชุดข้อมูลขนาดเล็กหรือไม่
เครื่องจักร

1
@ โทมัสเมื่อชุดข้อมูลของคุณมีขนาดเล็กเกินไปคุณก็เกือบทำ LOO-CV แล้วดังนั้นข้อดีของ CV แบบ 10 เท่าจะลดลงเมื่อขนาดชุดข้อมูลของคุณลดลง
cdeterman

คำตอบ:


27

เพียงเพิ่มเล็กน้อยเพื่อคำตอบของ @SubravetiSuraj (+1)

การตรวจสอบความถูกต้องไขว้ทำให้การประเมินประสิทธิภาพแบบลำเอียงในแง่ร้ายเพราะแบบจำลองทางสถิติส่วนใหญ่จะปรับปรุงให้ดีขึ้นถ้าชุดการฝึกอบรมมีขนาดใหญ่ขึ้น ซึ่งหมายความว่าการตรวจสอบความถูกต้องไขว้กันของ k-fold จะประเมินประสิทธิภาพของโมเดลที่ได้รับการฝึกอบรมบนชุดข้อมูล 100 * (k-1) / k% ของข้อมูลที่มีอยู่แทนที่จะเป็น 100% ดังนั้นหากคุณทำการตรวจสอบความถูกต้องของข้อมูลเพื่อประเมินประสิทธิภาพแล้วใช้แบบจำลองที่ผ่านการฝึกอบรมเกี่ยวกับข้อมูลทั้งหมดสำหรับการใช้งานในทางปฏิบัติมันจะทำงานได้ดีกว่าที่คาดการณ์ไว้เพียงเล็กน้อย

การตรวจสอบความถูกต้องแบบไม่ต้องรอคอยแบบลาทิ้งนั้นมีความเป็นกลางเนื่องจากความแตกต่างของขนาดระหว่างชุดการฝึกอบรมที่ใช้ในแต่ละครั้งและชุดข้อมูลทั้งหมดเป็นเพียงรูปแบบเดียว มีบทความเกี่ยวกับเรื่องนี้โดย Luntz และ Brailovsky (ภาษารัสเซีย)

Luntz, Aleksandr และ Viktor Brailovsky "การประมาณค่าตัวอักษรที่ได้รับในขั้นตอนการรับรู้ทางสถิติ" Technicheskaya Kibernetica 3.6 (1969): 6-12

ดูสิ่งนี้ด้วย

การประมาณอัตราความผิดพลาดในการวิเคราะห์จำแนกโดย Peter A. Lachenbruch และ M. Ray Mickey Technometrics Vol. 10 ปัญหา 1,1968

อย่างไรก็ตามในขณะที่การตรวจสอบความถูกต้องแบบไม่ต้องลาออกจากการออกหนึ่งครั้งจะมีความเอนเอียงโดยประมาณ แต่ก็มีความแปรปรวนสูง (ดังนั้นคุณจะได้รับการประเมินที่แตกต่างกันมาก เนื่องจากข้อผิดพลาดของตัวประมาณนั้นเป็นการรวมกันของความเอนเอียงและความแปรปรวนไม่ว่าการตรวจสอบความถูกต้องแบบข้ามครั้งเดียวจะดีกว่าการตรวจสอบความถูกต้องแบบ 10 เท่าขึ้นอยู่กับปริมาณทั้งสอง

ตอนนี้ความแปรปรวนในการปรับตัวแบบมีแนวโน้มที่จะสูงขึ้นถ้ามันถูกติดตั้งกับชุดข้อมูลขนาดเล็ก (เนื่องจากมีความไวต่อสิ่งรบกวนทางเสียง / การสุ่มตัวอย่างในตัวอย่างการฝึกอบรมที่ใช้) ซึ่งหมายความว่าการตรวจสอบความถูกต้องไขว้ 10 เท่ามีแนวโน้มที่จะมีความแปรปรวนสูง (เช่นเดียวกับความลำเอียงที่สูงขึ้น) หากคุณมีข้อมูลจำนวน จำกัด เท่านั้นเนื่องจากขนาดของชุดการฝึกอบรมจะมีขนาดเล็กกว่า LOOCV การตรวจสอบความถูกต้องข้ามของ k-fold สามารถมีปัญหาความแปรปรวนได้เช่นกัน แต่ด้วยเหตุผลอื่น นี่คือเหตุผลที่ LOOCV มักจะดีกว่าเมื่อขนาดของชุดข้อมูลมีขนาดเล็ก

อย่างไรก็ตามเหตุผลหลักสำหรับการใช้ LOOCV ในความคิดของฉันคือมันไม่แพงสำหรับบางรุ่น (เช่นการถดถอยเชิงเส้นวิธีเคอร์เนลส่วนใหญ่ลักษณนามเพื่อนบ้าน - เพื่อนบ้านที่ใกล้ที่สุด ฯลฯ ) และถ้าชุดข้อมูลมีขนาดเล็กมากฉันจะใช้ การตรวจสอบความถูกต้องข้าม 10 เท่าหากเหมาะสมกับงบประมาณการคำนวณของฉันหรือยังดีกว่าการประมาณค่า bootstrap และการบรรจุถุง


2
+1 สำหรับการอ้างอิงรัสเซียที่คลุมเครือ 2512! คุณมีการอ้างอิงที่ดีสำหรับ LOOCV ที่มีความแปรปรวนสูงหรือไม่? นี่คือที่ระบุไว้ใน Hastie et al แต่ฉันไม่แน่ใจว่าฉันเชื่อมั่น 100% โดยการโต้แย้งและฉันไม่ได้เห็นการสาธิตเชิงประจักษ์ (แบบจำลอง)
อะมีบาพูดว่า Reinstate Monica

3
ใช่ฉันไม่คิดว่าฉันเห็นด้วยกับมันแม้ว่าจะถือว่าโมเดลนั้นมีความเสถียรภายใต้การก่อกวนที่เกิดจากการลบตัวอย่างทดสอบซึ่งมีแนวโน้มว่าจะเป็นจริงถ้าคุณมีชุดข้อมูลที่มีขนาดใหญ่มาก (นั่นคือ asymptotically true เท่านั้น แต่ถ้าคุณมีข้อมูลจำนวนมากเกือบทุกโครงร่างการประเมินประสิทธิภาพที่เหมาะสมจะให้ผลลัพธ์ที่เหมือนกัน)
Dikran Marsupial

2
+1 (ทั้งโพสต์และความคิดเห็นล่าสุด - กระดาษที่ยอดเยี่ยม แต่ไม่ควรมองข้าม (เหมือนกระดาษอื่น ๆ ))
usεr11852พูดว่า Reinstate Monic

2
@Dikran หัวข้อนี้ (จาก LOOCV ที่มีความแปรปรวนมากที่สุด) เกิดขึ้นอีกครั้งในคำถามที่แยกต่างหากและน่าสนใจทีเดียว: stats.stackexchange.com/questions/280665คุณอาจต้องการดู
อะมีบาพูดว่า Reinstate Monica

2
k

20

ในความคิดของฉันออกจากการตรวจสอบข้ามหนึ่งจะดีกว่าเมื่อคุณมีชุดข้อมูลการฝึกอบรมขนาดเล็ก ในกรณีนี้คุณไม่สามารถสร้าง 10 เท่าเพื่อคาดการณ์เกี่ยวกับการใช้ข้อมูลที่เหลือในการฝึกอบรมโมเดลได้

หากคุณมีข้อมูลการฝึกอบรมจำนวนมากในทางกลับกันการตรวจสอบความถูกต้องไขว้ 10 เท่าจะเป็นการเดิมพันที่ดีกว่าเนื่องจากจะมีการทำซ้ำหลายครั้งมากเกินไปที่จะทำการตรวจสอบข้ามครั้งเดียวและพิจารณาผลลัพธ์มากมายเพื่อปรับพารามิเตอร์ของคุณ ไม่ใช่ความคิดที่ดี

ตาม ISL มีการแลกเปลี่ยนความแปรปรวนอคติระหว่างทำการออกจากหนึ่งไปสู่การตรวจสอบ k fold cross ใน LOOCV (ปล่อยให้ CV หนึ่งครั้ง) คุณได้รับการประเมินข้อผิดพลาดการทดสอบที่มีอคติต่ำกว่าและความแปรปรวนที่สูงขึ้นเนื่องจากชุดการฝึกอบรมแต่ละชุดมีตัวอย่าง n-1 ซึ่งหมายความว่าคุณกำลังใช้ชุดการฝึกอบรมเกือบทั้งหมดในแต่ละรอบ สิ่งนี้นำไปสู่ความแปรปรวนที่สูงขึ้นเช่นกันเนื่องจากมีการทับซ้อนกันมากระหว่างชุดการฝึกอบรมและทำให้การประเมินข้อผิดพลาดการทดสอบมีความสัมพันธ์สูงซึ่งหมายความว่าค่าเฉลี่ยของการประเมินข้อผิดพลาดการทดสอบจะมีความแปรปรวนสูงขึ้น

ตรงกันข้ามเป็นจริงกับ k-fold CV เนื่องจากมีการเหลื่อมซ้อนกันค่อนข้างน้อยระหว่างชุดการฝึกดังนั้นการประเมินข้อผิดพลาดการทดสอบจึงมีความสัมพันธ์น้อยกว่าเนื่องจากผลลัพธ์ที่ค่าความผิดพลาดการทดสอบเฉลี่ยจะไม่แปรปรวนเท่า LOOCV

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.