TL, DR:ดูเหมือนว่าตรงกันข้ามกับคำแนะนำซ้ำ ๆ การตรวจสอบความถูกต้องแบบข้ามครั้งเดียว (LOO-CV) - นั่นคือ -fold CV กับ (จำนวนเท่า) เท่ากับ (จำนวนเท่า)ของการสังเกตการฝึกอบรม) - ให้ค่าประมาณของข้อผิดพลาดในการวางนัยทั่วไปซึ่งเป็นตัวแปรที่น้อยที่สุดสำหรับใด ๆไม่ใช่ตัวแปรมากที่สุดโดยสมมติว่ามีความมั่นคงในรูปแบบ / อัลกอริทึมชุดข้อมูลหรือทั้งสองอย่าง ถูกต้องเนื่องจากฉันไม่เข้าใจเงื่อนไขความมั่นคงนี้จริงๆ)
- บางคนสามารถอธิบายได้อย่างชัดเจนว่าเงื่อนไขความมั่นคงนี้คืออะไร?
- มันเป็นความจริงหรือไม่ที่การถดถอยเชิงเส้นเป็นหนึ่งในอัลกอริทึม "เสถียร" ซึ่งหมายความว่าในบริบทนั้น LOO-CV เป็นทางเลือกที่ดีที่สุดของ CV อย่างเคร่งครัดเท่าที่ความลำเอียงและความแปรปรวนของความคลาดเคลื่อนของการประมาณ
ภูมิปัญญาดั้งเดิมคือทางเลือกของใน -fold CV ตามการแลกเปลี่ยนความแปรปรวนแบบอคติเช่นค่าที่ต่ำกว่าของ (ใกล้ถึง 2) นำไปสู่การประมาณการข้อผิดพลาดของการวางนัยทั่วไปที่มีอคติในแง่ร้ายมากขึ้น ของ (ใกล้ ) นำไปสู่การประมาณการที่มีอคติน้อยกว่า แต่มีความแปรปรวนมากขึ้น คำอธิบายทั่วไปสำหรับปรากฏการณ์ของความแปรปรวนที่เพิ่มขึ้นด้วยอาจได้รับความเด่นชัดที่สุดในองค์ประกอบของการเรียนรู้ทางสถิติ (หัวข้อ 7.10.1):
ด้วย K = N ตัวประมาณค่าการตรวจสอบความถูกต้องไขว้กันนั้นมีความเป็นกลางโดยประมาณสำหรับข้อผิดพลาดการคาดการณ์ที่แท้จริง (คาดว่า) แต่อาจมีความแปรปรวนสูงเนื่องจาก N "ชุดการฝึกอบรม" มีความคล้ายคลึงกัน
ความหมายที่เป็นไปได้ว่าข้อผิดพลาดในการตรวจสอบความถูกต้องมีความสัมพันธ์สูงมากขึ้นเพื่อให้ผลรวมของพวกเขาเป็นตัวแปรมากขึ้น สายของเหตุผลนี้ได้รับการทำซ้ำในหลายคำตอบในเว็บไซต์นี้ (เช่นที่นี่ , ที่นี่ , ที่นี่ , ที่นี่ , ที่นี่ , ที่นี่และที่นี่ ) เช่นเดียวกับบล็อกต่างๆและอื่น ๆ แต่การวิเคราะห์รายละเอียดแทบจะไม่เคยได้รับแทน เป็นเพียงแค่สัญชาติญาณหรือร่างสั้น ๆ ของการวิเคราะห์ที่อาจมีลักษณะ
อย่างไรก็ตามเราสามารถค้นหาข้อความที่ขัดแย้งกันโดยปกติแล้วจะอ้างถึงเงื่อนไข "เสถียรภาพ" บางอย่างที่ฉันไม่เข้าใจจริงๆ ตัวอย่างเช่นคำตอบที่ขัดแย้งกันนี้เสนอราคาสองย่อหน้าจากบทความปี 2558 ซึ่งกล่าวว่า "สำหรับรุ่น / ขั้นตอนการสร้างแบบจำลองที่มีความไม่มั่นคงต่ำ LOO มักมีความแปรปรวนน้อยที่สุด" (เน้นการเพิ่ม) บทความนี้ (ส่วนที่ 5.2) ดูเหมือนจะยอมรับว่า LOO เป็นตัวเลือกตัวแปรที่น้อยที่สุดของตราบใดที่โมเดล / อัลกอริทึมนั้น "เสถียร" ใช้จุดยืนอีกประเด็นหนึ่งในเรื่องนี้นอกจากนี้ยังมีรายงานฉบับนี้ (ข้อ 2) ซึ่งกล่าวว่า "ความแปรปรวนของการตรวจสอบความถูกต้องด้วยการพับแบบพับ [... ] ไม่ได้ขึ้นอยู่กับ, "อ้างถึงเงื่อนไข" เสถียรภาพ "อีกครั้ง
คำอธิบายเกี่ยวกับสาเหตุที่ LOO อาจเป็นตัวแปร -fold CV ส่วนใหญ่นั้นใช้งานง่าย แต่มีการตอบโต้ การประมาณการ CV สุดท้ายของข้อผิดพลาดกำลังสองเฉลี่ย (MSE) คือค่าเฉลี่ยของการประมาณค่า MSE ในแต่ละครั้ง ดังนั้นเมื่อเพิ่มขึ้นเป็นประมาณการ CV คือค่าเฉลี่ยของตัวแปรสุ่มที่เพิ่มขึ้น และเรารู้ว่าความแปรปรวนของค่าเฉลี่ยลดลงด้วยจำนวนตัวแปรที่เฉลี่ย ดังนั้นเพื่อให้ LOO เป็นตัวแปร -fold CV มากที่สุดมันจะต้องเป็นจริงที่การเพิ่มขึ้นของความแปรปรวนเนื่องจากความสัมพันธ์ที่เพิ่มขึ้นในหมู่การประเมินของ MSE เมื่อเทียบกับการลดลงของความแปรปรวนเนื่องจากจำนวนของการพับมากกว่าโดยเฉลี่ย. และไม่ชัดเจนเลยว่านี่เป็นเรื่องจริง
หลังจากคิดสับสนเกี่ยวกับสิ่งเหล่านี้อย่างถี่ถ้วนฉันจึงตัดสินใจจำลองสถานการณ์เล็กน้อยสำหรับกรณีการถดถอยเชิงเส้น ฉันจำลอง 10,000 ชุดข้อมูลที่มี = 50 และ 3 ตัวทำนาย uncorrelated แต่ละครั้งประมาณข้อผิดพลาดทั่วไปโดยใช้Kเท่า CV กับK = 2, 5, 10, หรือ 50 = N รหัส R อยู่ที่นี่ นี่คือค่าเฉลี่ยและผลต่างของการประมาณการ CV ในชุดข้อมูลทั้งหมด 10,000 ชุด (ในหน่วย MSE):
k = 2 k = 5 k = 10 k = n = 50
mean 1.187 1.108 1.094 1.087
variance 0.094 0.058 0.053 0.051
ผลลัพธ์เหล่านี้แสดงรูปแบบที่คาดหวังว่าค่าที่สูงกว่าของจะนำไปสู่การมองโลกในแง่ร้ายน้อยกว่า แต่ก็ดูเหมือนจะยืนยันว่าความแปรปรวนของการประมาณ CV นั้นต่ำที่สุดไม่ใช่สูงที่สุดในกรณี LOO
ดังนั้นจึงปรากฏว่าการถดถอยเชิงเส้นเป็นหนึ่งในกรณี "เสถียร" ที่กล่าวถึงในเอกสารข้างต้นซึ่งการเพิ่มเกี่ยวข้องกับการลดลงมากกว่าการเพิ่มความแปรปรวนในการประมาณการ CV แต่สิ่งที่ฉันยังไม่เข้าใจคือ:
- เงื่อนไข "เสถียรภาพ" นี้คืออะไร? มันใช้กับโมเดล / อัลกอริทึมชุดข้อมูลหรือทั้งสองอย่างบ้างไหม?
- มีวิธีที่ใช้งานง่ายที่จะคิดเกี่ยวกับความมั่นคงนี้หรือไม่?
- ตัวอย่างอื่น ๆ ของโมเดลอัลกอริทึมหรือชุดข้อมูลหรือชุดข้อมูลที่เสถียรและไม่เสถียรมีอะไรบ้าง
- มันค่อนข้างปลอดภัยหรือไม่ที่จะสมมติว่าตัวแบบ / อัลกอริธึมหรือชุดข้อมูลส่วนใหญ่เป็น "เสถียร" ดังนั้นจึงควรเลือกโดยทั่วไปให้สูงที่สุดเท่าที่จะทำได้