ความแปรปรวนสูงของการตรวจสอบความถูกต้องแบบลาข้ามครั้งเดียว


15

ฉันอ่านซ้ำแล้วซ้ำอีกว่าการตรวจสอบความถูกต้องแบบ "ปล่อยให้ออกมาหนึ่งครั้ง" นั้นมีความแปรปรวนสูงเนื่องจากการทับซ้อนขนาดใหญ่ของการฝึกอบรม อย่างไรก็ตามฉันไม่เข้าใจว่าทำไมจึงเป็นเช่นนั้น: ประสิทธิภาพการตรวจสอบข้ามไม่ควรมีเสถียรภาพมาก (ความแปรปรวนต่ำ) เพราะชุดการฝึกอบรมเกือบเหมือนกันหรือไม่ หรือฉันมีความเข้าใจผิดเกี่ยวกับแนวคิดเรื่อง "ความแปรปรวน" โดยสิ้นเชิง?

ฉันยังไม่เข้าใจอย่างชัดเจนว่า LOO สามารถเป็นกลางได้อย่างไร แต่มีความแปรปรวนสูง หากการประมาณค่า LOO เท่ากับค่าตัวประมาณที่แท้จริงในความคาดหมาย - จะมีความแปรปรวนสูงได้อย่างไร

หมายเหตุ: ฉันรู้ว่ามีคำถามที่คล้ายกันที่นี่: เหตุใดความแปรปรวนการตรวจสอบความถูกต้องแบบข้ามครั้งต่อวัน (LOOCV) เกี่ยวกับการประมาณค่าเฉลี่ยสำหรับข้อผิดพลาดสูง อย่างไรก็ตามคนที่ตอบว่าต่อมาในความเห็นว่าแม้ upvotes เขาได้ตระหนักว่าคำตอบของเขาผิด


2
ฉันเป็นคนนั้น :-) แต่โปรดทราบว่าก่อนอื่นฉันได้อัปเดตคำตอบของฉันแล้วเพื่อลบความสับสนและที่สองเธรดทั้งหมดนั้นถูกปิดซ้ำกับเธรดอื่น: stats.stackexchange.com/ คำถาม คุณมองไปที่นั่นไหม คำถามของคุณดูเหมือนว่าฉันจะซ้ำซ้อนกับคำถามนั้นเช่นกัน หากคุณไม่พึงพอใจกับคำตอบที่ให้ลองพิจารณากำหนดคำถามของคุณให้ละเอียดยิ่งขึ้น ตอนนี้ฉันจะลงคะแนนให้ปิด แต่อย่าลังเลที่จะแก้ไขคำถามของคุณ
อะมีบาพูดว่า Reinstate Monica


3
ดีว่าเป็นเรื่องง่าย: ให้มูลค่าที่แท้จริงของพารามิเตอร์เป็น0.5ตัวประมาณที่ให้ค่า0.49 , 0.51 , 0.490.5นั้นไม่เอนเอียงและมีความแปรปรวนค่อนข้างต่ำ แต่ตัวประมาณที่ให้ค่า 0.1 , 0.9 , 0.1 , 0.9 ...นั้นก็ไม่เอนเอียง แต่มีความแปรปรวนสูงกว่ามาก 0.49,0.51,0.49,0.51...0.1,0.9,0.1,0.9...
อะมีบาพูดว่า Reinstate Monica

5
เกี่ยวกับวรรคแรกของคุณ: คุณต้องคิดเกี่ยวกับความแปรปรวนข้ามความเข้าใจที่แตกต่างกันของชุดข้อมูลทั้งหมด สำหรับชุดข้อมูลที่กำหนด LOOCV จะสร้างแบบจำลองที่คล้ายกันมากสำหรับแต่ละชุดย่อยเนื่องจากชุดการฝึกอบรมกำลังตัดกันอย่างมาก (ดังที่คุณพูด) แต่โมเดลเหล่านี้สามารถรวมกันได้ไกลจากโมเดลจริง ข้ามชุดข้อมูลพวกเขาจะอยู่ห่างออกไปในทิศทางที่แตกต่างกันดังนั้นความแปรปรวนสูง นั่นเป็นวิธีที่ฉันเข้าใจในเชิงคุณภาพ
อะมีบาพูดว่า Reinstate Monica

2
@ อะมีบาทำไมไม่เปลี่ยนความคิดเห็นเหล่านั้นเป็นคำตอบอย่างเป็นทางการ?
gung - Reinstate Monica

คำตอบ:


10

คำถามนี้อาจจะจบลงด้วยการปิดซ้ำซ้อนของความแปรปรวนและอคติในการตรวจสอบข้าม: ทำไม CV ทิ้งหนึ่งออกมีความแปรปรวนมากขึ้น? แต่ก่อนที่มันจะเกิดขึ้นฉันคิดว่าฉันจะเปลี่ยนความคิดเห็นเป็นคำตอบ

ฉันยังไม่เข้าใจอย่างชัดเจนว่า LOO สามารถเป็นกลางได้อย่างไร แต่มีความแปรปรวนสูง

ลองพิจารณาตัวอย่างง่ายๆ ให้มูลค่าที่แท้จริงของพารามิเตอร์เป็น0.5ประมาณการผลตอบแทนถัวเฉลี่ยที่0.49 , 0.51 ,0.50.49,0.51,0.49,0.51...0.1,0.9,0.1,0.9...

ประสิทธิภาพของการตรวจสอบข้ามไม่ควรมีเสถียรภาพมาก (ความแปรปรวนต่ำ) เพราะชุดการฝึกอบรมเกือบเหมือนกันหรือไม่

คุณต้องคิดถึงความแปรปรวนของการรับรู้ที่แตกต่างกันของชุดข้อมูลทั้งหมด สำหรับชุดข้อมูลที่กำหนดการตรวจสอบข้ามแบบครั้งเดียวจะทำให้เกิดแบบจำลองที่คล้ายกันมากสำหรับแต่ละชุดย่อยเนื่องจากชุดการฝึกอบรมกำลังตัดกันมาก (ตามที่คุณสังเกตเห็นอย่างถูกต้อง) แต่โมเดลเหล่านี้ทั้งหมดสามารถอยู่ห่างจากโมเดลจริง ข้ามชุดข้อมูลพวกเขาจะอยู่ห่างออกไปในทิศทางที่แตกต่างกันดังนั้นความแปรปรวนสูง

อย่างน้อยนั่นเป็นวิธีที่ฉันเข้าใจ โปรดดูหัวข้อที่เชื่อมโยงสำหรับการสนทนาเพิ่มเติมและเอกสารอ้างอิงสำหรับการสนทนาเพิ่มเติม


2
ดังนั้นอย่างที่ฉันเข้าใจมันมีอคติต่ำเนื่องจากชุดการฝึกอบรมมีขนาดใหญ่มาก - เกือบจะเหมือนกันกับชุดข้อมูลทั้งหมด ดังนั้นสำหรับชุดข้อมูลหนึ่งชุดเราสามารถคาดหวังการประเมินที่ดีมาก อย่างไรก็ตามเนื่องจากความสัมพันธ์ที่สูงของรอยพับ (การ crossvalidation เกือบจะดำเนินการกับข้อมูลที่เหมือนกันในการวนซ้ำ) การประมาณนี้ยังมีความเฉพาะเจาะจงสำหรับชุดข้อมูลนี้ทำให้เกิดความแปรปรวนระหว่างประสิทธิภาพของชุดข้อมูลที่แตกต่างกัน . แก้ไข?
Pegah

2
ฉันคิดว่ามันเป็นส่วนใหญ่ที่ถูกต้อง for one particular dataset we can expect a very good estimationแต่ก็ควรระมัดระวังบอกว่า ฉันเดาว่าคน ๆ หนึ่งสามารถตีความได้ว่ามันเป็นความหมายว่าการประมาณค่าพารามิเตอร์ชุดข้อมูลบางอย่างจะดี แต่โดยทั่วไปการตรวจสอบความถูกต้องไขว้นั้นควรจะประมาณค่าพารามิเตอร์ของประชากร : แบบจำลองบางชนิดสามารถทำการทำนายเกี่ยวกับตัวแปรตามในประชากรได้ดีเพียงใด และเราไม่สามารถคาดหวังการประเมินที่ดีมากโดย LOOCV เนื่องจากสิ่งที่คุณเขียน (ค่าประมาณvery specific for this particular dataset)
อะมีบาพูดว่า Reinstate Monica

1
ฉันควรเพิ่มข้อแม้ที่ทั้งหมดนี้เป็นความเข้าใจของฉันในปัจจุบัน แต่โดยทั่วไปฉันพบว่าหัวข้อนี้ค่อนข้างยุ่งยากและประสบการณ์ของฉันกับการตรวจสอบข้ามถูก จำกัด ฉันไม่ใช่ผู้เชี่ยวชาญ
อะมีบาพูดว่า Reinstate Monica

1
ฉันขอถามได้ไหมว่าทำไมคุณถึงคิดว่ามันยุ่งยาก? ฉันอยากรู้อยากเห็นตั้งแต่นี้อาจสอนฉันบางสิ่งบางอย่างเกี่ยวกับที่ต้องระวังเมื่อมันมาถึงประวัติย่อหรือสถานที่ที่จะเพิ่มความรู้ของฉัน
Pegah

2
ด้วยคำตอบที่ได้รับการยอมรับในหัวข้อนี้บางทีคุณไม่จำเป็นต้องพูดถึงความแปรปรวนสูงของ LOOCV ในคำตอบนี้อีกต่อไปนั่นคือความแปรปรวนสูงหรือไม่ ฉันเคยคิดเกี่ยวกับคำถามเหล่านี้มาระยะหนึ่งแล้วและไม่สามารถหาเหตุผลทางทฤษฎีสำหรับความแปรปรวนสูงของ LOOCV ในปัญหาการถดถอยอย่างต่อเนื่อง ("ต่อเนื่อง"?) แม้ว่าฉันจะเห็นประเด็นของ Paul ในความคิดเห็นในหัวข้อที่เชื่อมโยงที่ LOOCV ล้มเหลว หากตัวอย่างของคุณมีข้อมูลซ้ำของแต่ละจุด
Richard Hardy

1

ความแปรปรวนสูงนี้เกี่ยวข้องกับพื้นที่ของชุดการฝึกอบรม นี่คือสาเหตุที่ LOOCV มีความแปรปรวนสูง: ใน LOOCV เราได้รับข้อผิดพลาดในการทำนายสำหรับการสังเกตแต่ละครั้งพูดการสังเกต i โดยใช้ชุดข้อมูลที่สังเกตได้ทั้งหมดในมือยกเว้นการสังเกตนี้ ดังนั้นค่าที่ทำนายไว้สำหรับ i นั้นขึ้นอยู่กับชุดข้อมูลปัจจุบัน ตอนนี้สมมติว่าเราสังเกตชุดข้อมูลอิสระอีกชุดและพอดีกับชุดข้อมูลในชุดข้อมูลใหม่นี้ หากเราใช้โมเดลใหม่นี้เพื่อรับค่าที่คาดการณ์ไว้สำหรับการสังเกต i ค่าที่คาดการณ์อาจแตกต่างจากที่ประเมินโดย LOOCV มาก (แม้ว่าจะถูกต้องโดยเฉลี่ย (ไม่เอนเอียง))

นี่คือสัญชาตญาณที่อยู่เบื้องหลังความแปรปรวนสูงของการทำนายข้อผิดพลาดใน LOOCV

อย่างไรก็ตามหากคุณกำลังใช้ LOOCV เพื่อเปรียบเทียบผลลัพธ์ของโมเดลที่มีพารามิเตอร์หลายแบบแตกต่างกันฉันเชื่อว่าคุณสามารถใช้ LOOCV เพื่อประเมินข้อผิดพลาดในการทำนายได้อย่างปลอดภัยหากค่าที่แท้จริงของข้อผิดพลาดในการทำนายไม่ใช่สิ่งที่คุณสนใจ เปรียบเทียบแบบจำลองต่างๆที่มีชุดฝึกอบรมที่สังเกตและคุณไม่สนใจว่าจะเกิดข้อผิดพลาดจริงที่แท้จริง

ถ้าคุณมีตัวอย่างเล็ก ๆ ให้ใช้ LOOCV มิฉะนั้นให้ใช้ k-fold CV ด้วยค่าที่น้อยกว่าสำหรับ k

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.