การใช้การตรวจสอบข้ามมีผลต่อผลลัพธ์หรือไม่


9

อย่างที่คุณทราบมีการตรวจสอบข้ามแบบนิยมสองประเภท K-fold และการสุ่มตัวอย่างแบบสุ่ม (ดังอธิบายในWikipedia ) อย่างไรก็ตามฉันรู้ว่านักวิจัยบางคนกำลังสร้างและตีพิมพ์เอกสารที่บางสิ่งที่อธิบายไว้ในฐานะ K-fold CV นั้นเป็นตัวอย่างย่อยแบบสุ่มดังนั้นในทางปฏิบัติคุณไม่เคยรู้ว่าจริงๆแล้วคืออะไรในบทความที่คุณกำลังอ่าน
โดยปกติแล้วความแตกต่างนั้นไม่สามารถสังเกตเห็นได้และคำถามของฉันก็เป็นไปได้ไหม - คุณลองนึกถึงตัวอย่างเมื่อผลลัพธ์ของประเภทหนึ่งแตกต่างกันอย่างมีนัยสำคัญหรือไม่

คำตอบ:


4

คุณสามารถได้รับผลลัพธ์ที่แตกต่างกันอย่างแน่นอนเพราะคุณฝึกฝนในตัวอย่างที่แตกต่างกัน ฉันสงสัยอย่างมากว่ามีอัลกอริทึมหรือโดเมนปัญหาที่ผลลัพธ์ของทั้งสองจะแตกต่างกันในวิธีที่คาดเดาได้


ฉันหมายถึงผลลัพธ์ที่แตกต่างอย่างมีนัยสำคัญ ฉันยังคิดว่าไม่มีตัวอย่างอย่างน้อยโลกแห่งความจริง ยังฉันคิดว่าฉันจะรออีกสักครู่

3

โดยปกติแล้วความแตกต่างนั้นไม่สามารถสังเกตเห็นได้และคำถามของฉันก็เป็นไปได้ไหม - คุณลองนึกถึงตัวอย่างเมื่อผลลัพธ์ของประเภทหนึ่งแตกต่างกันอย่างมีนัยสำคัญหรือไม่

ฉันไม่แน่ใจว่าความแตกต่างทั้งหมดเป็นสิ่งที่สังเกตไม่ได้และเฉพาะในตัวอย่างเฉพาะกิจเท่านั้นที่จะเห็นได้ชัดเจน ทั้งการตรวจสอบความถูกต้องไขว้และวิธีบูตสแตรป (การสุ่มตัวอย่างย่อย) ขึ้นอยู่อย่างยิ่งกับพารามิเตอร์การออกแบบและความเข้าใจนี้ยังไม่เสร็จสมบูรณ์ โดยทั่วไปผลลัพธ์ภายในการตรวจสอบความถูกต้องข้ามของ k-fold ขึ้นอยู่อย่างยิ่งกับจำนวนการพับดังนั้นคุณสามารถคาดหวังผลลัพธ์ที่แตกต่างจากสิ่งที่คุณจะสังเกตเห็นในการสุ่มตัวอย่างย่อยเสมอ

ตรงประเด็น: พูดว่าคุณมีโมเดลเชิงเส้นที่แท้จริงพร้อมพารามิเตอร์จำนวนคงที่ หากคุณใช้การตรวจสอบความถูกต้องข้ามของ k-fold (ด้วยค่าที่กำหนด, k คงที่) และปล่อยให้จำนวนการสังเกตไปที่อนันต์การตรวจสอบความถูกต้องข้ามของ k-fold จะไม่สอดคล้องกันสำหรับการเลือกแบบจำลอง asymptotically ความน่าจะเป็นที่มากกว่า 0 ผลลัพธ์ที่น่าประหลาดใจนี้เกิดขึ้นเนื่องจาก Jun Shao, "การเลือกแบบจำลองเชิงเส้นโดยการตรวจสอบข้าม", วารสารสมาคมสถิติอเมริกัน , 88 , 486-494 (1993) แต่สามารถพบเอกสารเพิ่มเติมในหลอดเลือดดำนี้

โดยทั่วไปเอกสารสถิติที่น่านับถือระบุโปรโตคอลการตรวจสอบข้ามเนื่องจากผลลัพธ์ไม่คงที่ ในกรณีที่พวกเขาเลือกพับจำนวนมากสำหรับชุดข้อมูลขนาดใหญ่พวกเขาพูดและพยายามแก้ไขอคติในการเลือกแบบจำลอง


ไม่ไม่ไม่มันเกี่ยวกับการเรียนรู้ของเครื่องไม่ใช่การเลือกรูปแบบ

1
ความแตกต่างที่น่าสนใจ ฉันคิดว่าการเลือกรูปแบบเป็นสิ่งสำคัญสำหรับการเรียนรู้ของเครื่องในความหมายเกือบทั้งหมดของคำ
gappy

ทุกสิ่งเหล่านี้ทำงานได้ดีกับแบบจำลองเชิงเส้นตรง (ส่วนใหญ่เป็นแบบเส้นตรง) เมื่อคุณมีพารามิเตอร์น้อยและคุณต้องการให้พอดีกับข้อมูลเพื่อพูดอะไรบางอย่างเช่นคุณมี y และ x และคุณต้องการตรวจสอบว่า y = x ^ 2 หรือ y = x ที่นี่ฉันพูดคุยเกี่ยวกับการประเมินข้อผิดพลาดของแบบจำลองเช่น SVM หรือ RF ซึ่งสามารถมีพารามิเตอร์หลายพันและยังไม่ overfitting เนื่องจากการวิเคราะห์พฤติกรรมที่ซับซ้อน

ผลลัพธ์เหล่านี้ใช้ได้สำหรับการถดถอยของตัวแบบเชิงเส้นทั่วไปพร้อมด้วยจำนวนตัวแปรอิสระ ตัวแปรสามารถเป็นผู้เรียนโดยพลการ ข้อสันนิษฐานที่สำคัญคือเมื่อจำนวนการสังเกตไปถึงอนันต์จำนวนผู้เรียนที่อธิบายแบบจำลองที่แท้จริงยังคงมีขอบเขต ทั้งหมดนี้ใช้ได้กับการถดถอยดังนั้นสำหรับงานการจัดหมวดหมู่อย่างคุณไม่แน่ใจว่ามันช่วยได้หรือไม่
gappy

มันไม่ใช่; GLM ไม่ใช่การเรียนรู้ของเครื่อง วิธีการเรียนรู้ของเครื่องที่แท้จริงนั้นฉลาดพอที่จะรักษาระดับความซับซ้อนให้เป็นอิสระจากจำนวนวัตถุที่เพิ่มขึ้น (ถ้าแน่นอน) แม้สำหรับแบบจำลองเชิงเส้นทฤษฏีทั้งหมดนี้ก็ทำงานได้ไม่ดีนักเนื่องจากการลู่เข้าไม่ดี
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.