ด้วยการตรวจสอบความถูกต้องข้ามของ k-fold คุณเฉลี่ยโมเดล


13

เมื่อดำเนินการตรวจสอบความถูกต้องของ k-fold ฉันเข้าใจว่าคุณได้รับเมตริกความถูกต้องโดยการชี้ทั้งหมดในโฟลด์ยกเว้นที่หนึ่งในนั้นและทำการคาดคะเนแล้วทำการทำซ้ำขั้นตอนนี้ครั้ง จากนั้นคุณสามารถเรียกใช้ตัวชี้วัดความถูกต้องในทุกอินสแตนซ์ของคุณ (ความแม่นยำการเรียกคืนการจำแนก% อย่างถูกต้อง) ซึ่งควรจะเหมือนกับว่าคุณคำนวณแต่ละครั้งแล้วเฉลี่ยผลลัพธ์ (แก้ไขฉันถ้าฉันผิด)k

ผลลัพธ์สุดท้ายที่คุณต้องการคือรุ่นสุดท้าย

คุณเฉลี่ยโมเดลที่ได้รับเพื่อทำให้ชุดการทำนายของคุณจบลงด้วยโมเดลที่มีการวัดความแม่นยำที่ได้จากวิธีการข้างต้นหรือไม่k

คำตอบ:


15

k

ผลลัพธ์ของการทดสอบการตรวจสอบไขว้สามารถบอกคุณได้ว่าการสนับสนุนเครื่องเวกเตอร์ไร้ประสิทธิภาพไร้เดียงสาบนข้อมูลของคุณหรือว่าพารามิเตอร์ไฮเปอร์ของตัวแยกประเภทควรถูกตั้งค่าเป็น c สำหรับชุดข้อมูลเฉพาะนี้ ด้วยความรู้นี้คุณจะได้ฝึกอบรมลักษณนาม "การผลิต" ด้วยข้อมูลที่มีทั้งหมดและนำไปใช้กับปัญหาของคุณ

ในหลายกรณีมันไม่ชัดเจนเลยว่าคุณจะเฉลี่ยรุ่นต่างๆอย่างไร ตัวอย่างเช่นต้นไม้ตัดสินใจสามต้นหรือตัวแยกประเภทเพื่อนบ้านที่ใกล้ที่สุดคืออะไร

โปรดทราบว่าผลลัพธ์การตรวจสอบความถูกต้องไขว้เป็นข้อมูลประมาณการไม่รับประกันและการประเมินเหล่านี้จะถูกต้องมากขึ้นหากตัวจำแนกประเภทการผลิตได้รับการฝึกอบรมด้วยข้อมูลคุณภาพ (และปริมาณ) ที่คล้ายคลึงกัน มีงานที่เป็นธรรมเกี่ยวกับการพัฒนาวิธีการใช้ประมาณการเหล่านี้เพื่อทำการอนุมาน นั่นคือการพูดในเชิงสถิติวิธีการนั้นโดยทั่วไปจะดีกว่าวิธี B ในข้อมูลเหล่านี้


2
การอ้างอิงที่ดีในการใช้การประเมินการตรวจสอบความถูกต้องข้ามของ k-fold สำหรับการอนุมานคืออะไร ฉันชอบที่จะอ่านขึ้นถ้าคุณมีส่วนแบ่งที่ดี
tentaclenorm

1
จุดเริ่มต้นที่ดีอาจเป็นiro.umontreal.ca/~lisa/bib/pub_subject/finance/pointeurs/แต่มีวิธีการที่แตกต่างกันมากมาย
Matt Krause

1
อีกสิ่งหนึ่งที่จะทำให้กระจ่าง: เมื่อเราฝึกลักษณนาม "การผลิต" โดยใช้ข้อมูลทั้งหมดที่เราเข้าใจว่าจะหยุดเมื่อไหร่?
Anton
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.