VC-Dimensions ของ k- เพื่อนบ้านที่ใกล้ที่สุด


10

VC-Dimension ของอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุดคือ k คืออะไรถ้า k เท่ากับจำนวนคะแนนการฝึกอบรมที่ใช้?


บริบท:คำถามนี้ถูกถามในหลักสูตรที่ฉันทำและคำตอบที่ได้คือ 0 แต่ฉันไม่เข้าใจว่าทำไมถึงเป็นเช่นนั้น สัญชาตญาณของฉันคือ VC-Dimension ควรเป็น 1 เพราะมันเป็นไปได้ที่จะเลือกสองแบบ (เช่นชุดของคะแนนการฝึกอบรม) เพื่อให้ทุกจุดถูกระบุว่าเป็นของคลาสหนึ่งตามรุ่นแรกและเป็นของคลาสอื่น ตามรุ่นที่สองดังนั้นจึงเป็นไปได้ที่จะแตกจุดเดียว ความผิดพลาดในการให้เหตุผลของฉันอยู่ที่ไหน

คำตอบ:


2

คุณบอกว่าอัลกอริทึมคือ: อัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุดกับ k = จำนวนจุดฝึกที่ใช้ ฉันนิยามสิ่งนี้ว่าเป็นjms-k- เพื่อนบ้านที่ใกล้ที่สุด

เนื่องจากมิติ VC เป็นจำนวนคะแนนการฝึกอบรมที่มากที่สุดซึ่งสามารถทำลายได้ด้วยอัลกอริธึมที่มีความผิดพลาดของรถไฟ 0 มิติ VC ของjms-k- เพื่อนบ้านที่ใกล้เคียงที่สุดสามารถเป็น k หรือ 0 เท่านั้น

1 อินสแตนซ์การฝึกอบรม => k = 1: ในระหว่างการฝึกอบรมร้านค้าที่ใกล้เคียงที่สุดกับ jms-1- เพื่อนบ้าน ในระหว่างการสมัครในชุดฝึกอบรมเดียวกันนั้นอินสแตนซ์หนึ่งใกล้เคียงกับอินสแตนซ์การฝึกอบรมที่เก็บไว้ (เพราะเหมือนกัน) ดังนั้นข้อผิดพลาดการฝึกอบรมคือ 0

ดังนั้นฉันเห็นด้วยมิติ VC อย่างน้อย 1

2 อินสแตนซ์การฝึกอบรม => k = 2: อาจมีปัญหาเฉพาะเมื่อป้ายกำกับแตกต่างกัน ในกรณีนี้คำถามคือการตัดสินใจในการทำฉลากระดับชั้นเรียน คะแนนส่วนใหญ่ไม่ได้นำไปสู่ผลลัพธ์ (VC = 0?) ถ้าเราใช้คะแนนเสียงข้างมากแบบผกผันตามระยะทางมิติ VC คือ 2 (สมมติว่ามันไม่ได้รับอนุญาตให้มีอินสแตนซ์การฝึกอบรมเดียวกันสองครั้งด้วยฉลากที่แตกต่างกัน กรณีขนาด VC ของอัลกอริทึมทั้งหมดจะเป็น 0 (ฉันเดา))

ไม่มีอัลกอริทึมเพื่อนบ้านที่ใกล้ที่สุด k- มันเป็นของครอบครัวที่มีแนวคิดพื้นฐานเดียวกัน แต่รสชาติที่แตกต่างกันเมื่อมันมาถึงรายละเอียดการดำเนินงาน

ทรัพยากรที่ใช้: สไลด์มิติ VC โดย Andrew Moore


ขอบคุณนั่นเป็นประโยชน์มาก ฉันไม่ทราบกรณีที่คุณประเมินโมเดลว่าต้องเป็นแบบเดียวกับที่ใช้ในการฝึกอบรมพารามิเตอร์ ฉันจะต้องคิดเกี่ยวกับคำตอบของคุณและยอมรับในภายหลัง
Julius Maximilian Steen
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.