แนวคิดหลักของk- ใกล้เคียงที่สุด - เพื่อนบ้านจะคำนึงถึงคะแนนใกล้ที่สุดและตัดสินการจำแนกข้อมูลโดยการโหวตเสียงข้างมาก ถ้าเป็นเช่นนั้นไม่ควรมีปัญหาในข้อมูลมิติที่สูงขึ้นเนื่องจากวิธีการเช่นการแฮชที่มีความละเอียดอ่อนในพื้นที่สามารถค้นหาเพื่อนบ้านที่ใกล้ที่สุดได้อย่างมีประสิทธิภาพ
นอกจากนี้การเลือกคุณสมบัติด้วยเครือข่ายแบบเบย์สามารถลดขนาดของข้อมูลและทำให้การเรียนรู้ง่ายขึ้น
อย่างไรก็ตามการทบทวนรายงานนี้โดย John Lafferty ในการเรียนรู้ทางสถิติชี้ให้เห็นว่าการเรียนรู้ที่ไม่ใช่พารามิเตอร์ในพื้นที่คุณลักษณะมิติสูงยังคงเป็นความท้าทายและยังไม่แก้
เกิดอะไรขึ้น?