ในปี 1999 เบเยอร์และคณะ ถาม เมื่อ "เพื่อนบ้านที่ใกล้ที่สุด" มีความหมาย?
มีวิธีที่ดีกว่าในการวิเคราะห์และแสดงผลของความเรียบของระยะทางในการค้นหา NN ตั้งแต่ปี 1999 หรือไม่
ชุดข้อมูล [ที่ระบุ] ให้คำตอบที่มีความหมายต่อปัญหา 1-NN หรือไม่ ปัญหา 10-NN? ปัญหา 100-NN?
วันนี้คุณจะผู้เชี่ยวชาญตอบคำถามนี้อย่างไร
การแก้ไขวันจันทร์ 24 มกราคม:
วิธี "ระยะทางสีขาว" เป็นชื่อที่สั้นกว่าสำหรับ "ความเรียบระยะทางกับมิติที่เพิ่มขึ้น"?
วิธีง่าย ๆ ในการดู "ระยะทางไวต์ไวท์" คือการเรียกใช้ 2-NN และวางแผนระยะทางไปยังเพื่อนบ้านที่ใกล้ที่สุดและเพื่อนบ้านที่ใกล้ที่สุดที่สอง เนื้อเรื่องด้านล่างแสดง dist 1และ dist 2 สำหรับช่วงของ nclusters และมิติโดย Monte Carlo ตัวอย่างนี้แสดงความแตกต่างของระยะทางที่ค่อนข้างดีสำหรับส่วนต่างสัมบูรณ์ | dist 2 - dist 1 | (ความแตกต่างสัมพัทธ์ | dist 2 / dist 1 | → 1 เป็นขนาด→∞ดังนั้นไร้ประโยชน์)
ข้อผิดพลาดแบบสัมบูรณ์หรือข้อผิดพลาดสัมพัทธ์ควรใช้ในบริบทที่กำหนดหรือไม่นั้นขึ้นอยู่กับเสียง "จริง" ในปัจจุบัน: ยาก
คำแนะนำ: ใช้ 2-NN เสมอ 2 เพื่อนบ้านมีประโยชน์เมื่อพวกเขาอยู่ใกล้และมีประโยชน์เมื่อไม่ได้