ไม่มีใครใช้หรือตัวชี้วัดสำหรับการจัดกลุ่มมากกว่า ?
Aggarwal และคณะ,
เกี่ยวกับพฤติกรรมที่น่าประหลาดใจของการวัดระยะทางในพื้นที่มิติสูง
กล่าวว่า (ในปี 2001)
เป็นที่นิยมมากกว่าอย่างต่อเนื่องจากนั้น Euclidean distance metro สำหรับการใช้งานการขุดข้อมูลขนาดสูง
และอ้างว่าหรือสามารถทำได้ดีกว่า
เหตุผลในการใช้หรืออาจเป็นเชิงทฤษฎีหรือเชิงทดลองเช่นความอ่อนไหวต่อค่าผิดปกติ / เอกสารของKabánหรือโปรแกรมที่ทำงานบนข้อมูลจริงหรือสังเคราะห์ (ทำซ้ำได้) ตัวอย่างหรือรูปภาพจะช่วยปรีชาของคนธรรมดาของฉัน
คำถามนี้เป็นคำถามติดตามคำตอบบ๊อบ Durrant ไป เมื่อ-is-ใกล้ที่สุด-เพื่อนบ้านที่มีความหมายต่อวัน ดังที่เขากล่าวตัวเลือกของจะเป็นทั้งข้อมูลและแอพพลิเคชั่น อย่างไรก็ตามรายงานจากประสบการณ์จริงจะเป็นประโยชน์
หมายเหตุได้เพิ่มอังคาร 7 มิถุนายน:
ฉันพบ "การวิเคราะห์ข้อมูลทางสถิติตาม L1-norm และวิธีการที่เกี่ยวข้อง", Dodge ed., 2002, 454p, is 37n 3764369205 - เอกสารการประชุมนับสิบ
ทุกคนสามารถวิเคราะห์ความเข้มข้นของระยะทางสำหรับคุณสมบัติเด่นของ iid ได้หรือไม่? เหตุผลหนึ่งที่ทำให้เอ็กซ์โปเนนเชียลคือ ; อื่น (ไม่ใช่ผู้เชี่ยวชาญ) คือการกระจายสูงสุดของเอนโทรปี≥ 0; หนึ่งในสามคือชุดข้อมูลจริงบางชุดโดยเฉพาะอย่างยิ่ง SIFT จะมีการแจกแจงแบบคร่าวๆ