ดูเพิ่มเติมที่ @ttnphns คำตอบสำหรับการแปลความหมายของ k- หมายถึงที่เกี่ยวข้องกับระยะทางแบบยูคลิด
วิธี k หมายถึงมีการก่อสร้างจะไม่ขึ้นอยู่กับระยะทาง
K-หมายถึงลดความแปรปรวนภายในคลัสเตอร์ให้เหลือน้อยที่สุด ทีนี้ถ้าคุณดูนิยามของความแปรปรวนมันก็เหมือนกับผลบวกของระยะทางแบบยุคลิดแบบสแควร์จากศูนย์กลาง (@ttnphns คำตอบหมายถึงระยะทางแบบยุคลิดแบบคู่)
แนวคิดพื้นฐานของ k หมายถึงคือการลดข้อผิดพลาดยกกำลังสอง ไม่มี "ระยะทาง" เกี่ยวข้องที่นี่
ทำไมมันไม่ถูกต้องที่จะใช้ระยะทางพลเพราะk หมายถึงอาจหยุดบรรจบกับฟังก์ชั่นอื่น หลักฐานที่พบบ่อยของการบรรจบกันเป็นเช่นนี้ขั้นตอนการกำหนดและขั้นตอนการปรับปรุงค่าเฉลี่ยทั้งเพิ่มประสิทธิภาพเดียวกันเกณฑ์ มีการกำหนดจำนวนที่แน่นอนที่เป็นไปได้ ดังนั้นจึงต้องมาบรรจบกันหลังจากการปรับปรุงจำนวน จำกัด ในการใช้หลักฐานนี้สำหรับฟังก์ชั่นระยะทางอื่นคุณต้องแสดงให้เห็นว่าค่าเฉลี่ย (หมายเหตุ: k- หมายถึง ) ลดระยะทางของคุณด้วย
หากคุณกำลังมองหาตัวแปร k ระยะทางของแมนฮัตตัน เนื่องจากค่ามัธยฐานเป็นตัวประมาณ L1 ที่รู้จักกันดีที่สุด
หากคุณต้องการฟังก์ชั่นระยะทางที่กำหนดให้ดูที่ k-medoids (aka: PAM, การแบ่งรอบ ๆ medoids) (เพราะมันถูกกำหนดให้เป็นขั้นต่ำ) และมีจำนวน จำกัด ที่เป็นไปได้ของ medoids เช่นกัน มันแพงกว่าค่าเฉลี่ยมาก