อัลกอริทึมการจัดกลุ่มบางอย่างสามารถใช้โครงสร้างดัชนีเชิงพื้นที่ สิ่งนี้ทำให้ตัวอย่าง DBSCAN และ OPTICS ทำงานในเวลา (ตราบใดที่ดัชนีอนุญาตให้แบบสอบถาม )O(nlogn)O(logn)
เห็นได้ชัดว่าอัลกอริทึมที่ทำงานในความซับซ้อนนี้ไม่ได้สร้างเมทริกซ์ระยะทางO(n2)
สำหรับอัลกอริทึมบางอย่างเช่นการจัดกลุ่มแบบลำดับชั้นที่มีการเชื่อมโยงเดี่ยวและการเชื่อมโยงแบบสมบูรณ์จะมีอัลกอริทึมที่ได้รับการปรับให้เหมาะสมที่สุด (SLINK, CLINK) เป็นเพียงว่าคนส่วนใหญ่ใช้สิ่งที่พวกเขาสามารถได้รับและสิ่งที่ใช้งานง่าย และการจัดกลุ่มแบบลำดับชั้นนั้นง่ายต่อการใช้งานอย่างไร้เดียงสาโดยใช้การทำซ้ำผ่านเมทริกซ์ระยะทาง (ทำให้อัลกอริทึม ... )nn2O(n3)
ฉันไม่ทราบถึงรายการทั้งหมดเปรียบเทียบอัลกอริทึมการจัดกลุ่ม อาจมีอัลกอริทึมการจัดกลุ่มมากกว่า 100 รายการ มีอย่างน้อยหนึ่งโหลตัวแปร k-mean ตัวอย่างเช่น นอกจากนี้ยังมีความซับซ้อนในเวลาทำงานเช่นเดียวกับความซับซ้อนของหน่วยความจำ มีกรณีเฉลี่ยและกรณีที่เลวร้ายที่สุด มีความแตกต่างของการใช้งานขนาดใหญ่ (เช่นลิงก์เดียวที่กล่าวถึงข้างต้นและการใช้งาน DBSCAN ที่ไม่ได้ใช้ดัชนีและดังนั้นจึงอยู่ในและในขณะที่พวกเขาไม่จำเป็นต้องเก็บเมทริกซ์ระยะทางเต็มจากนั้นพวกเขายังคงต้องคำนวณระยะทางตามจำนวนคู่ทั้งหมด) นอกจากนี้ยังมีพารามิเตอร์มากมาย สำหรับ k-mean,O(n2)n×nkเป็นสิ่งสำคัญ สำหรับอัลกอริทึมใด ๆ ฟังก์ชั่นระยะทางสร้างความแตกต่างอย่างมาก (การใช้งานจำนวนมากอนุญาตให้ระยะทางแบบยุคลิดเท่านั้น ... ) และเมื่อคุณได้รับฟังก์ชั่นทางไกลที่มีราคาแพง (นอกเหนือจากเรื่องเล็กน้อยเช่น Euclidean) จำนวนการคำนวณระยะทางอาจเป็นส่วนหลักอย่างรวดเร็ว ดังนั้นคุณต้องแยกความแตกต่างระหว่างจำนวนการดำเนินการทั้งหมดและจำนวนการคำนวณระยะทางที่จำเป็น ดังนั้นอัลกอริทึมที่อยู่ในการดำเนินการแต่การคำนวณระยะทางอาจทำได้ดีกว่าอัลกอริทึมที่ทั้งคู่เมื่อฟังก์ชันระยะทางมีราคาแพงมาก (พูดระยะทาง ฟังก์ชั่นตัวเองคือ )O(n2)O(n)O(nlogn)O(n)