GMM ใช้เนินเขาที่ทับซ้อนกันซึ่งทอดยาวไปจนถึงอนันต์ (แต่นับได้เพียง 3 ซิกม่าเท่านั้น) แต่ละจุดได้รับทั้งหมดภูเขาคะแนนความน่าจะเป็น นอกจากนี้ยังเนินเขาเป็น "รูปไข่" [ไม่เป็นไรพวกเขากำลังสมมาตรวงรี ] และโดยใช้เมทริกซ์ความแปรปรวนเต็มรูปแบบอาจจะเอียง
K-หมายถึงการกำหนดจุดไปยังคลัสเตอร์เดียวอย่างหนักดังนั้นคะแนนของศูนย์คลัสเตอร์อื่น ๆ จะถูกเพิกเฉย (ถูกรีเซ็ตเป็นศูนย์ / ไม่สนใจ) เนินเขาเป็นฟองสบู่ทรงกลม เมื่อฟองสบู่สองฟองสัมผัสกันเส้นแบ่งระหว่างพวกมันจะกลายเป็นระนาบแบน (ไฮเปอร์ -) เช่นเดียวกับเมื่อคุณเป่าฟองสบู่ฟองสบู่จำนวนมากฟองด้านในนั้นไม่แบน แต่มีกล่องดังนั้นเขตแดนระหว่างทรงกลม (ไฮเปอร์ -) จริง ๆ แล้วก่อตัวเป็นส่วนหนึ่งของพื้นที่ Voronoi ใน 2D สิ่งนี้มีลักษณะคล้ายรางหกเหลี่ยมอย่างใกล้ชิดคิดว่ารังผึ้ง (แม้ว่าแน่นอนว่าเซลล์ Voronoi ไม่รับประกันว่าจะเป็นรูปหกเหลี่ยม) K-หมายถึงเนินเขาที่อยู่รอบและไม่ได้รับการเอียงดังนั้นจึงมีพลังในการเป็นตัวแทนน้อย แต่จะคำนวณได้เร็วกว่ามากโดยเฉพาะในมิติที่สูงกว่า
เนื่องจาก K-mean ใช้การวัดระยะทางแบบยุคลิดจึงถือว่าขนาดนั้นเปรียบได้และมีน้ำหนักเท่ากัน ดังนั้นหากมิติ X มีหน่วยไมล์ต่อชั่วโมงแตกต่างกันไปตั้งแต่ 0 ถึง 80 และมิติ Y มีหน่วยปอนด์, แปรผันจาก 0 ถึง 400 และคุณอยู่ในวงกลมที่พอดีในพื้นที่ XY นี้ดังนั้นหนึ่งมิติ (และการแพร่กระจาย) กำลังจะมีประสิทธิภาพมากกว่ามิติอื่นและจะบดบังผลลัพธ์ นี่คือเหตุผลที่เป็นเรื่องธรรมดาที่จะทำให้ข้อมูลเป็นมาตรฐานเมื่อใช้วิธี K
ทั้ง GMM และ K-หมายถึงแบบจำลองข้อมูลโดยการปรับให้เหมาะสมที่สุดกับสิ่งที่ได้รับ GMM เหมาะกับไข่ที่เอียงและ K-หมายถึงทรงกลมที่ไม่เอียง แต่ข้อมูลพื้นฐานอาจมีรูปร่างเหมือนอะไรก็ได้อาจเป็นเกลียวหรือภาพวาดปิกัสโซและอัลกอริทึมแต่ละตัวจะยังคงทำงานและถ่ายภาพได้ดีที่สุด ไม่ว่ารูปแบบที่เกิดขึ้นจะมีลักษณะเช่นข้อมูลจริงหรือไม่นั้นขึ้นอยู่กับกระบวนการทางกายภาพพื้นฐานที่สร้างข้อมูล (ตัวอย่างเช่นการวัดการหน่วงเวลาเป็นด้านเดียว; แบบเกาส์เป็นแบบที่ดีหรือไม่?)
Rn
ดังนั้นภาพไบนารี 8x8 ของคุณจะถูกตีความว่าเป็น hypercube แบบ 64 มิติใน hyperquadrant แรก อัลกอริทึมจากนั้นใช้การเปรียบเทียบเชิงเรขาคณิตเพื่อค้นหากลุ่ม ระยะทางด้วยค่า K หมายถึงระยะทางแบบยุคลิดในพื้นที่ 64 มิติ เป็นวิธีหนึ่งที่จะทำ