ในฐานะที่เป็น OP กล่าวถึงมันเป็นไปได้ที่จะแก้ k- หมายถึงโดยใช้การไล่ระดับสีและนี่อาจเป็นประโยชน์ในกรณีที่เกิดปัญหาขนาดใหญ่
มีเหตุผลทางประวัติศาสตร์อย่างแน่นอนสำหรับความชุกของอัลกอริธึมสไตล์ EM สำหรับการแก้ k-mean (เช่นอัลกอริทึมของ Lloyd) อัลกอริทึมของลอยด์เป็นที่นิยมกันมากจนบางครั้งผู้คนเรียกมันว่า "อัลกอริธึม k-mean" และอาจไม่รู้ด้วยวิธีอื่น ๆ แต่ความนิยมนี้ไม่สมควร
Bottou และ Bengio (1995) แสดงให้เห็นว่าอัลกอริทึมของ Lloyd เทียบเท่ากับการปรับฟังก์ชั่นต้นทุน k-mean โดยใช้วิธีของนิวตัน ในปัญหาการปรับให้เหมาะสมโดยทั่วไปวิธีลำดับที่สองเช่นวิธีของนิวตันสามารถรวมกันได้เร็วกว่าวิธีการเรียงลำดับแรกเช่นการไล่ระดับสีเนื่องจากพวกเขาใช้ประโยชน์จากข้อมูลเกี่ยวกับความโค้งของฟังก์ชันวัตถุประสงค์ ในการทดลองเกี่ยวกับชุดข้อมูล Iris ที่รู้จักกันดีพวกเขาแสดงให้เห็นว่าอัลกอริทึมของ Lloyd ไม่ได้มาบรรจบกันเร็วกว่าการไล่ระดับสี มันน่าสนใจที่จะเห็นการเปรียบเทียบนี้กับชุดข้อมูลที่หลากหลาย
อ้างอิง:
Bottou และ Bengio (1995) คุณสมบัติการบรรจบกันของอัลกอริธึม k-mean