ฉันมีการจัดการเพื่อใช้ "วิธี L" เพื่อกำหนดจำนวนของกลุ่มในแอปพลิเคชันทางภูมิศาสตร์ (เช่น. เป็นปัญหา 2d พื้นฐานแม้ว่าในทางเทคนิคไม่ใช่ยูคลิด)
วิธี L อธิบายไว้ที่นี่: การ
กำหนดจำนวนของกลุ่ม / เซกเมนต์ในอัลกอริทึมการจัดกลุ่ม / การแบ่งกลุ่มตามลำดับชั้น Stan Salvador และ Philip Chan
เป็นหลักนี้ประเมินความเหมาะสมสำหรับค่าต่างๆของ k กราฟรูป "L" ถูกมองเห็นด้วยค่า k ที่เหมาะสมซึ่งแสดงโดยหัวเข่าในกราฟ การคำนวณการกระชับตัวแบบสองเส้นอย่างน้อยแบบคู่อย่างง่ายใช้เพื่อค้นหาจุดหัวเข่า
ฉันพบวิธีการช้ามากเพราะต้องคำนวณ k-mean ซ้ำสำหรับแต่ละค่าของ k นอกจากนี้ฉันยังพบว่าวิธี k ทำงานได้ดีที่สุดกับการวิ่งหลายครั้งและการเลือกที่ดีที่สุดในตอนท้าย แม้ว่าจุดข้อมูลแต่ละจุดจะมีเพียงสองมิติเท่านั้น แต่ไม่สามารถใช้ระยะทางของพีทาโกรัสได้ นั่นคือการคำนวณจำนวนมาก
หนึ่งความคิดคือการข้ามค่า k อื่น ๆ (พูด) ทุกครึ่งของการคำนวณและ / หรือเพื่อลดจำนวนการวนซ้ำหมายถึง k แล้วจึงทำให้เส้นโค้งที่เกิดขึ้นนั้นเรียบเล็กน้อยเพื่อให้ได้ขนาดที่แม่นยำยิ่งขึ้น ฉันถามเกี่ยวกับเรื่องนี้ที่ StackOverflow - IMHO คำถามที่ราบเรียบยังคงเป็นคำถามเปิดการวิจัย