จำนวน ss ทั้งหมดและระหว่าง ss หมายถึงอะไรในการจัดกลุ่ม k-mean


10

ฉันยังใหม่กับการวิเคราะห์กลุ่ม ฉันใช้ R สำหรับการจัดกลุ่ม k หมายถึงและฉันสงสัยว่าสิ่งเหล่านั้นคืออะไร และอะไรจะดีกว่าถ้าอัตราส่วนของพวกมันเล็กกว่าหรือใหญ่กว่า?

คำตอบ:


12

มันเป็นตัวชี้วัดความดีของการจำแนกประเภท k ที่พบ SS ย่อมาจาก Sum of Squares ดังนั้นจึงเป็นเรื่องปกติของการเบี่ยงเบนของความเบี่ยงเบนในความเบี่ยงเบน "ระหว่าง" และความเบี่ยงเบน "ภายใน" เป็นการดีที่คุณต้องการการจัดกลุ่มที่มีคุณสมบัติของการติดต่อกันภายในและการแยกภายนอกเช่นอัตราส่วน BSS / TSS ควรเข้าใกล้ 1

ตัวอย่างเช่นใน R:

data(iris)
km <- kmeans(iris[,1:4], 3)

ให้อัตราส่วน BSS / TSS ที่ 88.4% (0.884) บ่งบอกถึงความพอดี คุณควรระวังให้ดีและโดยทั่วไปควรวางแผน WSS เทียบกับจำนวนคลัสเตอร์เนื่องจากต้องระบุหมายเลขนี้ไว้ล่วงหน้า

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.