ฉันยังใหม่กับการวิเคราะห์กลุ่ม ฉันใช้ R สำหรับการจัดกลุ่ม k หมายถึงและฉันสงสัยว่าสิ่งเหล่านั้นคืออะไร และอะไรจะดีกว่าถ้าอัตราส่วนของพวกมันเล็กกว่าหรือใหญ่กว่า?
ฉันยังใหม่กับการวิเคราะห์กลุ่ม ฉันใช้ R สำหรับการจัดกลุ่ม k หมายถึงและฉันสงสัยว่าสิ่งเหล่านั้นคืออะไร และอะไรจะดีกว่าถ้าอัตราส่วนของพวกมันเล็กกว่าหรือใหญ่กว่า?
คำตอบ:
มันเป็นตัวชี้วัดความดีของการจำแนกประเภท k ที่พบ SS ย่อมาจาก Sum of Squares ดังนั้นจึงเป็นเรื่องปกติของการเบี่ยงเบนของความเบี่ยงเบนในความเบี่ยงเบน "ระหว่าง" และความเบี่ยงเบน "ภายใน" เป็นการดีที่คุณต้องการการจัดกลุ่มที่มีคุณสมบัติของการติดต่อกันภายในและการแยกภายนอกเช่นอัตราส่วน BSS / TSS ควรเข้าใกล้ 1
ตัวอย่างเช่นใน R:
data(iris)
km <- kmeans(iris[,1:4], 3)
ให้อัตราส่วน BSS / TSS ที่ 88.4% (0.884) บ่งบอกถึงความพอดี คุณควรระวังให้ดีและโดยทั่วไปควรวางแผน WSS เทียบกับจำนวนคลัสเตอร์เนื่องจากต้องระบุหมายเลขนี้ไว้ล่วงหน้า