นี่คือตัวอย่างถ้าฉันทำเช่นนี้ใน mplus ซึ่งอาจเป็นประโยชน์และชมเชยคำตอบที่ครอบคลุมมากขึ้น:
ว่าฉันมี 3 ตัวแปรอย่างต่อเนื่องและต้องการระบุกลุ่มตามสิ่งเหล่านี้ ฉันจะระบุรูปแบบผสม (specficially มากขึ้นในกรณีนี้เป็นรูปแบบรายละเอียดที่ซ่อนเร้น) สมมติว่าเป็นอิสระเงื่อนไข (ตัวแปรสังเกตเป็นอิสระให้เป็นสมาชิกคลัสเตอร์) เป็น:
Model:
%Overall%
v1* v2* v3*; ! Freely estimated variances
[v1 v2 v3]; ! Freely estimated means
ฉันจะใช้โมเดลนี้หลาย ๆ ครั้งในแต่ละครั้งที่ระบุจำนวนกลุ่มที่แตกต่างกันและเลือกโซลูชันที่ฉันชอบมากที่สุด (การทำเช่นนี้เป็นหัวข้อที่กว้างใหญ่ในตัวของมันเอง)
หากต้องการรัน k-mean ฉันจะระบุรูปแบบต่อไปนี้:
Model:
%Overall%
v1@0 v2@0 v3@0; ! Variances constrained as zero
[v1 v2 v3]; ! Freely estimated means
ดังนั้นการเป็นสมาชิกของกลุ่มจึงขึ้นอยู่กับระยะทางถึงค่าของตัวแปรที่สังเกตได้ ตามที่ระบุไว้ในคำตอบอื่น ๆ ความแปรปรวนไม่มีอะไรเกี่ยวข้องกับมัน
สิ่งที่ดีเกี่ยวกับการทำสิ่งนี้ใน mplus คือสิ่งเหล่านี้เป็นแบบจำลองที่ซ้อนกันและคุณสามารถทดสอบได้โดยตรงว่าข้อ จำกัด ส่งผลให้แย่ลงหรือไม่นอกเหนือจากความสามารถในการเปรียบเทียบความไม่ลงรอยกันในการจำแนกระหว่างสองวิธี อย่างไรก็ตามทั้งสองโมเดลสามารถประมาณได้โดยใช้อัลกอริทึม EM ดังนั้นความแตกต่างจึงเป็นเรื่องเกี่ยวกับแบบจำลองมากขึ้น
ถ้าคุณคิดว่าในอวกาศ 3 มิติ 3 หมายถึงจุด ... และความแปรปรวนของสามแกนของทรงรีที่วิ่งผ่านจุดนั้น ถ้าความแปรปรวนทั้งสามเหมือนกันคุณจะได้รูปทรงกลม