มีวิธีการจัดกลุ่มที่หลากหลายมากซึ่งเป็นวิธีการสำรวจโดยธรรมชาติและฉันไม่คิดว่าจะมีวิธีการจัดกลุ่มแบบใด ๆ ไม่ว่าจะเป็นแบบลำดับชั้นหรือตามพาร์ติชันขึ้นอยู่กับประเภทของสมมติฐานที่เราต้องพบเพื่อวิเคราะห์ความแปรปรวน
เมื่อดูที่เอกสาร [MV] ใน Stata เพื่อตอบคำถามของคุณฉันพบข้อความอ้างอิงที่น่าขบขันที่หน้า 85:
แม้ว่าบางคนบอกว่ามีวิธีการวิเคราะห์คลัสเตอร์หลายวิธีเช่นเดียวกับที่ผู้คนทำการวิเคราะห์กลุ่ม นี่คือการพูดขั้นต้น! มีวิธีการวิเคราะห์กลุ่มมากกว่าผู้ที่ดำเนินการอยู่
ในบริบทนั้นฉันสงสัยว่ามีข้อสันนิษฐานใด ๆ ที่ใช้ในวิธีการจัดกลุ่ม ส่วนที่เหลือของข้อความเพิ่งกำหนดเป็นกฎทั่วไปที่คุณต้องการรูปแบบของ "การวัดที่แตกต่างกัน" ซึ่งไม่จำเป็นต้องเป็นระยะทางเมตริกเพื่อสร้างกลุ่ม
มีข้อยกเว้นหนึ่งข้อซึ่งเมื่อคุณทำการจัดกลุ่มการสังเกตเป็นส่วนหนึ่งของการวิเคราะห์หลังการประมาณ ใน Stata vce
คำสั่งมาพร้อมกับคำเตือนต่อไปนี้ที่หน้า 86 ของแหล่งข้อมูลเดียวกัน:
หากคุณคุ้นเคยกับคำสั่งการประมาณค่าขนาดใหญ่ของ Stata ให้ระมัดระวังในการแยกแยะระหว่างการวิเคราะห์คลัสเตอร์ (คำสั่งคลัสเตอร์) และตัวเลือก vce (คลัสเตอร์ clustvar) ที่ได้รับอนุญาตพร้อมกับคำสั่งการประเมินจำนวนมาก การวิเคราะห์กลุ่มค้นหากลุ่มในข้อมูล ตัวเลือก vce (คลัสเตอร์ clustvar) ที่อนุญาตให้ใช้กับคำสั่งการประมาณค่าต่าง ๆ บ่งชี้ว่าการสังเกตเป็นอิสระข้ามกลุ่มที่กำหนดโดยตัวเลือก แต่ไม่จำเป็นต้องเป็นอิสระภายในกลุ่มเหล่านั้น ตัวแปรการจัดกลุ่มที่สร้างโดยคำสั่งคลัสเตอร์จะไม่ค่อยตรงตามสมมติฐานที่ใช้ตัวเลือก vce (คลัสเตอร์ clustvar)
จากนั้นฉันจะสมมติว่าไม่จำเป็นต้องมีการสังเกตอิสระนอกกรณีนั้น โดยสังหรณ์ใจฉันจะเพิ่มการวิเคราะห์กลุ่มที่อาจใช้เพื่อวัตถุประสงค์ที่แม่นยำในการสำรวจขอบเขตที่การสังเกตเป็นอิสระหรือไม่
ฉันจะพูดให้จบที่หน้า 356ของสถิติด้วย Stataลอว์เรนซ์แฮมิลตันกล่าวถึงตัวแปรมาตรฐานว่าเป็นแง่มุมที่ "จำเป็น" ของการวิเคราะห์กลุ่มแม้ว่าเขาจะไม่ได้เจาะลึกเรื่องนี้มากขึ้น