แบบหลายระดับกับรุ่นที่แยกต่างหากสำหรับแต่ละระดับ


10

อะไรคือข้อดีและข้อเสียของการใช้ตัวแบบแยกกับแบบจำลองหลายระดับ?

โดยเฉพาะอย่างยิ่งสมมติว่าการศึกษาตรวจสอบผู้ป่วยที่ซ้อนกันภายในการปฏิบัติของแพทย์ที่ซ้อนอยู่ภายในประเทศ ข้อดี / ข้อเสียของการใช้โมเดลแยกกันสำหรับแต่ละประเทศเทียบกับแบบจำลองซ้อนสามระดับคืออะไร


2
ในทางเทคนิคคุณต้องการหน่วยระดับ 3 เล็กน้อยหากคุณจะได้รับการประมาณค่าพารามิเตอร์ที่ไม่เอนเอียงในแบบจำลอง 3 ระดับ (โดยทั่วไปแล้วขนาดตัวอย่างในโมเดลหลายระดับนั้นมีความสำคัญเป็นพิเศษในระดับสูงสุด) เว้นแต่ว่าคุณจะมี ตัวอย่างแบบสุ่มขนาดใหญ่ของประเทศ (อาจมีมากกว่า 50+) คุณควรลองใช้แบบจำลอง 2 ระดับแยกกันหรือหากคุณมีไม่กี่ประเทศคุณสามารถพิจารณาใช้ประเทศเป็นแบบทำนาย 2 ระดับในแบบจำลอง 2 ระดับ
Patrick Coulombe

สวัสดี @gung ฉันไม่อยู่ฉันจะดูพวกเขาตอนนี้
Peter Flom

คำตอบ:


6

คำถามนั้นล้าสมัย แต่ฉันคิดว่ามันสำคัญมาก คำตอบที่ดีที่สุดที่ฉันจะได้รับคือจาก Joop J Hox (2010) หนังสือ "เทคนิคและแอพพลิเคชั่นการวิเคราะห์หลายระดับรุ่นที่สอง"

สมมติว่าข้อมูลลำดับชั้นสองระดับมีตัวแปรอธิบายที่ระดับต่ำสุดและตัวแปรอธิบายqที่ระดับสูงสุด จากนั้นที่หน้า 55 เขาเขียนว่า:pq

แบบจำลองการถดถอยระดับเดียวแบบธรรมดาสำหรับข้อมูลเดียวกันจะประมาณเฉพาะการสกัดกั้นความแปรปรวนของข้อผิดพลาดเดียวและความชันการถดถอย p + q ความเหนือกว่าของตัวแบบการถดถอยแบบหลายระดับนั้นชัดเจนถ้าเราพิจารณาว่าข้อมูลถูกรวมกลุ่มเป็นกลุ่ม หากเรามี 100 กลุ่มการประเมินโมเดลการถดถอยพหุคูณสามัญในแต่ละกลุ่มต้องแยกกันประมาณ 100 × (1 การสกัดกั้นการถดถอย + 1 ความแปรปรวนที่เหลือ + 1 ความชันการถดถอย p) และการโต้ตอบที่เป็นไปได้กับตัวแปรระดับกลุ่ม q การถดถอยหลายระดับจะแทนที่การประมาณ 100 จุดตัดโดยประมาณค่าตัดเฉลี่ยและความแปรปรวนตกค้างในกลุ่มโดยถือว่าการแจกแจงแบบปกติสำหรับส่วนที่เหลือเหล่านี้ ดังนั้น, การวิเคราะห์การถดถอยแบบหลายระดับแทนที่การประมาณ 100 ค่าแยกโดยการประมาณค่าพารามิเตอร์สองค่า (ค่าเฉลี่ยและความแปรปรวนของค่าจุดตัด) รวมถึงข้อสมมติเชิงบรรทัดฐาน การทำให้เข้าใจง่ายแบบเดียวกันนั้นใช้สำหรับความชันการถดถอย แทนที่จะประเมินค่าความลาดชัน 100 ค่าสำหรับเพศนักเรียนตัวแปรอธิบายเราประเมินค่าความชันเฉลี่ยพร้อมกับความแปรปรวนข้ามกลุ่มและสมมติว่าการกระจายตัวของความลาดชันเป็นเรื่องปกติ อย่างไรก็ตามถึงแม้จะมีตัวแปรอธิบายจำนวนเล็กน้อยการวิเคราะห์การถดถอยแบบหลายระดับก็แสดงถึงรูปแบบที่ซับซ้อน โดยทั่วไปเราไม่ต้องการที่จะประเมินแบบจำลองที่สมบูรณ์ก่อนเพราะสิ่งนี้มีแนวโน้มที่จะทำให้เรามีปัญหาด้านการคำนวณ แต่ก็เป็นเพราะมันยากมากที่จะตีความแบบจำลองที่ซับซ้อนเช่นนี้

นั่นคือคำอธิบาย ตอนนี้หน้า 29-30 จะตอบคำถามของคุณอย่างแม่นยำยิ่งขึ้น

การสกัดกั้นและความชันที่คาดการณ์สำหรับ 100 คลาสนั้นไม่เหมือนกันกับค่าที่เราจะได้รับถ้าเราทำการวิเคราะห์การถดถอยแบบสามัญ 100 ครั้งแยกกันในแต่ละคลาส 100 โดยใช้เทคนิคมาตรฐานธรรมดากำลังสองน้อยที่สุด (OLS) ถ้าเราจะเปรียบเทียบผลลัพธ์จากการวิเคราะห์การถดถอย OLS แยก 100 รายการกับค่าที่ได้จากการวิเคราะห์การถดถอยแบบหลายระดับเราจะพบว่าผลลัพธ์จากการวิเคราะห์แยกเป็นตัวแปรที่มากกว่า นี่เป็นเพราะการประมาณค่าหลายระดับของสัมประสิทธิ์การถดถอยของคลาส 100 นั้นมีน้ำหนัก พวกเขาเรียกว่า Empirical Bayes (EB) หรือการประเมินการหดตัว: ค่าเฉลี่ยถ่วงน้ำหนักของการประมาณค่า OLS เฉพาะในแต่ละชั้นเรียนและค่าสัมประสิทธิ์การถดถอยโดยรวมซึ่งประมาณไว้สำหรับคลาสที่คล้ายกันทั้งหมด

เป็นผลให้สัมประสิทธิ์การถดถอยหดกลับไปสู่สัมประสิทธิ์เฉลี่ยสำหรับชุดข้อมูลทั้งหมด น้ำหนักการหดตัวขึ้นอยู่กับความน่าเชื่อถือของค่าสัมประสิทธิ์โดยประมาณ ค่าสัมประสิทธิ์ที่ประเมินด้วยความแม่นยำขนาดเล็กจะหดตัวมากกว่าค่าสัมประสิทธิ์โดยประมาณที่แม่นยำมาก ความแม่นยำในการประมาณค่าขึ้นอยู่กับปัจจัยสองประการคือขนาดตัวอย่างของกลุ่มและระยะห่างระหว่างการประมาณตามกลุ่มและการประมาณโดยรวม การประมาณการสำหรับกลุ่มเล็ก ๆ มีความน่าเชื่อถือน้อยกว่าและหดตัวมากกว่าการประมาณการสำหรับกลุ่มใหญ่ สิ่งอื่น ๆ ที่เท่าเทียมกันการประมาณการที่อยู่ไกลจากการประมาณการโดยรวมถือว่ามีความน่าเชื่อถือน้อยกว่าและจะหดตัวมากกว่าการประมาณการที่ใกล้เคียงกับค่าเฉลี่ยโดยรวม วิธีการทางสถิติที่ใช้เรียกว่าการประเมินเชิงประจักษ์เบย์ เนื่องจากผลการหดตัวนี้ ตัวประมาณเบย์เชิงประจักษ์จะลำเอียง อย่างไรก็ตามพวกเขามักจะมีความแม่นยำมากขึ้นซึ่งเป็นคุณสมบัติที่มักจะมีประโยชน์มากกว่าที่จะเป็นอิสระ (ดู Kendall, 1959)

ฉันหวังว่ามันจะพอใจ


2

การระบุเอฟเฟกต์แบบสุ่มเกี่ยวข้องกับการสันนิษฐานว่าค่าเฉลี่ยของระดับเหล่านั้นเป็นตัวอย่างจากการแจกแจงแบบปกติ ดีกว่าที่จะระบุว่าเป็นเอฟเฟกต์คงที่ตัวแปรจำลองของ AKA หากสมมติฐานนี้ไม่เหมาะกับข้อมูลของคุณ ด้วยวิธีนี้คุณสามารถควบคุมความหลากหลายของกลุ่มในระดับเฉลี่ย (ในระดับนั้น) แต่คุณไม่อนุญาตให้มีความหลากหลายในการตอบสนองต่อตัวแปรระดับล่างของคุณ

หากคุณคาดหวังความแตกต่างในการตอบสนองต่อตัวแปรอธิบายระดับล่างของคุณแบบจำลองที่แยกต่างหากจะสมเหตุสมผลถ้าคุณไม่ต้องการเรียกใช้แบบจำลองสัมประสิทธิ์แบบสุ่ม

(ฉันเชื่อว่ามีวิธีการสำหรับเอฟเฟกต์แบบสุ่มที่ไม่ปกติ แต่ไม่มีอะไรที่ใช้กันอย่างแพร่หลายหรือเข้าถึงได้เช่น lme)


1

ข้อได้เปรียบ: ความสามารถในการทดสอบความแตกต่างของพารามิเตอร์โดยกลุ่มอย่างชัดเจน (เช่นความแตกต่างอย่างมีนัยสำคัญไม่ได้หมายถึงความแตกต่างที่สำคัญ)


2
คำตอบนี้สั้นเกินไป มีความคิดเห็นมากกว่าคำตอบ
Eric Peterson
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.