ความแตกต่างระหว่างสมการการประมาณทั่วไปกับ GLMM คืออะไร


27

ฉันใช้ GEE กับข้อมูลที่ไม่สมดุล 3 ระดับโดยใช้ลิงก์ logit สิ่งนี้แตกต่างกันอย่างไร (ในแง่ของข้อสรุปที่ฉันสามารถวาดและความหมายของสัมประสิทธิ์) จาก GLM ที่มีเอฟเฟกต์ผสม (GLMM) และลิงก์ logit ได้อย่างไร

รายละเอียดเพิ่มเติม: ข้อสังเกตคือการทดลอง bernoulli เดี่ยว พวกเขาถูกจัดกลุ่มเป็นห้องเรียนและโรงเรียน ใช้การละเว้น R. Casewise ของ NAs 6 ทำนายยังมีเงื่อนไขการโต้ตอบ

(ฉันไม่พลิกเด็ก ๆ เพื่อดูว่าพวกเขาขึ้นหัว)

ฉันอยากจะอธิบายค่าสัมประสิทธิ์ของอัตราต่อรอง สิ่งนี้มีความหมายเหมือนกันทั้งสองอย่างหรือไม่?

มีบางสิ่งที่ซุ่มซ่อนอยู่ในใจของฉันเกี่ยวกับ "ความหมายส่วนเพิ่ม" ในรุ่น GEE ฉันต้องการบิตนั้นอธิบายให้ฉัน

ขอบคุณ


คำตอบ:


44

ในแง่ของการตีความสัมประสิทธิ์มีความแตกต่างในกรณีไบนารี (ในหมู่อื่น ๆ ) สิ่งที่แตกต่างระหว่าง GEE และ GLMM คือเป้าหมายของการอนุมาน: ค่าเฉลี่ยประชากรหรือเฉพาะเรื่องเรื่องที่เฉพาะเจาะจง

ลองพิจารณาตัวอย่างง่ายๆที่เกี่ยวข้องกับคุณ คุณต้องการสร้างแบบจำลองอัตราความล้มเหลวระหว่างเด็กชายกับเด็กหญิงในโรงเรียน เช่นเดียวกับโรงเรียน (ประถมศึกษา) ส่วนใหญ่ประชากรของนักเรียนแบ่งออกเป็นห้องเรียน คุณสังเกตการตอบสนองไบนารีจากn ฉันเด็ก ๆ ในNห้องเรียน (เช่นΣ N ฉัน= 1 n ฉันตอบสนองไบนารีคลัสเตอร์โดยสอนในชั้นเรียน) ที่Y ฉันJ = 1ถ้านักเรียนJจากห้องเรียนฉันผ่านไปและY ฉันJ = 0ถ้าเขา / เธอล้มเหลว และYniNi=1NniYij=1jiYij=0เป็นผู้ชายและ 0 เป็นอย่างอื่นถ้านักเรียนjจากห้องเรียนixij=1ji

ในการนำคำศัพท์ที่ฉันใช้ในย่อหน้าแรกคุณสามารถคิดว่าโรงเรียนเป็นประชากรและห้องเรียนเป็นวิชาอาสาสมัคร

ก่อนอื่นให้พิจารณา GLMM GLMM เหมาะสมกับโมเดลเอฟเฟ็กต์แบบผสม เงื่อนไขของแบบจำลองบนเมทริกซ์การออกแบบแบบคงที่ (ซึ่งในกรณีนี้ประกอบด้วยการสกัดกั้นและตัวบ่งชี้สำหรับเพศ) และผลกระทบแบบสุ่มใด ๆ ในห้องเรียนที่เรารวมไว้ในแบบจำลอง ในตัวอย่างของเราให้รวมถึงการสกัดกั้นแบบสุ่มซึ่งจะนำความแตกต่างพื้นฐานในอัตราความล้มเหลวระหว่างห้องเรียนมาพิจารณา ดังนั้นเรากำลังสร้างแบบจำลองbi

log(P(Yij=1)P(Yij=0)xij,bi)=β0+β1xij+bi

อัตราต่อรองของความเสี่ยงของความล้มเหลวในโมเดลด้านบนแตกต่างกันไปตามค่าของซึ่งแตกต่างกันในห้องเรียน ดังนั้นการประมาณการเป็นเรื่องเฉพาะbiเรื่องเฉพาะ

ในทางกลับกัน GEE เป็นแบบจำลองที่เหมาะสม เหล่านี้รูปแบบของประชากรเฉลี่ย คุณกำลังสร้างแบบจำลองความคาดหวังตามเงื่อนไขเฉพาะในเมทริกซ์การออกแบบคงที่ของคุณ

log(P(Yij=1)P(Yij=0)xij)=β0+β1xij

ตรงกันข้ามกับโมเดลเอฟเฟกต์ผสมตามที่อธิบายไว้ข้างต้นว่าเงื่อนไขใดในเมทริกซ์การออกแบบคงที่และเอฟเฟกต์แบบสุ่ม ดังนั้นด้วยโมเดลส่วนบนด้านบนที่คุณพูดว่า "ลืมความแตกต่างระหว่างห้องเรียนฉันแค่ต้องการอัตราความล้มเหลวของประชากร (โรงเรียน - ฉลาด) และความสัมพันธ์กับเพศ" คุณพอดีกับแบบจำลองและรับอัตราต่อรองที่เป็นอัตราต่อรองของประชากรโดยเฉลี่ยของความล้มเหลวที่เกี่ยวข้องกับเพศ

ดังนั้นคุณอาจพบว่าการประมาณการของคุณจากแบบจำลอง GEE ของคุณอาจแตกต่างจากการประมาณการของคุณจากแบบจำลอง GLMM ของคุณและนั่นเป็นเพราะพวกเขาไม่ได้ประมาณสิ่งเดียวกัน

(เท่าที่แปลงจากอัตราการบันทึกอัตราต่อรองเป็นอัตราต่อรองโดยการแจกแจงใช่คุณทำไม่ว่าจะเป็นระดับประชากรหรือประมาณการเฉพาะเรื่องของมัน)

หมายเหตุ / วรรณคดีบางส่วน:

สำหรับกรณีเชิงเส้นการประมาณค่าเฉลี่ยประชากรและเรื่องเฉพาะจะเหมือนกัน

Zeger และคณะ 1988แสดงให้เห็นว่าสำหรับการถดถอยโลจิสติก

βM[(16315π)2V+1]-1/2βRE

βMβREV

Molenberghs, Verbeke 2005มีบททั้งหมดเกี่ยวกับแบบจำลองขอบและแบบสุ่ม

ฉันเรียนรู้เกี่ยวกับสิ่งนี้และเนื้อหาที่เกี่ยวข้องในหลักสูตรโดยอ้างอิงจากDiggle, Heagerty, Liang, Zeger 2002ซึ่งเป็นข้อมูลอ้างอิงที่ดีมาก


1
Mike: มันง่ายเกินไปหรือเปล่าที่จะพูดว่า GEE เฉลี่ยโดยใช้เอฟเฟกต์แบบสุ่ม?
B_Miner

3
@B_Miner ไม่ง่ายเกินไปเลยนั่นคือสิ่งที่คุณกำลังทำ :)

3
@ ไมค์ Wierzbicki: คำตอบที่ดีและสะอาดไมค์! รายละเอียดเล็ก ๆ น้อยหนึ่งที่ฉันอาจเพิ่มใน "โน้ต / วรรณกรรมบางส่วน" ของคุณ: GEE และ GLMM จะเหมือนกันในกรณีที่เป็นเส้นตรง (การตอบกลับแบบเกาส์ลิงก์ตัวตน) เฉพาะเมื่อคุณระบุเมทริกซ์สหสัมพันธ์แบบแลกเปลี่ยนได้สำหรับ GEE

ไม่มี GEE เฉพาะเรื่องด้วยใช่ไหม
giordano

@MikeWierzbicki ดังนั้นถ้าฉันเข้าใจคุณอย่างถูกต้อง GEE ก็ไม่มีอะไรมากไปกว่าแบบจำลองเอฟเฟกต์แบบง่าย ๆ โดยไม่มีเอฟเฟกต์แบบสุ่ม
Robin Kramer
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.