เมื่อใดที่จะใช้สมการการประมาณแบบทั่วไปกับแบบจำลองเอฟเฟกต์แบบผสม


63

ฉันมีความสุขมากที่ใช้โมเดลเอฟเฟกต์ผสมอยู่พักหนึ่งแล้วด้วยข้อมูลระยะยาว ฉันหวังว่าฉันจะสามารถปรับความสัมพันธ์ AR ใน lmer (ฉันคิดว่าฉันถูกต้องที่ฉันไม่สามารถทำได้?) แต่ฉันไม่คิดว่ามันสำคัญอย่างยิ่งดังนั้นฉันจึงไม่ต้องกังวลมากเกินไป

ฉันเพิ่งเจอสมการการประมาณทั่วไป (GEE) และดูเหมือนว่าพวกเขาจะมีความยืดหยุ่นมากกว่ารุ่น ME

เมื่อมีความเสี่ยงในการถามคำถามทั่วไปมีคำแนะนำใดที่เหมาะกับภารกิจที่แตกต่างกันหรือไม่? ฉันเคยเห็นเอกสารเปรียบเทียบพวกเขาและพวกเขามีแนวโน้มที่จะเป็นของแบบฟอร์ม:

"ในพื้นที่ที่มีความเชี่ยวชาญสูงนี้อย่าใช้ GEEs สำหรับ X อย่าใช้รุ่น ME สำหรับ Y"

ฉันไม่พบคำแนะนำทั่วไปอีกแล้ว มีใครสอนฉันได้ไหม

ขอขอบคุณ!


1
"ดูเหมือนว่าพวกเขาจะมีความยืดหยุ่นมากขึ้น" ... พวกเขายังแตกต่างกันในแนวทางของพวกเขาเนื่องจาก GEEs ถูกใช้เพื่อให้พอดีกับการกระจายที่ขอบ
chl


โปรดทราบว่าglmmPQLสามารถปรับให้เหมาะสมกับโครงสร้างความสัมพันธ์ AR
Tom Wenseleers

ความสัมพันธ์แบบ AR คืออะไร
สถิติการเรียนรู้ตามตัวอย่าง

@incodeveritas โครงสร้างความแปรปรวนร่วมแบบอัตโนมัติ
Tommyixi

คำตอบ:


56

ใช้ GEE เมื่อคุณสนใจที่จะเปิดเผยผลกระทบของค่าเฉลี่ยประชากรของตัวแปรร่วมกับผลกระทบเฉพาะแต่ละอย่าง สองสิ่งนี้เทียบเท่าในแบบจำลองเชิงเส้นเท่านั้น แต่ไม่ใช่แบบเชิงเส้น (เช่นลอจิสติก) หากต้องการดูสิ่งนี้ให้ทำตัวอย่างเช่นโมเดลสุ่มเอฟเฟ็กต์เอฟเฟกต์ของการสังเกต 'th ของหัวเรื่อง , ;jiYij

log(pij1pij)=μ+ηi

ที่เป็นผลสุ่มสำหรับเรื่องและ{i})ηiN(0,σ2)ipij=P(Yij=1|ηi)

หากคุณใช้แบบจำลองเอฟเฟกต์แบบสุ่มกับข้อมูลเหล่านี้คุณจะได้รับการประมาณที่อธิบายถึงความจริงที่ว่าค่าเฉลี่ยของการก่อกวนที่ศูนย์ค่าเฉลี่ยถูกนำไปใช้กับแต่ละคนμ

หากคุณใช้ GEE กับข้อมูลเหล่านี้คุณจะประมาณอัตราต่อรองของค่าเฉลี่ยประชากร ในกรณีนี้ก็คงจะเป็น

ν=log(Eη(11+eμηi)1Eη(11+eμηi))

νμโดยทั่วไป ตัวอย่างเช่นถ้าและแล้ว0.83 แม้ว่าเอฟเฟกต์แบบสุ่มจะมีค่าเฉลี่ยเป็นศูนย์ในสเกลที่แปลง (หรือเชื่อมโยง ) ผลของมันจะไม่ได้เป็นศูนย์ในสเกลดั้งเดิมของข้อมูล ลองจำลองข้อมูลบางส่วนจากโมเดลการถดถอยโลจิสติกเอฟเฟ็กต์เอฟเฟ็กต์และเปรียบเทียบค่าเฉลี่ยระดับประชากรกับอินเวอร์ส - โลจิทของการสกัดกั้นและคุณจะเห็นว่ามันไม่เท่ากันดังตัวอย่างนี้ ความแตกต่างในการตีความของค่าสัมประสิทธิ์นี้คือความแตกต่างพื้นฐานระหว่าง GEE และสุ่มแบบจำลองผลกระทบμ=1σ2=1ν.83

แก้ไข:โดยทั่วไปโมเดลผสมเอฟเฟกต์ที่ไม่มีตัวทำนายสามารถเขียนได้ดังนี้

ψ(E(Yij|ηi))=μ+ηi

โดยที่เป็นฟังก์ชั่นลิงก์ เมื่อไรก็ตามψ

ψ(Eη(ψ1(E(Yij|ηi))))Eη(E(Yij|ηi))

จะมีความแตกต่างระหว่างค่าสัมประสิทธิ์ค่าเฉลี่ยประชากร (GEE) และค่าสัมประสิทธิ์เฉพาะบุคคล (แบบจำลองเอฟเฟกต์แบบสุ่ม) นั่นคือค่าเฉลี่ยเปลี่ยนแปลงโดยการแปลงข้อมูลการรวมเอฟเฟกต์แบบสุ่มในสเกลที่ถูกแปลงแล้วเปลี่ยนกลับ โปรดสังเกตว่าในโมเดลเชิงเส้น (นั่นคือ ) ความเสมอภาคนั้นมีอยู่ดังนั้นพวกมันจึงมีค่าเท่ากันψ(x)=x

แก้ไข 2:นอกจากนี้ยังเป็นที่น่าสังเกตว่าข้อผิดพลาดมาตรฐานแซนวิชประเภท "แข็งแกร่ง" ที่ผลิตโดยรุ่น GEE ให้ช่วงความเชื่อมั่นแบบ asymptotic ที่ถูกต้อง (เช่นจริง ๆ แล้วครอบคลุม 95% ของเวลา) แม้ว่าโครงสร้างความสัมพันธ์ที่ระบุไว้ในโมเดลนั้น แก้ไข.

แก้ไข 3:หากความสนใจของคุณอยู่ในการทำความเข้าใจโครงสร้างการเชื่อมโยงในข้อมูลการประเมิน GEE ของการเชื่อมโยงนั้นไม่มีประสิทธิภาพอย่างมาก (และบางครั้งก็ไม่สอดคล้องกัน) ฉันเห็นการอ้างอิงสำหรับสิ่งนี้ แต่ไม่สามารถวางได้ในขณะนี้


3
(+1) เกี่ยวกับการแก้ไขครั้งที่สองของคุณฉันจะเพิ่มตัวประมาณค่าความแปรปรวนแบบจำลองจะทำงานได้ดีขึ้นกับกลุ่มจำนวนน้อย (หรือเราสามารถใช้ตัวประมาณค่าของ Jacknife) สำหรับการอ้างอิงฉันมักจะชี้ไปที่gbi.agrsci.dk/statistics/courses/phd07/material/Day10ซึ่งมีบันทึกการบรรยายที่ดีมาก (พื้นหลังสถิติรวมถึงการเปรียบเทียบวิธี GEE กับ GLMM + ภาพประกอบใน R) .
chl

ว้าวคำตอบที่ดีคืออะไร ขอบคุณมาก ๆ. นั่นคือทั้งหมดที่ฉันกำลังมองหา และขอบคุณ chl ด้วยเช่นกันสำหรับลิงก์ +10 internets ให้คุณทั้งคู่
Chris Beeley

อย่า GEE ของยังถือว่าผลระดับที่สูงขึ้นเป็นพารามิเตอร์ที่น่ารำคาญ? สำหรับฉันแล้วมันเป็นความแตกต่างที่สำคัญอีกอย่างหนึ่ง - หากมีใครสนใจผลกระทบเหล่านั้น GEE ก็จะไม่ให้คุณ หรือหากคุณไม่สะดวกในการตั้งสมมติฐานการกระจายเหล่านั้น GEE ก็น่าจะเหมาะสมกว่า
robin.datadrivers

ลิงก์ที่ @chl ให้ไว้นั้นตายแล้ว: / (หกปีต่อมาเป็นเรื่องที่คาดหวังใช่มั้ย)
Guilherme Marthe

@ GuilhermeMarthe จับได้ดีมาก! แต่น่าเสียดายที่ฉันเชื่อมโยงไปยังเนื้อหาเดียวกันในหัวข้ออื่น ฉันเห็นสองตัวเลือก: อ้างอิงแพ็คเกจ Geepack R (พัฒนาโดยผู้เขียนสองคนเดียวกัน) หรือใช้เครื่อง WayBackในขณะนั้น
chl

10

GEE ในใจของฉันมีประโยชน์มากที่สุดเมื่อเราไม่ได้ใช้การสร้างแบบจำลองแบบเบย์และเมื่อไม่สามารถหาวิธีแก้ปัญหาแบบเต็มรูปแบบได้ นอกจากนี้ GEE อาจต้องการขนาดตัวอย่างขนาดใหญ่ขึ้นเพื่อให้มีความแม่นยำเพียงพอและเป็นข้อมูลระยะยาวที่ไม่คงทนและไม่ขาดหาย GEE ถือว่าไม่มีการสุ่มอย่างสมบูรณ์ในขณะที่วิธีความน่าจะเป็น (แบบจำลองเอฟเฟกต์แบบผสมหรือกำลังสองน้อยที่สุดเป็นต้น) ถือว่าหายไปโดยการสุ่มเท่านั้น


1

คุณสามารถค้นหาการสนทนาอย่างละเอียดและตัวอย่างที่เป็นรูปธรรมใน Fitzmaurice, Laird and Ware, การวิเคราะห์ตามยาวประยุกต์ , John Wiley & Sons, 2011, รุ่นที่ 2, บทที่ 11-16

ในฐานะที่เป็นตัวอย่างที่คุณสามารถหาชุดข้อมูลและโปรแกรม SAS / Stata / R ในเว็บไซต์สหาย


2
คุณสามารถสรุปประเด็นหลักของหนังสือเล่มนี้ได้ไหม
chl

2
ฉันจะบอกว่ามาโครได้ทำมันไปแล้ว ;-) ในหนังสือคุณสามารถค้นหาการสนทนาที่ยาวและละเอียดยิ่งขึ้นตัวอย่างการวิเคราะห์ตัวเลขและกราฟิกและจุดอื่น ๆ อีกมากมาย นอกจากนี้คุณยังสามารถดูที่บล็อกของ Gelman
Sergio
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.