ใช้ GEE เมื่อคุณสนใจที่จะเปิดเผยผลกระทบของค่าเฉลี่ยประชากรของตัวแปรร่วมกับผลกระทบเฉพาะแต่ละอย่าง สองสิ่งนี้เทียบเท่าในแบบจำลองเชิงเส้นเท่านั้น แต่ไม่ใช่แบบเชิงเส้น (เช่นลอจิสติก) หากต้องการดูสิ่งนี้ให้ทำตัวอย่างเช่นโมเดลสุ่มเอฟเฟ็กต์เอฟเฟกต์ของการสังเกต 'th ของหัวเรื่อง , ;jiYij
log(pij1−pij)=μ+ηi
ที่เป็นผลสุ่มสำหรับเรื่องและ{i})ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
หากคุณใช้แบบจำลองเอฟเฟกต์แบบสุ่มกับข้อมูลเหล่านี้คุณจะได้รับการประมาณที่อธิบายถึงความจริงที่ว่าค่าเฉลี่ยของการก่อกวนที่ศูนย์ค่าเฉลี่ยถูกนำไปใช้กับแต่ละคนμ
หากคุณใช้ GEE กับข้อมูลเหล่านี้คุณจะประมาณอัตราต่อรองของค่าเฉลี่ยประชากร ในกรณีนี้ก็คงจะเป็น
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μโดยทั่วไป ตัวอย่างเช่นถ้าและแล้ว0.83 แม้ว่าเอฟเฟกต์แบบสุ่มจะมีค่าเฉลี่ยเป็นศูนย์ในสเกลที่แปลง (หรือเชื่อมโยง ) ผลของมันจะไม่ได้เป็นศูนย์ในสเกลดั้งเดิมของข้อมูล ลองจำลองข้อมูลบางส่วนจากโมเดลการถดถอยโลจิสติกเอฟเฟ็กต์เอฟเฟ็กต์และเปรียบเทียบค่าเฉลี่ยระดับประชากรกับอินเวอร์ส - โลจิทของการสกัดกั้นและคุณจะเห็นว่ามันไม่เท่ากันดังตัวอย่างนี้ ความแตกต่างในการตีความของค่าสัมประสิทธิ์นี้คือความแตกต่างพื้นฐานระหว่าง GEE และสุ่มแบบจำลองผลกระทบμ=1σ2=1ν≈.83
แก้ไข:โดยทั่วไปโมเดลผสมเอฟเฟกต์ที่ไม่มีตัวทำนายสามารถเขียนได้ดังนี้
ψ(E(Yij|ηi))=μ+ηi
โดยที่เป็นฟังก์ชั่นลิงก์ เมื่อไรก็ตามψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
จะมีความแตกต่างระหว่างค่าสัมประสิทธิ์ค่าเฉลี่ยประชากร (GEE) และค่าสัมประสิทธิ์เฉพาะบุคคล (แบบจำลองเอฟเฟกต์แบบสุ่ม) นั่นคือค่าเฉลี่ยเปลี่ยนแปลงโดยการแปลงข้อมูลการรวมเอฟเฟกต์แบบสุ่มในสเกลที่ถูกแปลงแล้วเปลี่ยนกลับ โปรดสังเกตว่าในโมเดลเชิงเส้น (นั่นคือ ) ความเสมอภาคนั้นมีอยู่ดังนั้นพวกมันจึงมีค่าเท่ากันψ(x)=x
แก้ไข 2:นอกจากนี้ยังเป็นที่น่าสังเกตว่าข้อผิดพลาดมาตรฐานแซนวิชประเภท "แข็งแกร่ง" ที่ผลิตโดยรุ่น GEE ให้ช่วงความเชื่อมั่นแบบ asymptotic ที่ถูกต้อง (เช่นจริง ๆ แล้วครอบคลุม 95% ของเวลา) แม้ว่าโครงสร้างความสัมพันธ์ที่ระบุไว้ในโมเดลนั้น แก้ไข.
แก้ไข 3:หากความสนใจของคุณอยู่ในการทำความเข้าใจโครงสร้างการเชื่อมโยงในข้อมูลการประเมิน GEE ของการเชื่อมโยงนั้นไม่มีประสิทธิภาพอย่างมาก (และบางครั้งก็ไม่สอดคล้องกัน) ฉันเห็นการอ้างอิงสำหรับสิ่งนี้ แต่ไม่สามารถวางได้ในขณะนี้