โมเดลการสกัดกั้นแบบสุ่มเทียบกับ GEE


11

พิจารณาแบบจำลองเชิงเส้นตัดขวางแบบสุ่ม นี่เทียบเท่ากับการถดถอยเชิงเส้น GEE กับเมทริกซ์สหสัมพันธ์การทำงานที่แลกเปลี่ยนได้ สมมติว่ามีการพยากรณ์และและค่าสัมประสิทธิ์สำหรับพยากรณ์เหล่านี้เป็น ,และ\การตีความสัมประสิทธิ์ในการสกัดกั้นแบบสุ่มคืออะไร? มันเหมือนกับการถดถอยเชิงเส้นของ GEE ยกเว้นว่าอยู่ในระดับบุคคลหรือไม่?x1,x2,x3β1β2β3

คำตอบ:


11

GEE และสัมประสิทธิ์โมเดลผสมมักจะไม่คิดเหมือนกัน สัญกรณ์ที่มีประสิทธิภาพสำหรับสิ่งนี้คือการแสดงให้เห็นถึงเวกเตอร์สัมประสิทธิ์ GEE เป็น (ผลกระทบส่วนเพิ่ม) และเวกเตอร์สัมประสิทธิ์โมเดลผสมเป็น (ผลตามเงื่อนไข) เห็นได้ชัดว่าเอฟเฟ็กต์เหล่านี้จะแตกต่างกันไปสำหรับฟังก์ชั่นลิงค์ที่ไม่ยุบเนื่องจาก GEE จะเฉลี่ยค่าอินสแตนซ์ของลิงก์ตามเงื่อนไขในการทำซ้ำหลาย ๆ ครั้ง ข้อผิดพลาดมาตรฐานสำหรับผลกระทบเล็กน้อยและเงื่อนไขก็จะเห็นได้ชัดว่าจะแตกต่างกันβ(m)β(c)

ปัญหาข้อที่สามที่มองข้ามคือการสะกดผิดโมเดล GEE ให้การประกันภัยมหาศาลแก่คุณเมื่อเทียบกับการออกจากโมเดล เนื่องจากการประเมินข้อผิดพลาดที่มีประสิทธิภาพค่าสัมประสิทธิ์เชิงเส้นของ GEE ที่ใช้ลิงก์ตัวตนสามารถตีความได้ว่าเป็นแนวโน้มอันดับหนึ่งโดยเฉลี่ย แบบผสมจะให้อะไรที่คล้ายกันกับคุณ แต่มันจะแตกต่างกันเมื่อแบบจำลองนั้นผิดพลาด


+1 ประเด็นเกี่ยวกับความแตกต่างของคุณถึงแม้จะเป็นโมเดลเชิงเส้น แต่การสะกดผิดที่ไม่มีตัวตนเป็นสิ่งที่ดี ตัวอย่างการทำงานเล็ก ๆ ที่แสดงให้เห็นว่านี่เป็นส่วนเสริมที่ยอดเยี่ยมมากหากคุณสนใจที่จะจัดหามัน
gung - Reinstate Monica

@AdamO: สมมติว่าคุณวัดความดันโลหิตได้ 10 ครั้งต่อคน 100 ครั้ง ในกรณีนี้จะมีการสกัดแบบสุ่ม 100 อัน?
ผู้ชายที่

@guy มีวิธีการวิเคราะห์ข้อมูลดังกล่าวจำนวนเท่าใด แน่นอนถ้าคุณสนใจระดับเฉลี่ยของ BP และการปรับความแปรปรวนของ intracluster ดังนั้นโมเดลการสกัดแบบสุ่มเป็นทางเลือกที่ดี บางครั้งคุณต้องจัดการกับเอฟเฟ็กต์ของเวลาด้วยความลาดชันแบบสุ่ม AR-1 หรือเอฟเฟกต์คงที่ซึ่งเพิ่มรอยย่นอีกครั้ง ดังนั้นโดยทั่วไปคำตอบขึ้นอยู่กับคำถาม
AdamO

4

GEE ประมาณการผลกระทบของประชากรโดยเฉลี่ย แบบจำลองการสกัดกั้นแบบสุ่มประมาณการความแปรปรวนของผลกระทบเหล่านี้ ถ้า ,โมเดลการสกัดกั้นแบบสุ่มจะประเมินทั้ง (ซึ่งเป็นค่าเฉลี่ยของการสกัดกั้นประชากรและในโมเดลเชิงเส้นปกติมีค่าเท่ากับหนึ่งที่ประมาณการโดย GEE) และ\αj=γ0+ηjηjN(0,σα2)γ0σα2

หากการสกัดกั้นถูกสร้างแบบจำลองโดยตัวทำนายระดับที่สองเช่นแบบจำลองการสกัดกั้นแบบสุ่มสามารถประมาณการว่าการสกัดกั้นแตกต่างกันไปในแต่ละระดับ id ตามเศรษฐกิจปัจจัยด้านประชากรศาสตร์ที่คุ้นเคย ฯลฯ ถึง 'กลุ่ม' ซึ่งเป็นบุคคลที่เฉพาะเจาะจงαj=γ0+γ1wj+ηj


ใน GEEเป็นเพียงพารามิเตอร์รบกวนในรูปแบบการสกัดกั้นแบบสุ่มทำให้การอนุมานเฉพาะเรื่องเป็นไปได้ ดูกระดาษนี้ σα2σ^α2
Sergio

คุณคิดว่าพารามิเตอร์นอกแนวทแยงของเมทริกซ์สหสัมพันธ์แบบแลกเปลี่ยนได้สอดคล้องกับอะไร มันคือโดยที่คือความแปรปรวนของคำที่ผิดพลาด มันอาจจะเป็นเรื่องที่น่ารำคาญ แต่ก็ยังมีการประเมิน! σα2/(σα2+σϵ2)σϵ2
jsk

คุณบอกได้ไหมว่า GEE ประมาณการอย่างสม่ำเสมอ ? σα2
Sergio

GEE น่าสนใจเนื่องจากมีการประมาณค่าคงที่ของเอฟเฟกต์แม้ว่าโมเดลความแปรปรวนจะได้รับการสะกดผิดแต่ไม่มีโมเดลความแปรปรวน 'ที่แท้จริง' คุณจะไม่สามารถรับการประเมินแบบสุ่มที่สม่ำเสมอได้ นอกจากนี้ในขณะที่เอฟเฟกต์คงต้องใช้ช่วงเวลาการสั่งซื้อที่สองการคาดการณ์ผลเอฟเฟ็กต์ที่สม่ำเสมอจะต้องใช้ช่วงเวลาการสั่งซื้อลำดับที่สี่ ( ที่นี่หน้า 139) สุดท้าย แต่ไม่ท้ายสุดตัวเลือกของเมทริกซ์การทำงานมีวัตถุประสงค์เพื่อลดจำนวนของพารามิเตอร์ที่สร้างความรำคาญ (Lang Wu, โมเดลเอฟเฟกต์แบบผสมสำหรับข้อมูลที่ซับซ้อน, หน้า 340)
Sergio

สิ่งนี้ดูเหมือนจะขาดจุดปัจจุบันของการเปรียบเทียบโมเดลเชิงเส้นผสมกับการสกัดกั้นแบบสุ่มกับ GEE ที่มีความสัมพันธ์ที่แลกเปลี่ยนได้ ทั้งสองรุ่นจะมีการประมาณค่าความแปรปรวนที่ไม่สอดคล้องกันโดยไม่มีแบบจำลองความแปรปรวนที่แท้จริง ทั้งหมดที่ฉันสนใจในการโต้แย้งคือการอ้างว่าคุณมีความสัมพันธ์ที่แลกเปลี่ยนได้ไม่ได้วัดความแปรปรวนของเอฟเฟกต์แบบสุ่ม
jsk
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.