ฉันจะตีความความแปรปรวนของเอฟเฟกต์แบบสุ่มได้อย่างไรในโมเดลผสมแบบเส้นตรงทั่วไป


9

ในโลจิสติกส์แบบจำลองเชิงเส้นผสมแบบเชิงเส้นทั่วไป (ครอบครัว = ทวินาม) ฉันไม่รู้วิธีตีความความแปรปรวนของผลกระทบแบบสุ่ม:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

ฉันจะตีความผลลัพธ์ที่เป็นตัวเลขนี้ได้อย่างไร

ฉันมีตัวอย่างของผู้ป่วยไตวายเรื้อรังในการศึกษาแบบหลายศูนย์ ฉันกำลังทดสอบว่าความน่าจะเป็นของผู้ป่วยที่ได้รับการรักษาด้วยยาลดความดันโลหิตเฉพาะนั้นเหมือนกันระหว่างศูนย์หรือไม่ สัดส่วนของผู้ป่วยที่รักษาแตกต่างกันอย่างมากระหว่างศูนย์ แต่อาจเกิดจากความแตกต่างในลักษณะพื้นฐานของผู้ป่วย ดังนั้นฉันจึงประมาณแบบจำลองเชิงเส้นผสมแบบทั่วไป (โลจิสติก) ปรับสำหรับคุณสมบัติหลักของผู้ป่วย นี่คือผลลัพธ์ที่ได้:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

ตัวแปรเชิงปริมาณอยู่กึ่งกลาง ฉันรู้ว่าค่าเบี่ยงเบนมาตรฐานระหว่างโรงพยาบาลของการสกัดกั้นคือ 0.6554 ในระดับ log-odds เนื่องจากการสกัดกั้นคือ -1.804469 ในระดับ log-odds ดังนั้นความน่าจะเป็นที่ได้รับการรักษาด้วย antihypertensive ของผู้ชายอายุเฉลี่ยโดยมีค่าเฉลี่ยในตัวแปรทั้งหมดและการรักษา inmuno A สำหรับศูนย์ "เฉลี่ย" คือ 14.1% . และตอนนี้เริ่มตีความ: ภายใต้สมมติฐานที่ว่าผลสุ่มตามการแจกแจงแบบปกติเราคาดว่าประมาณ 95% ของศูนย์จะมีค่าภายใน 2 ส่วนเบี่ยงเบนมาตรฐานของค่าเฉลี่ยของศูนย์ดังนั้นความน่าจะเป็นที่ได้รับการปฏิบัติต่อคนทั่วไป จะแตกต่างกันระหว่างศูนย์ที่มีช่วงเวลาครอบคลุมของ:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

ถูกต้องหรือไม่

นอกจากนี้ฉันจะทดสอบด้วยความเข้าใจได้อย่างไรถ้าความแปรปรวนระหว่างศูนย์มีนัยสำคัญทางสถิติ? ฉันเคยทำงานกับ MIXNO ซึ่งเป็นซอฟต์แวร์ที่ยอดเยี่ยมของ Donald Hedeker และที่นั่นฉันมีข้อผิดพลาดมาตรฐานของค่าความแปรปรวนโดยประมาณ ฉันจะมีโอกาสที่จะได้รับการปฏิบัติสำหรับชาย "เฉลี่ย" ในแต่ละศูนย์ด้วยช่วงเวลาที่น่าเชื่อถือได้อย่างไร

ขอบคุณ

คำตอบ:


10

อาจเป็นประโยชน์มากที่สุดหากคุณแสดงข้อมูลเพิ่มเติมเกี่ยวกับแบบจำลองของคุณให้เราทราบ แต่: ค่าพื้นฐานของอัตราต่อรองของการตอบสนองของคุณคืออะไร (เช่นความตาย) แตกต่างกันไปตามโรงพยาบาล ค่าพื้นฐาน (ระยะการสกัดกั้นต่อโรงพยาบาล) คืออัตราต่อรองของการเสียชีวิต (หรืออะไรก็ตาม) ในหมวดหมู่พื้นฐาน (เช่น "ไม่ได้รับการรักษา") ที่ค่าศูนย์ของตัวทำนายแบบต่อเนื่องใด ๆ ความผันแปรนั้นจะถูกกระจายตามปกติบนสเกลอัตราต่อรอง ค่าเบี่ยงเบนมาตรฐานระหว่างโรงพยาบาลของการสกัดกั้นคือ 0.6554; ความแปรปรวน (เพียงส่วนเบี่ยงเบนมาตรฐานยืด - ไม่ได้วัดจากความไม่แน่นอนของค่าเบี่ยงเบนมาตรฐาน) เป็น0.65540.65542=0.4295

(หากคุณชี้แจงคำถามของคุณ / เพิ่มรายละเอียดเพิ่มเติมเกี่ยวกับแบบจำลองของคุณฉันสามารถลองพูดได้มากกว่านี้)

อัปเดต : การตีความรูปแบบของคุณดูเหมือนถูกต้อง อย่างแม่นยำมากขึ้น,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

ควรให้ช่วงเวลา 95% กับคุณ (ไม่ใช่ช่วงเวลาที่ค่อนข้างมั่นใจ แต่คล้ายกันมาก) สำหรับความน่าจะเป็นของเส้นฐาน (ชาย / อายุเฉลี่ย / ฯลฯ ) บุคคลที่ได้รับการรักษาในโรงพยาบาล

สำหรับการทดสอบความสำคัญของเอฟเฟกต์แบบสุ่มคุณมีตัวเลือกมากมาย (ดูhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.htmlสำหรับข้อมูลเพิ่มเติม) (โปรดทราบว่าข้อผิดพลาดมาตรฐานของความแปรปรวน RE มักจะไม่ใช่วิธีที่เชื่อถือได้ในการทดสอบนัยสำคัญเนื่องจากการกระจายตัวตัวอย่างมักจะเบ้ / ไม่ปกติ) วิธีที่ง่ายที่สุดคือการทดสอบอัตราส่วนความน่าจะเป็นเช่น

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

การหารสุดท้ายด้วย 2 แก้ไขสำหรับความจริงที่ว่าการทดสอบอัตราส่วนความน่าจะเป็นแบบอนุรักษ์นิยมเมื่อค่า Null (นั่นคือความแปรปรวน RE = 0) อยู่ในขอบเขตของพื้นที่ที่เป็นไปได้ (เช่นความแปรปรวน RE ไม่สามารถ <0)


ฉันแก้ไขคำถาม
2310909

1
ขอบคุณมันเป็นความสุขที่ได้อ่านคนที่รู้ดีเกี่ยวกับเรื่องนี้
user2310909
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.