ที่ดีกว่าการถามคำถามของฉันฉันได้ให้บางส่วนของเอาท์พุทจากทั้งรุ่น 16 ตัวแปร ( fit
) และรุ่น 17 ตัวแปร ( fit2
) ด้านล่าง (ทุกตัวแปรในรูปแบบเหล่านี้เป็นอย่างต่อเนื่องที่แตกต่างระหว่างรุ่นเหล่านี้ก็คือfit
ไม่ได้ มีตัวแปร 17 (var17)):
fit Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13602.84 R2 0.173 C 0.703
0 69833 d.f. 17 g 1.150 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.160 gamma 0.416
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
fit2 Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 102849 LR chi2 13639.70 R2 0.174 C 0.703
0 69833 d.f. 18 g 1.154 Dxy 0.407
1 33016 Pr(> chi2) <0.0001 gr 3.170 gamma 0.412
max |deriv| 3e-05 gp 0.180 tau-a 0.177
Brier 0.190
ฉันใช้rms
แพ็คเกจของ Frank Harrell เพื่อสร้างlrm
แบบจำลองเหล่านี้ อย่างที่คุณเห็นแบบจำลองเหล่านี้จะไม่แตกต่างกันมากนักในกรณีของดัชนีการเลือกปฏิบัติและการเลือกอันดับ ดัชนี ; อย่างไรก็ตามเมื่อใช้lrtest(fit,fit2)
งานฉันได้รับผลลัพธ์ต่อไปนี้:
L.R. Chisq d.f. P
3.685374e+01 1.000000e+00 1.273315e-09
ดังนั้นเราจะปฏิเสธสมมติฐานว่างของการทดสอบอัตราส่วนความน่าจะเป็นนี้ อย่างไรก็ตามฉันคิดว่านี่น่าจะเป็นเพราะกลุ่มตัวอย่างมีขนาดใหญ่ ( n = 102849) เนื่องจากโมเดลเหล่านี้ดูเหมือนจะทำงานในแบบเดียวกัน นอกจากนี้ฉันสนใจที่จะหาวิธีที่ดีกว่าในการเปรียบเทียบแบบจำลองการถดถอยแบบโลจิสติกแบบไบนารีที่ซ้อนกันเมื่อnมีขนาดใหญ่
ฉันขอขอบคุณข้อเสนอแนะสคริปต์ R หรือเอกสารที่สามารถคัดท้ายฉันไปในทิศทางที่ถูกต้องในแง่ของการเปรียบเทียบรุ่นที่ซ้อนกันเหล่านี้! ขอบคุณ!
fit2
เป็นรุ่นที่ 17 ตัวแปร V17
แต่ก็ยังเป็นรูปแบบที่ละเว้น คุณอาจต้องการแก้ไขสิ่งนี้
fit2
ไปfit
ในตัวอย่างข้างต้นเป็นไปตามการแก้ไขของคุณ ขอบคุณ!