ฉันคิดว่าปัญหาหลัก ๆ ของการวัดสำหรับการถดถอยโลจิสติกส์คือคุณกำลังเผชิญกับตัวแบบที่มีค่าเสียงที่รู้จัก สิ่งนี้แตกต่างจากการถดถอยเชิงเส้นมาตรฐานซึ่งระดับเสียงมักจะถูกปฏิบัติเหมือนไม่ทราบ สำหรับเราสามารถเขียนฟังก์ชันความหนาแน่นของความน่าจะเป็น GLM ได้ดังนี้:R2
f(yi|μi,ϕ)=exp(yib(μi)−c(μi)ϕ+d(yi,ϕ))
โดยที่เป็นฟังก์ชันที่รู้จักและสำหรับฟังก์ชันลิงก์ผกผัน(.) หากเรากำหนดค่าเบี่ยงเบนมาตรฐาน GLM ตามปกติเป็นb(.), c(.), d(.;.)μi=g−1(xTiβ)g−1(.)
d2i=2ϕ(log[f(yi|μi=yi,ϕ)]−log[f(yi|μi=μ^i,ϕ)])=2ϕ[yib(yi)−yib(μ^i)−c(yi)+c(μ^i)]
พวกเรามี (ผ่านอัตราส่วนความน่าจะเป็นไคสแควร์, )χ2=1ϕ∑Ni=1d2i
E(∑i=1Nd2i)=E(ϕχ2)≈(N−p)ϕ
ที่ไหนเป็นมิติของ\สำหรับการถดถอยโลจิสติกเรามีซึ่งเป็นที่รู้จัก ดังนั้นเราสามารถใช้สิ่งนี้ในการตัดสินใจในระดับที่แน่นอนของสารตกค้างที่ "ยอมรับได้" หรือ "สมเหตุสมผล" ซึ่งมักจะไม่สามารถทำได้สำหรับการถดถอย OLS (ยกเว้นว่าคุณมีข้อมูลก่อนหน้าเกี่ยวกับเสียงรบกวน) คือเราคาดว่าแต่ละอันซ์ที่เหลือจะเกี่ยวกับ1มีจำนวนมากเกินไปและเป็นไปได้ว่าเอฟเฟ็กต์ที่สำคัญหายไปจากรุ่น (under-fitting) มีจำนวนมากเกินไปและเป็นไปได้ว่าจะมีเอฟเฟกต์ซ้ำซ้อนหรือเสแสร้งในโมเดล (สิ่งเหล่านี้อาจหมายถึงการระบุผิดรูปแบบด้วย)pβϕ=11d2i≫1d2i≪1
ตอนนี้สิ่งนี้หมายความว่าปัญหาสำหรับหลอก -คือว่ามันล้มเหลวในการพิจารณาว่าระดับของการเปลี่ยนแปลงแบบทวินามสามารถคาดการณ์ได้ (หากโครงสร้างข้อผิดพลาดทวินามไม่ได้ถูกถาม) ดังนั้นแม้ว่า Nagelkerke จะอยู่ในช่วงตั้งแต่ถึงแต่ก็ยังไม่ได้ปรับขนาดอย่างเหมาะสม นอกจากนี้ฉันไม่สามารถเห็นได้ว่าทำไมสิ่งเหล่านี้เรียกว่าหลอกหากพวกเขาไม่เท่ากับปกติเมื่อคุณใส่ "GLM" ด้วยลิงก์ประจำตัวและข้อผิดพลาดปกติ ตัวอย่างเช่น cox-snell เทียบเท่า R-squared สำหรับข้อผิดพลาดปกติ (ใช้การประมาณค่าความแปรปรวน REML) โดย:R201R2R2
R2CS=1−exp(−N−pN⋅R2OLS1−R2OLS)
ซึ่งดูแปลก ๆ อย่างแน่นอน
ฉันคิดว่าดีกว่า "ความดีของ Fit" มาตรการคือผลรวมของเหลืออันซ์ที่ 2 นี่เป็นเพราะเรามีเป้าหมายที่จะตั้งเป้าหมายไว้χ2