ฉันใช้การถดถอยแบบอิง GAM โดยใช้gamlssแพ็คเกจ R และสมมติว่ามีการกระจายข้อมูลเบต้าที่ไม่มีศูนย์ mymodel = gamlss(response ~ input, family=BEZI)
ฉันมีเพียงตัวแปรอธิบายเดียวในรูปแบบของฉันดังนั้นมันเป็นพื้น:
อัลกอริทึมทำให้ฉันสัมประสิทธิ์สำหรับผลกระทบของตัวแปรอธิบายในค่าเฉลี่ย ( ) และค่า p ที่เกี่ยวข้องสำหรับคล้าย:
Mu link function: logit
Mu Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.58051 0.03766 -68.521 0.000e+00
input -0.09134 0.01683 -5.428 6.118e-08
ดังที่คุณเห็นในตัวอย่างด้านบนสมมติฐานของถูกปฏิเสธด้วยความมั่นใจสูง
จากนั้นฉันเรียกใช้โมเดลว่าง: null = gamlss(response ~ 1, family=BEZI)
และเปรียบเทียบความน่าจะเป็นโดยใช้การทดสอบอัตราส่วนความน่าจะเป็น:
p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).
ในหลายกรณีฉันได้รับแม้ว่าค่าสัมประสิทธิ์ที่อินพุตมีการรายงานว่ามีความสำคัญสูง (ดังกล่าวข้างต้น) ฉันพบว่ามันค่อนข้างผิดปกติ - อย่างน้อยก็ไม่เคยเกิดขึ้นกับประสบการณ์ของฉันกับการถดถอยเชิงเส้นหรือโลจิสติก
คำถามของฉันคือ: ฉันยังสามารถไว้วางใจการพึ่งพาระหว่างการตอบสนองและการป้อนข้อมูลเมื่อเป็นกรณีนี้ได้หรือไม่?