ความสำคัญของสัมประสิทธิ์การถดถอย (GAM) เมื่อความน่าจะเป็นแบบจำลองไม่สูงกว่าค่า null อย่างมีนัยสำคัญ


10

ฉันใช้การถดถอยแบบอิง GAM โดยใช้gamlssแพ็คเกจ R และสมมติว่ามีการกระจายข้อมูลเบต้าที่ไม่มีศูนย์ mymodel = gamlss(response ~ input, family=BEZI)ฉันมีเพียงตัวแปรอธิบายเดียวในรูปแบบของฉันดังนั้นมันเป็นพื้น:

อัลกอริทึมทำให้ฉันสัมประสิทธิ์สำหรับผลกระทบของตัวแปรอธิบายในค่าเฉลี่ย ( ) และค่า p ที่เกี่ยวข้องสำหรับคล้าย:kμk(input)=0

Mu link function:  logit                                               
Mu Coefficients:                                                      
              Estimate  Std. Error  t value   Pr(>|t|)                  
(Intercept)  -2.58051     0.03766  -68.521  0.000e+00                  
input        -0.09134     0.01683   -5.428  6.118e-08

ดังที่คุณเห็นในตัวอย่างด้านบนสมมติฐานของถูกปฏิเสธด้วยความมั่นใจสูงk(input)=0

จากนั้นฉันเรียกใช้โมเดลว่าง: null = gamlss(response ~ 1, family=BEZI)และเปรียบเทียบความน่าจะเป็นโดยใช้การทดสอบอัตราส่วนความน่าจะเป็น:

p=1-pchisq(-2*(logLik(null)[1]-logLik(mymodel)[1]), df(mymodel)-df(null)).

ในหลายกรณีฉันได้รับแม้ว่าค่าสัมประสิทธิ์ที่อินพุตมีการรายงานว่ามีความสำคัญสูง (ดังกล่าวข้างต้น) ฉันพบว่ามันค่อนข้างผิดปกติ - อย่างน้อยก็ไม่เคยเกิดขึ้นกับประสบการณ์ของฉันกับการถดถอยเชิงเส้นหรือโลจิสติกp>0.05

คำถามของฉันคือ: ฉันยังสามารถไว้วางใจการพึ่งพาระหว่างการตอบสนองและการป้อนข้อมูลเมื่อเป็นกรณีนี้ได้หรือไม่?

คำตอบ:


1

ฉันไม่เห็นเหตุผลทันทีว่าทำไมสิ่งนี้จึงควรเกี่ยวข้องกับ GAM ความจริงก็คือคุณใช้การทดสอบสองแบบสำหรับสิ่งเดียวกัน เนื่องจากไม่มีความแน่นอนแน่นอนในสถิติจึงเป็นไปได้ที่จะให้ผลลัพธ์ที่มีนัยสำคัญและที่อื่น ๆ ไม่ใช่

บางทีการทดสอบหนึ่งในสองแบบนั้นมีประสิทธิภาพมากขึ้น (แต่อาจต้องใช้ข้อสันนิษฐานเพิ่มเติม) หรือบางทีสิ่งที่สำคัญเพียงอย่างเดียวคือข้อผิดพลาดประเภท 1 ในยี่สิบของคุณ

ตัวอย่างที่ดีคือการทดสอบว่าตัวอย่างมาจากการแจกแจงแบบเดียวกันหรือไม่: คุณมีการทดสอบแบบพาราเมตริกมากสำหรับการทดสอบนั้น (การทดสอบ T คือการทดสอบที่สามารถใช้สำหรับสิ่งนี้: ถ้าค่าเฉลี่ยแตกต่างกันดังนั้นการกระจาย) สิ่งที่: มันอาจเกิดขึ้นได้ที่พารามิเตอร์หนึ่งให้ผลลัพธ์ที่สำคัญและสิ่งที่ไม่ใช่พารามิเตอร์นั้นไม่มี อาจเป็นเพราะสมมติฐานของการทดสอบพารามิเตอร์เป็นเท็จเพราะข้อมูลนั้นไม่ธรรมดา (ประเภท I) หรือเนื่องจากขนาดตัวอย่างไม่เพียงพอสำหรับการทดสอบที่ไม่ใช่พารามิเตอร์เพื่อรับความแตกต่างหรือในที่สุดเนื่องจากแง่มุมของ สิ่งที่คุณต้องการทดสอบ (การแจกแจงที่แตกต่างกัน) ที่ตรวจสอบโดยการทดสอบที่แตกต่างกันนั้นแตกต่างกัน (หมายถึงโอกาสที่จะเป็น "สูงกว่า" ที่แตกต่างกัน <->

หากผลการทดสอบหนึ่งรายการแสดงผลลัพธ์ที่สำคัญและอีกรายการหนึ่งนั้นไม่สำคัญเพียงเล็กน้อยฉันจะไม่กังวลมากเกินไป

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.