เปรียบเทียบสองรุ่นโดยใช้ฟังก์ชัน anova () ใน R


32

จากเอกสารสำหรับanova():

เมื่อได้รับลำดับของวัตถุ 'anova' ทดสอบแบบจำลองกับอีกแบบหนึ่งตามลำดับที่ระบุ ...

การทดสอบแบบจำลองเทียบกันหมายความว่าอย่างไร และทำไมคำสั่งซื้อถึงมีความสำคัญ?

นี่คือตัวอย่างจากบทช่วยสอน GenABEL :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

ฉันจะตีความผลลัพธ์นี้ได้อย่างไร

คำตอบ:


31

เมื่อคุณใช้anova(lm.1,lm.2,test="Chisq")มันจะทำการทดสอบ Chi-Square เพื่อเปรียบเทียบlm.1และlm.2(นั่นคือการทดสอบว่าการลดลงของผลรวมที่เหลือของสี่เหลี่ยมนั้นมีนัยสำคัญทางสถิติหรือไม่) โปรดทราบว่านี่เหมาะสมแล้วหากlm.1และlm.2เป็นรุ่นที่ซ้อนกัน

ตัวอย่างเช่นใน anova ที่ 1 ที่คุณใช้ค่า p ของการทดสอบคือ 0.82 มันหมายความว่ารูปแบบการติดตั้ง "modelAdd" ไม่ได้แตกต่างไปจาก modelGen ที่ระดับ\อย่างไรก็ตามการใช้ p-value ใน ANOVA 3 รูปแบบ "modelRec" เป็นรูปแบบรูปแบบที่แตกต่างกันอย่างมีนัยสำคัญ "modelGen" ที่\α=0.05α=0.1

ตรวจสอบANOVA สำหรับรุ่นเชิงเส้นพอดีเช่นกัน


1
แต่นั่นบ่งบอกอะไรเกี่ยวกับว่าหนึ่งในสองนั้นดีกว่าหรือไม่ ขอบคุณ!
QED

5
ขึ้นอยู่กับวิธีที่คุณกำหนดคำว่า "ดีกว่า" หากคุณกำหนดว่าเป็นแบบจำลองที่ให้ผลรวมที่เหลือน้อยลงของกำลังสองดังนั้นคำตอบคือใช่ นี่เป็นเพราะการทดสอบนี้เปรียบเทียบการลดลงของผลรวมที่เหลือของกำลังสอง
สถิติ

3
ในทางตรงกันข้ามถ้าทั้งสองรุ่นไม่แตกต่างกันอย่างมีนัยสำคัญคนหนึ่งอาจจะเถียงว่าแบบจำลองที่ง่ายกว่านั้นคือ "ดีกว่า"? ฉันกำลังคิดเกี่ยวกับ parcimony ที่นี่
Sininho

1
เกิดอะไรขึ้นถ้า anova (mod1, mod2, test = "LRT") สิ่งนี้แตกต่างกันอย่างไร
ElleryL
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.