การถดถอยการทดสอบ t และ ANOVA ทุกรุ่นของโมเดลเชิงเส้นทั่วไปเป็นอย่างไร


49

คำตอบ:


47

พิจารณาว่าพวกเขาทุกคนสามารถเขียนเป็นสมการถดถอย (อาจมีการตีความที่แตกต่างกันเล็กน้อยกว่ารูปแบบดั้งเดิมของพวกเขา)

Y=β0+β1X(continuous)+εwhere εN(0,σ2)

Y=β0+β1X(dummy code)+εwhere εN(0,σ2)

Y=β0+β1X(dummy code)+εwhere εN(0,σ2)

XX01X

β00β1

Y=β0+β1X(dummy code 1)+β2X(dummy code 2)+εwhere εN(0,σ2)
gg10β0β1β2

ในแง่ของความเห็นของ @ whuber ด้านล่างสิ่งเหล่านี้สามารถแสดงผ่านสมการเมทริกซ์: ตัวแทนของวิธีนี้ &เป็นเวกเตอร์ความยาวและเป็นเวกเตอร์ของความยาว 1 เป็นเมทริกซ์ที่มีแถวและคอลัมน์ ในการถดถอยแม่บทคุณมีอย่างต่อเนื่องตัวแปรและตัด ดังนั้น matrix ของคุณประกอบด้วยชุดของเวกเตอร์คอลัมน์แบบเรียงต่อกันหนึ่งชุดสำหรับแต่ละ

Y=Xβ+ε
ε N β p + 1 X N ( p + 1 ) p X X X 1YεNβp+1XN(p+1)pXXXตัวแปรที่มีคอลัมน์ของอยู่ทางด้านซ้ายสุดสำหรับการสกัดกั้น 1

หากคุณเป็นตัวแทนของ ANOVA กับกลุ่มด้วยวิธีนี้โปรดจำไว้ว่าคุณจะมีตัวแปรจำลองบ่งชี้กลุ่มโดยมีกลุ่มอ้างอิงที่ระบุโดยการสังเกตที่มีในแต่ละตัวแปรจำลอง ดังกล่าวข้างต้นคุณจะยังคงมีการสกัดกั้น ดังนั้นG-1 g - 1 0 p = g - 1gg10p=g1


1
สมการ ANOVA จะสมเหตุสมผลในฐานะ ANOVA (ไม่ใช่การทดสอบ t) เฉพาะเมื่อถูกตีความว่าเป็นเวกเตอร์และคูณทางด้านขวา β1
whuber

นี่ไม่ใช่สมการเมทริกซ์ ฉันไม่ค่อยได้ใช้สิ่งเหล่านี้ที่นี่เพราะหลายคนไม่ได้อ่าน ANOVA ครั้งที่ 1 แสดงถึงสถานการณ์ที่เหมือนกันกับการทดสอบก่อนหน้านี้ ฉันแค่ชี้ให้เห็นว่าถ้าคุณสามารถรัน t-test อิสระ 2 ตัวอย่างคุณสามารถเรียกใช้ข้อมูลเดียวกันกับ ANOVA (ซึ่งหลายคนควรจำ / จำได้จากสถิติระดับ 101) ฉันเพิ่ม ANOVA เวอร์ชันอื่นที่มีกลุ่มที่ต่ำกว่าลงเพื่อชี้แจงว่าสถานการณ์ 2 กลุ่มไม่ใช่กรณี ANOVA เดียวที่สามารถเข้าใจได้ว่าเป็นการถดถอย แต่ตอนนี้สมการดูแตกต่างออกไป - ฉันพยายามรักษาขนานที่ชัดเจนกว่าด้านบน
gung - Reinstate Monica

ประเด็นของฉันคือถ้าคุณไม่ทำให้มันเป็นสมการเมทริกซ์, ลักษณะของ ANOVA ของคุณมี จำกัด เกินกว่าที่จะเป็นประโยชน์: มันเหมือนกับลักษณะของการทดสอบ t-test ของคุณและทำให้สับสนมากกว่าที่เป็นประโยชน์ เมื่อคุณเริ่มแนะนำกลุ่มมากขึ้นคุณจะเปลี่ยนสมการโดยทันทีซึ่งอาจน้อยกว่าชัดเจน ไม่ว่าคุณต้องการใช้สัญกรณ์เมทริกซ์นั้นขึ้นอยู่กับคุณ แต่เพื่อประโยชน์ในการสื่อสารที่ดีคุณควรมุ่งมั่นเพื่อความมั่นคง
whuber

คุณช่วยอธิบายเพิ่มเติมเกี่ยวกับวิธีที่คุณได้รับจากนิยามยอดนิยมของการทดสอบ t ไปยังสมการที่คุณได้แสดงโดยทั่วไปฉันไม่สามารถเข้าใจได้ว่า Y คืออะไรที่นี่ อย่างไรก็ตามวิธีที่จะมาจาก t = (yx-u0) / s ถึงสมการนี้
Gaurav Singhal

มันไม่ได้แม้ว่าสิ่งนี้อาจไม่คุ้นเคยสำหรับคุณ เป็นแบบต่อเนื่อง (และถือว่าเป็นเงื่อนไขปกติ) ในทุกกรณีที่ระบุไว้ ไม่มีข้อสันนิษฐานการกระจายเกี่ยวกับมันสามารถต่อเนื่อง, dichotomous หรือตัวแปรเด็ดขาดหลายระดับ YX
gung - Reinstate Monica

16

พวกเขาทั้งหมดสามารถเขียนเป็นกรณีเฉพาะของโมเดลเชิงเส้นทั่วไป

t-test เป็นตัวอย่างสองกรณีของ ANOVA หากคุณยกกำลังสองสถิติการทดสอบ t คุณจะได้สอดคล้องกันใน ANOVAF

รูปแบบการวิเคราะห์ความแปรปรวนเป็นเพียงรูปแบบการถดถอยที่ระดับปัจจัยโดยมีตัวแทนหุ่น (หรือตัวบ่งชี้ ) ตัวแปร

ดังนั้นถ้าแบบจำลองสำหรับการทดสอบ t เป็นเซตย่อยของแบบจำลอง ANOVA และ ANOVA เป็นส่วนย่อยของแบบจำลองการถดถอยหลายแบบการถดถอยตัวเอง (และสิ่งอื่น ๆ นอกเหนือจากการถดถอย) เป็นส่วนย่อยของแบบจำลองเชิงเส้นทั่วไปซึ่งขยายการถดถอยไป ข้อกำหนดทั่วไปมากขึ้นของระยะข้อผิดพลาดกว่ากรณีการถดถอยปกติ (ซึ่งเป็น 'อิสระ' และ 'เท่ากับแปรปรวน') และหลายตัวแปรYY


นี่คือตัวอย่างที่แสดงให้เห็นถึงความเท่าเทียมกันของสามัญ (เท่ากับ-แปรปรวน) สอง sample-วิเคราะห์และการทดสอบสมมติฐานในรูปแบบการถดถอยทำใน R (ข้อมูลจริงที่มีลักษณะที่จะจับคู่ดังนั้นนี้ไม่ได้จริงๆการวิเคราะห์ความเหมาะสม) :t

> t.test(extra ~ group, var.equal=TRUE, data = sleep) 

    Two Sample t-test

data:  extra by group
t = -1.8608, df = 18, p-value = 0.07919   
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -3.363874  0.203874
sample estimates:
mean in group 1 mean in group 2 
           0.75            2.33 

สังเกตค่า p-0.079 ข้างต้น นี่เป็นวิธีหนึ่งของ anova:

> summary(aov(extra~group,sleep))
            Df Sum Sq Mean Sq F value Pr(>F)  
group        1  12.48  12.482   3.463 0.0792 
Residuals   18  64.89   3.605                 

ตอนนี้สำหรับการถดถอย:

> summary(lm(extra ~ group, data = sleep))

(เอาออกบางส่วนออก)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)   0.7500     0.6004   1.249   0.2276  
group2        1.5800     0.8491   1.861   0.0792 .
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared:  0.1613,    Adjusted R-squared:  0.1147 
F-statistic: 3.463 on 1 and 18 DF,  p-value: 0.07919

เปรียบเทียบค่า p ในแถว 'group2' และค่า p สำหรับการทดสอบ F ในแถวสุดท้าย สำหรับการทดสอบแบบสองด้านสิ่งเหล่านี้เหมือนกันและทั้งคู่ตรงกับผลการทดสอบ t-test

นอกจากนี้ค่าสัมประสิทธิ์สำหรับ 'group2' แสดงถึงความแตกต่างในค่าเฉลี่ยสำหรับทั้งสองกลุ่ม


มีค่า P เหมือนกันในทุก 3 กรณีคือที่มีมนต์ขลังและน่าประทับใจ แต่ถ้าคุณสามารถอธิบายเล็กน้อยเพิ่มเติมเกี่ยวกับวิธีค่า P เหล่านี้ได้รับการคำนวณแน่นอนมันจะทำให้คำตอบนี้เพิ่มเติมที่น่าสนใจ ฉันไม่รู้ว่าการแสดงการคำนวณค่า p จะทำให้มีประโยชน์มากขึ้นเช่นกันดังนั้นนี่คือสิ่งที่คุณสามารถตัดสินใจได้
Gaurav Singhal

@Gaurav ค่า p เหมือนกันเพราะคุณกำลังทดสอบสมมติฐานเดียวกันในรูปแบบเดียวกันเพียงแค่แสดงต่างกันเล็กน้อย หากคุณสนใจที่จะคำนวณค่า p ที่เฉพาะเจาะจงน่าจะเป็นคำถามใหม่ (ไม่ใช่คำตอบของคำถามที่นี่) คุณสามารถถามคำถามดังกล่าวได้ แต่ลองค้นหาก่อนเพราะอาจได้รับคำตอบแล้ว
Glen_b

ขอบคุณ @Glen_b ขออภัยที่ถามคำถามที่ชัดเจนและไม่ใช่วิธีที่ดีที่สุดเช่นกัน และคุณยังคงตอบคำถามของฉัน - "สมมติฐานเดียวกันในแบบจำลองเดียวกัน (และ / หรือข้อมูล)" ฉันไม่ได้ให้ความคิดเพียงพอเกี่ยวกับวิธีที่พวกเขาทดสอบสมมติฐานเดียวกัน ขอบคุณ
Gaurav Singhal

2

คำตอบที่ฉันโพสต์ก่อนหน้านี้มีความเกี่ยวข้องบ้าง แต่คำถามนี้ค่อนข้างแตกต่างกัน

คุณอาจต้องการคิดถึงความแตกต่างและความคล้ายคลึงระหว่างโมเดลเชิงเส้นต่อไปนี้:

[Y1Yn]=[1x11x21x31xn][α0α1]+[ε1εn]
[Y1Yn]=[10001000010001000010][α0αk]+[ε1εn]

2
คำอธิบายและความคิดเห็นเกี่ยวกับคำถามจะมีประโยชน์สำหรับผู้อ่านตั้งแต่ตอนนี้พวกเขาต้องเดาว่าพวกเขามาจากไหนและเกี่ยวข้องกับคำถามเหล่านี้อย่างไร ...
ทิม

0

Anova นั้นคล้ายคลึงกับ t-test เพื่อความเท่าเทียมกันของวิธีการภายใต้สมมติฐานของความแปรปรวนที่ไม่ทราบ แต่เท่าเทียมกันในการรักษา นี่เป็นเพราะใน ANOVA MSE นั้นเหมือนกับความแปรปรวนแบบพูลที่ใช้ในการทดสอบ t มี t-test เวอร์ชันอื่นเช่นหนึ่งสำหรับความแปรปรวนที่ไม่เท่ากันและการทดสอบ t-pair จากมุมมองนี้การทดสอบ t สามารถยืดหยุ่นได้มากขึ้น

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.