หากคุณกำลังทำการวิเคราะห์ทางเดียวเพื่อทดสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างกลุ่มหรือไม่โดยปริยายคุณกำลังเปรียบเทียบสองโมเดลซ้อนกัน (ดังนั้นจึงมีการซ้อนเพียงระดับเดียว แต่ยังคงซ้อนอยู่)
ทั้งสองรุ่นคือ:
- YฉันเจผมJβ^0
Yฉันเจ= β^0+ ϵผม
รุ่นที่ 1: ค่าถูกสร้างแบบจำลองโดยวิธีการประมาณของกลุ่ม
βJ^
Yผม= β^0+ β^J+ ϵผม
ตัวอย่างของการเปรียบเทียบค่าเฉลี่ยและความเท่าเทียมกับแบบจำลองที่ซ้อนกัน:ลองเอาความยาว sepal (ซม.) จากชุดข้อมูล iris (ถ้าเราใช้ตัวแปรทั้งสี่ที่เราสามารถทำได้ LDA หรือ MANOVA เช่นเดียวกับ Fisher ในปี 1936)
ค่าเฉลี่ยรวมและกลุ่มที่สังเกตได้คือ:
μt o t a lμs e t o s aμv e r s i c o l o r rμv i r gผม n ฉันค= 5.83= 5.01= 5.94= 6.59
ซึ่งอยู่ในรูปแบบโมเดล:
แบบ 1: รุ่น 2: Yฉันเจ= 5.83 + ϵผมYฉันเจ= 5.01 + ⎡⎣⎢00.931.58⎤⎦⎥J+ ϵผม
∑ ϵ2ผม= 102.1683
∑ ϵ2ผม= 38.9562
และตาราง ANOVA จะเป็นเช่นนั้น (และคำนวณความแตกต่างโดยปริยายซึ่งเป็นผลรวมระหว่างกลุ่มของกำลังสองซึ่งคือ 63.212 ในตารางที่มี 2 องศาอิสระ):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
F= R SSdฉันฉฉe r e n c eD Fdฉันฉฉe r e n c eR SSn E WD Fn E W= 63.212238.956147= 119.26
ชุดข้อมูลที่ใช้ในตัวอย่าง:
ความยาวกลีบดอก (ซม.) สำหรับดอกไอริสสามชนิด
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
ฟังก์ชั่นเพราะสิ่งแรกที่แท้จริง ANOVA ก็ใช้แบบทดสอบ F สิ่งนี้นำไปสู่ความสับสนของคำศัพท์