โมเดลเชิงเส้นทั่วไปช่วยให้เราเขียนแบบจำลอง ANOVA เป็นแบบจำลองการถดถอย สมมติว่าเรามีสองกลุ่มที่มีข้อสังเกตสองแต่ละคือสี่ข้อสังเกตในเวกเตอร์Yจากนั้นแบบจำลอง overparametrized ดั้งเดิมคือโดยที่เป็นเมทริกซ์ของตัวทำนายคือตัวแปรตัวบ่งชี้ที่หลอกรหัส:
yE(y)=X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2⎞⎠⎟
พารามิเตอร์ไม่สามารถระบุได้ว่าเป็นเนื่องจากมีอันดับ 2 (ไม่สามารถย้อนกลับได้) ในการเปลี่ยนแปลงนั้นเราแนะนำข้อ จำกัด (ความแตกต่างของการรักษา) ซึ่งทำให้เรามีรูปแบบใหม่ :
((X⋆)′X⋆)−1(X⋆)′E(y)X⋆(X⋆)′X⋆β⋆1=0E(y)=Xβ
⎛⎝⎜⎜⎜μ1μ1μ2μ2⎞⎠⎟⎟⎟=⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟(β0β2)
ดังนั้น , คือใช้กับความหมายของค่าที่คาดหวังจากหมวดหมู่อ้างอิงของเรา (กลุ่ม 1) , คือใช้กับความหมายของความแตกต่างกับหมวดหมู่อ้างอิง เนื่องจากมีสองกลุ่มมีเพียงหนึ่งพารามิเตอร์ที่เกี่ยวข้องกับเอฟเฟกต์กลุ่มสมมติฐานว่างของ ANOVA (พารามิเตอร์เอฟเฟกต์กลุ่มทั้งหมดคือ 0) จะเหมือนกับสมมติฐานการถดถอยน้ำหนักเป็นศูนย์ว่างเปล่า (พารามิเตอร์ความชันคือ 0)μ1=β0β0μ2=β0+β2β2μ2−μ1
-test ในรูปแบบเชิงเส้นทั่วไปทดสอบการรวมกันเชิงเส้นของพารามิเตอร์กับค่าสมมติฐานภายใต้สมมติฐาน การเลือกเราสามารถทดสอบสมมติฐานที่ (การทดสอบปกติสำหรับพารามิเตอร์ความชัน) เช่นที่นี่ . ประมาณการเป็นที่เป็น OLS ประมาณค่าพารามิเตอร์ สถิติการทดสอบทั่วไปสำหรับคือ:
tψ=∑cjβjψ0c=(0,1)′β2=0μ2−μ1=0ψ^=∑cjβ^jβ^=(X′X)−1X′yψ
t=ψ^−ψ0σ^c′(X′X)−1c−−−−−−−−−√
σ^2=∥e∥2/(n−Rank(X))เป็นตัวประมาณค่าที่เป็นกลางสำหรับความแปรปรวนข้อผิดพลาดโดยที่คือผลรวมของส่วนที่เหลือกำลังสอง ในกรณีที่มีสองกลุ่ม ,และตัวประมาณจึงเป็นและ{1} ด้วยเป็น 1 ในกรณีของเราสถิติทดสอบกลายเป็น:
∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
tมี -distributed กับ DF (ที่นี่ ) เมื่อคุณตารางคุณจะได้รับสถิติการทดสอบจาก ANOVAทดสอบสำหรับสองกลุ่ม (สำหรับระหว่าง,สำหรับภายในกลุ่ม) ซึ่งตาม - การแจกแจงแบบ 1 และ dftn−Rank(X)n−2t(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
มีมากกว่าสองกลุ่ม, สมมติฐาน ANOVA (ทั้งหมดพร้อมกัน 0, กับ ) หมายถึงมากกว่าหนึ่งพารามิเตอร์และไม่สามารถแสดงเป็นชุดค่าผสมเชิงเส้น , ดังนั้นการทดสอบจะไม่เท่ากัน .βj1≤jψ