มันจะน่าสนใจที่จะชื่นชมว่าแตกต่างที่อยู่ในประเภทของตัวแปรและอื่น ๆ โดยเฉพาะอย่างยิ่งประเภทของตัวแปร ใน ANOVA ทั่วไปเรามีตัวแปรเด็ดขาดที่มีกลุ่มแตกต่างกันและเราพยายามตรวจสอบว่าการวัดตัวแปรต่อเนื่องแตกต่างกันระหว่างกลุ่มหรือไม่ บนมืออื่น ๆ , OLS มีแนวโน้มที่จะถูกมองว่าเป็นความพยายามที่เป็นหลักในการประเมินความสัมพันธ์ระหว่าง regressand ต่อเนื่องหรือตัวแปรตอบสนองและการหนึ่งหรือregressors หรือหลายตัวแปร ในแง่นี้การถดถอยสามารถถูกมองว่าเป็นเทคนิคที่แตกต่างให้ยืมตัวมันเองเพื่อทำนายค่าตามบรรทัดการถดถอย
อย่างไรก็ตามความแตกต่างนี้ไม่ได้มีส่วนช่วยในการวิเคราะห์ ANOVA กับส่วนที่เหลือของการวิเคราะห์ความแปรปรวนของซุปอักษร (ANCOVA, MANOVA, MANCOVA) หรือการรวมของตัวแปรจำลองที่จำลองในการถดถอย OLS ฉันไม่ชัดเจนเกี่ยวกับสถานที่สำคัญทางประวัติศาสตร์ที่เฉพาะเจาะจง แต่ราวกับว่าทั้งสองเทคนิคได้ปรับตัวแบบขนานเพื่อรับมือกับโมเดลที่ซับซ้อนมากขึ้น
ตัวอย่างเช่นเราจะเห็นว่าความแตกต่างระหว่างANCOVAกับOLS กับตัวแปรดัมมี่ (หรือหมวดหมู่) (ในทั้งสองกรณีที่มีการโต้ตอบ)เป็นเครื่องสำอางมากที่สุด โปรดยกโทษให้ฉันออกจากขอบเขตในชื่อคำถามของคุณเกี่ยวกับการถดถอยเชิงเส้นหลายครั้ง
ในทั้งสองกรณีรูปแบบเป็นหลักเหมือนกันกับจุดที่ใน R ฟังก์ชั่นที่ใช้ในการดำเนินการ ANCOVA อย่างไรก็ตามมันสามารถนำเสนอที่แตกต่างกันโดยคำนึงถึงการรวมของการสกัดกั้นที่สอดคล้องกับระดับแรก (หรือกลุ่ม) ของตัวแปร (หรือหมวดหมู่) ตัวแปรในรูปแบบการถดถอยlm
ในแบบจำลองที่สมดุล ( กลุ่มมีขนาดเท่ากัน, ) และเพียงหนึ่ง covariate (เพื่อทำให้การนำเสนอเมทริกซ์ง่ายขึ้น) เมทริกซ์โมเดลใน ANCOVA สามารถพบได้ในรูปแบบต่าง ๆ ดังนี้:n 1 , 2 , ⋯ผมn1 , 2 , ⋯ผม
X= ⎡⎣⎢1n10001n20001n3xn1000xn2000xn3⎤⎦⎥
สำหรับตัวแปรกลุ่มกลุ่มซึ่งแสดงเป็นบล็อคเมทริก3
สิ่งนี้สอดคล้องกับโมเดลเชิงเส้น:
α i β
Y= αผม+ β1xn1+ β2xn2+ β3xn3+ ϵผม
กับเทียบเท่ากับกลุ่มวิธีการที่แตกต่างกันในการวิเคราะห์ความแปรปรวน แบบจำลองในขณะที่ต่างกันคือลาดของโควาเรียตสำหรับแต่ละกลุ่ม
αผมβ
การนำเสนอของโมเดลเดียวกันในฟิลด์การถดถอยและโดยเฉพาะใน R จะพิจารณาการสกัดกั้นโดยรวมซึ่งสอดคล้องกับหนึ่งในกลุ่มและเมทริกซ์โมเดลสามารถแสดงเป็น:
X= ⎡⎣⎢⎢⎢⋮J3 n , 1⋮01n20001n3⋮x⋮0000xn2000xn3⎤⎦⎥⎥⎥
ของสมการ OLS:
Y= β0+ μผม+ β1xn1+ β2xn2+ β3xn3+ ϵผม
\
ในโมเดลนี้การสกัดกั้นโดยรวมจะถูกแก้ไขในแต่ละระดับกลุ่มโดยและกลุ่มก็มีความแตกต่างกันμ iβ0μผม
ดังที่คุณเห็นจากแบบจำลองการฝึกอบรมการนำเสนอนั้นจะต้องมีตัวตนที่แท้จริงระหว่างการถดถอยและการวิเคราะห์ความแปรปรวน
ผมชอบที่จะตรวจสอบชนิดของสายนี้กับบางส่วนของรหัสและชุดข้อมูลที่ชื่นชอบmtcars
ในการวิจัย ฉันใช้lm
สำหรับ ANCOVA ตามกระดาษเบน Bolker ที่มีอยู่ที่นี่
mtcars$cyl <- as.factor(mtcars$cyl) # Cylinders variable into factor w 3 levels
D <- mtcars # The data set will be called D.
D <- D[order(D$cyl, decreasing = FALSE),] # Ordering obs. for block matrices.
model.matrix(lm(mpg ~ wt * cyl, D)) # This is the model matrix for ANCOVA
ในส่วนของคำถามเกี่ยวกับวิธีการใช้งาน (การถดถอยด้วย R!) คุณอาจพบว่าคำวิจารณ์ออนไลน์นี้น่าขบขันฉันเจอในขณะที่เขียนบทความนี้