ความแตกต่างระหว่าง t-test และ ANOVA ในการถดถอยเชิงเส้น


12

ฉันสงสัยว่าความแตกต่างระหว่าง t-test และ ANOVA ในการถดถอยเชิงเส้นคืออะไร

  1. t-test เพื่อทดสอบว่าหนึ่งในความชันและการสกัดกั้นใดมีค่าเป็นศูนย์หรือไม่ในขณะที่ ANOVA เพื่อทดสอบว่าความชันทั้งหมดมีค่าเป็นศูนย์หรือไม่ นี่เป็นข้อแตกต่างระหว่างพวกเขาเหรอ?
  2. ในการถดถอยเชิงเส้นอย่างง่ายนั่นคือมีตัวแปรตัวทำนายเพียงตัวเดียวเท่านั้น t-test และ ANOVA มีความเทียบเท่าหรือไม่และถ้าใช่วิธีการที่พวกเขาใช้สถิติที่แตกต่างกัน (t-test ใช้ t-statistic และ ANOVA ใช้ F-statistic)?

โฆษณา 1) ในการถดถอยเชิงเส้นปกติฉันเข้าใจ ANOVA เป็นตัวชี้วัดความดีของแบบจำลองคือการตัดสินใจว่าตัวแบบ (เส้นถดถอย) อธิบายส่วนที่สำคัญของความแปรปรวนทั้งหมดหรือไม่ คำถามไม่ว่ามันจะเทียบเท่ากับความลาดชันทั้งหมดที่เป็นศูนย์หรือไม่มันน่าสนใจมาก ๆ โฆษณา 2) ดูเหมือนว่าฉันได้รับค่า p เกือบเท่ากันสำหรับ t-test และ regression ANOVA ในกรณีนี้ ทฤษฎีบทที่น่าสนใจจริงๆ!
อยากรู้อยากเห็น

คำตอบ:


18

โมเดลเชิงเส้นทั่วไปช่วยให้เราเขียนแบบจำลอง ANOVA เป็นแบบจำลองการถดถอย สมมติว่าเรามีสองกลุ่มที่มีข้อสังเกตสองแต่ละคือสี่ข้อสังเกตในเวกเตอร์Yจากนั้นแบบจำลอง overparametrized ดั้งเดิมคือโดยที่เป็นเมทริกซ์ของตัวทำนายคือตัวแปรตัวบ่งชี้ที่หลอกรหัส: yE(y)=XβX

(μ1μ1μ2μ2)=(110110101101)(β0β1β2)

พารามิเตอร์ไม่สามารถระบุได้ว่าเป็นเนื่องจากมีอันดับ 2 (ไม่สามารถย้อนกลับได้) ในการเปลี่ยนแปลงนั้นเราแนะนำข้อ จำกัด (ความแตกต่างของการรักษา) ซึ่งทำให้เรามีรูปแบบใหม่ : ((X)X)1(X)E(y)X(X)Xβ1=0E(y)=Xβ

(μ1μ1μ2μ2)=(10101111)(β0β2)

ดังนั้น , คือใช้กับความหมายของค่าที่คาดหวังจากหมวดหมู่อ้างอิงของเรา (กลุ่ม 1) , คือใช้กับความหมายของความแตกต่างกับหมวดหมู่อ้างอิง เนื่องจากมีสองกลุ่มมีเพียงหนึ่งพารามิเตอร์ที่เกี่ยวข้องกับเอฟเฟกต์กลุ่มสมมติฐานว่างของ ANOVA (พารามิเตอร์เอฟเฟกต์กลุ่มทั้งหมดคือ 0) จะเหมือนกับสมมติฐานการถดถอยน้ำหนักเป็นศูนย์ว่างเปล่า (พารามิเตอร์ความชันคือ 0)μ1=β0β0μ2=β0+β2β2μ2μ1

-test ในรูปแบบเชิงเส้นทั่วไปทดสอบการรวมกันเชิงเส้นของพารามิเตอร์กับค่าสมมติฐานภายใต้สมมติฐาน การเลือกเราสามารถทดสอบสมมติฐานที่ (การทดสอบปกติสำหรับพารามิเตอร์ความชัน) เช่นที่นี่ . ประมาณการเป็นที่เป็น OLS ประมาณค่าพารามิเตอร์ สถิติการทดสอบทั่วไปสำหรับคือ: tψ=cjβjψ0c=(0,1)β2=0μ2μ1=0ψ^=cjβ^jβ^=(XX)1Xyψ

t=ψ^ψ0σ^c(XX)1c

σ^2=e2/(nRank(X))เป็นตัวประมาณค่าที่เป็นกลางสำหรับความแปรปรวนข้อผิดพลาดโดยที่คือผลรวมของส่วนที่เหลือกำลังสอง ในกรณีที่มีสองกลุ่ม ,และตัวประมาณจึงเป็นและ{1} ด้วยเป็น 1 ในกรณีของเราสถิติทดสอบกลายเป็น: e2Rank(X)=2(XX)1X=(.5.500.5.5.5.5)β^0=0.5y1+0.5y2=M1β^2=0.5y10.5y2+0.5y3+0.5y4=M2M1c(XX)1c

t=M2M10σ^=M2M1e2/(n2)

tมี -distributed กับ DF (ที่นี่ ) เมื่อคุณตารางคุณจะได้รับสถิติการทดสอบจาก ANOVAทดสอบสำหรับสองกลุ่ม (สำหรับระหว่าง,สำหรับภายในกลุ่ม) ซึ่งตาม - การแจกแจงแบบ 1 และ dftnRank(X)n2t(M2M1)2/1e2/(n2)=SSb/dfbSSw/dfw=FFbwFnRank(X)

มีมากกว่าสองกลุ่ม, สมมติฐาน ANOVA (ทั้งหมดพร้อมกัน 0, กับ ) หมายถึงมากกว่าหนึ่งพารามิเตอร์และไม่สามารถแสดงเป็นชุดค่าผสมเชิงเส้น , ดังนั้นการทดสอบจะไม่เท่ากัน .βj1jψ


3

ใน 1, ANOVA มักจะทดสอบตัวแปรปัจจัยและหรือไม่ระหว่างความแปรปรวนกลุ่มมีความสำคัญ คุณจะเห็นความแตกต่างอย่างชัดเจนว่าซอฟต์แวร์ของคุณอนุญาตตัวแปรตัวบ่งชี้ในการถดถอยหรือไม่สำหรับแต่ละตัวจำลองคุณจะได้รับค่า ap บอกว่ากลุ่มนี้ให้คะแนนแตกต่างจาก 0 อย่างมีนัยสำคัญและเป็นผลให้แตกต่างจากกลุ่มอ้างอิง . โดยปกติแล้วคุณจะไม่เห็นว่าตัวบ่งชี้มีความสำคัญระดับใดจนกว่าคุณจะทำการทดสอบ ANOVA

การทดสอบ F คือการทดสอบ t กำลังสอง ดังนั้นใน 2 ก็เหมือนกัน


ขอบคุณ! (1) ตัวแปรตัวบ่งชี้หมายถึงอะไรที่นี่ (2) โดยทั่วไป t-test เทียบเท่า ANOVA เฉพาะเมื่อมีเพียงสองกลุ่ม แต่ในการถดถอยเชิงเส้นอย่างง่ายอาจมีมากกว่าสองกลุ่มโดยที่จำนวนกลุ่มคือจำนวนของค่าที่ตัวแปรทำนายใช้ในชุดข้อมูล
ทิม

(1) ตัวบ่งชี้หรือหมวดหมู่หรือตัวแปรปัจจัย ... เหมือนกันทั้งหมด (2) แน่นอน แต่คุณอาจต้องการทราบว่าคะแนนหุ่น / หมวดหมู่จาก ANOVA นั้นดีเพียงใด
แรงงาน

ขอบคุณ! (2) ดังนั้นในการถดถอยเชิงเส้นอย่างง่าย t-test มีค่าเทียบเท่า ANOVA อย่างไรเนื่องจากมีมากกว่าสองกลุ่ม "ชุดคะแนนหุ่น / หมวดหมู่จาก ANOVA นั้นดีแค่ไหน" หมายความว่าอย่างไรและทำไมฉันถึงต้องการทราบ
ทิม

ใน OLS regression R² (ความแปรปรวนที่อธิบาย) จะเท่ากับeta²หรือ MSS / TSS จาก ANOVA ไม่ว่าคุณจะกำหนดกลุ่มไว้กี่กลุ่มก็ตาม ถัดไปคุณอาจต้องการทราบถึงการมีส่วนร่วมของชุดของหุ่น (เช่นตัวแปรตัวบ่งชี้) เพื่อบอกว่าชุดตัวเองมีความเกี่ยวข้องและขอบเขตใดซึ่งแตกต่างจากความสำคัญของความแตกต่างระหว่างหมวดหมู่เดียวกับหมวดหมู่อ้างอิง .
แรงงาน
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.