หากการทดสอบ t-test และ ANOVA สำหรับสองกลุ่มนั้นเท่ากันทำไมสมมติฐานของพวกเขาจึงไม่เท่ากัน?


47

ฉันแน่ใจว่าฉันมีสิ่งนี้ล้อมรอบหัวของฉันทั้งหมด แต่ฉันก็ไม่สามารถคิดออก

t-test เปรียบเทียบการแจกแจงปกติสองรายการโดยใช้การแจกแจง Z นั่นเป็นเหตุผลที่มีการสันนิษฐานของปกติในข้อมูล

ANOVA นั้นเทียบเท่ากับการถดถอยเชิงเส้นพร้อมตัวแปรจำลองและใช้ผลรวมของกำลังสองเหมือน OLS นั่นเป็นเหตุผลว่าทำไมจึงมีข้อสันนิษฐานเกี่ยวกับภาวะปกติของ ResidualS

ฉันใช้เวลาหลายปี แต่ฉันคิดว่าในที่สุดฉันก็เข้าใจข้อเท็จจริงพื้นฐานเหล่านั้นแล้ว เหตุใดจึงต้องทดสอบ t-test เทียบเท่า ANOVA กับสองกลุ่ม พวกเขาจะเท่าเทียมกันได้อย่างไรถ้าพวกเขาไม่คิดแม้แต่เรื่องเดียวกันกับข้อมูล


15
จุดหนึ่ง: การทดสอบ t ใช้การแจกแจงแบบ t ไม่ใช่การแจกแจงแบบ Z
Jeromy Anglim

1
แม้ว่าคำถามจะไม่ถูกต้อง แต่ก็มีประโยชน์มาก นอกจากนี้ฉันคิดว่าการพูดถึง "การทดสอบแบบสองทาง" จะทำให้คำถาม / คำตอบสมบูรณ์ยิ่งขึ้น
Gaurav Singhal

คำตอบ:


29

t-test กับสองกลุ่มสันนิษฐานว่าแต่ละกลุ่มมีการกระจายตามปกติด้วยความแปรปรวนเดียวกัน (แม้ว่าค่าเฉลี่ยอาจแตกต่างกันภายใต้สมมติฐานทางเลือก) นั่นเท่ากับการถดถอยที่มีตัวแปรดัมมี่เนื่องจากการถดถอยอนุญาตให้ค่าเฉลี่ยของแต่ละกลุ่มแตกต่างกัน แต่ไม่ใช่ความแปรปรวน ดังนั้นส่วนที่เหลือ (เท่ากับข้อมูลที่มีกลุ่มหมายถึงการลบ) มีการแจกแจงแบบเดียวกันนั่นคือพวกมันมักจะกระจายด้วยศูนย์เฉลี่ย

t-test ที่มีความแปรปรวนไม่เท่ากันจะไม่เทียบเท่า ANOVA แบบทางเดียว


3
ฉันสามารถค้นหาการอ้างอิง แต่มันง่ายพอที่จะทดสอบสังเกตุ F จาก ANOVA ที่มีสองกลุ่มนั้นมีค่าเท่ากับ t ^ 2 และ p-values ​​จะเหมือนกันทุกประการ เหตุผลเดียวที่มันจะไม่เทียบเท่าในกรณีที่ผลต่างไม่เท่ากันคือถ้าคุณใช้การแก้ไข มิฉะนั้นพวกเขาจะเหมือนกัน
เบร็ท

3
F-test เป็นลักษณะทั่วไปของการทดสอบที t-test ใช้สำหรับการเปรียบเทียบ 2 การรักษาและการทดสอบ F สำหรับการรักษาหลายแบบ แหล่งที่มาอยู่ในการออกแบบทางสถิติของ Casella บทที่ 3 และ 4 อย่างไรก็ตามในฐานะศาสตราจารย์ Prof. Hyndman ชี้ให้เห็นด้วยความแปรปรวนที่ไม่เท่ากันจึงไม่ใช่การทดสอบ t อีกต่อไป มันเป็นปัญหาของฟิชเชอร์เบเรน โดยทั่วไปเราจะไม่ใช้โซลูชันของฟิชเชอร์แทนที่จะใช้วิธีทดสอบของ Welch หรือวิธีเบย์
suncoolsu

t-test สองตัวอย่างที่มีความแปรปรวนไม่เท่ากันแน่นอนเท่ากับ ANOVA แบบทางเดียวกับสองกลุ่ม บางทีสิ่งที่คุณหมายถึงคือการทดสอบแบบ t โดยใช้การแก้ไขความแปรปรวนที่ไม่เท่ากัน (เช่น Welch) ไม่เหมือนกับ ANOVA แบบทางเดียวที่ไม่ได้รับการแก้ไข (แม้ว่าจะเป็นสาเหตุ)
Brett

20

t-test เป็นกรณีพิเศษของการทดสอบ F ที่มีการเปรียบเทียบเพียงสองกลุ่ม ผลลัพธ์ของทั้งสองจะเหมือนกันในแง่ของ p-value และมีความสัมพันธ์อย่างง่ายระหว่างสถิติ F และ t เช่นกัน F = t ^ 2 การทดสอบทั้งสองนั้นมีความเท่าเทียมกันทางพีชคณิตและสมมติฐานของพวกเขาเหมือนกัน

ในความเป็นจริงแล้วความเท่าเทียมเหล่านี้ขยายไปถึงทั้งคลาสของ ANOVAs, การทดสอบ t และแบบจำลองการถดถอยเชิงเส้น t-test เป็นกรณีพิเศษของ ANOVA ANOVA เป็นกรณีพิเศษของการถดถอย ขั้นตอนเหล่านี้ทั้งหมดถูกนำเสนอภายใต้ General Linear Model และแบ่งปันสมมติฐานเดียวกัน

  1. ความเป็นอิสระของการสังเกต
  2. ความเป็นอยู่ของค่าคงที่ = ปกติในแต่ละกลุ่มในกรณีพิเศษ
  3. เท่ากับความแปรปรวนของส่วนที่เหลือ = ผลต่างที่เท่ากันในกลุ่มในกรณีพิเศษ

คุณอาจคิดว่ามันเป็นเรื่องปกติในข้อมูล แต่คุณกำลังตรวจสอบความปกติในแต่ละกลุ่ม - ซึ่งจริง ๆ แล้วเหมือนกับการตรวจสอบความปกติในส่วนที่เหลือเมื่อตัวทำนายเพียงตัวเดียวในแบบจำลองเป็นตัวบ่งชี้ของกลุ่ม เช่นเดียวกันกับความแปรปรวนที่เท่ากัน

เช่นเดียวกับการแยก R ไม่ได้มีรูทีนแยกสำหรับ ANOVA ฟังก์ชั่น anova ใน R เป็นเพียงการห่อหุ้มไปยังฟังก์ชัน lm () ซึ่งเป็นสิ่งเดียวกับที่ใช้เพื่อให้พอดีกับตัวแบบการถดถอยเชิงเส้น - บรรจุแบบที่แตกต่างกันเล็กน้อย


จะมีความสนใจที่จะรู้วิธีการวัดแบบจำลอง ANOVA ซ้ำ ๆ โดยใช้ lm
AndyF

1
ปัญหาของการเข้ารหัสตัวแปรเด็ดขาดความเท่าเทียมกันของการถดถอยและแบบจำลอง ANOVA และการเข้ารหัสการถดถอยสำหรับมาตรการซ้ำ ๆ ได้อธิบายไว้ในบทความนี้ dionysus.psych.wisc.edu/Lit/Topics/Statistics/Contrasts/ ......นี่คือการอ้างอิง ... Wendorf, CA (2004) ไพรเมอร์ในการเข้ารหัสการถดถอยหลายครั้ง: รูปแบบทั่วไปและกรณีเพิ่มเติมของความแตกต่างซ้ำ การทำความเข้าใจสถิติ 3, 47-57
เบร็ท

4
@AndyF ไม่lm()ยกเว้นว่าคุณจะย้ายไปที่โมเดลผสมด้วยnlmeหรือlme4แพ็คเกจ แต่มีวิธีที่สะดวกในการจัดการการวัดซ้ำผ่านข้อกำหนดที่เหมาะสมของErrorคำศัพท์aov()นั้นดูรายละเอียดเพิ่มเติมเกี่ยวกับการสอนบารอนและลี่ ,6.9, j.mp/ c5ME4u
CHL

@AndyF aov()ถูกสร้างขึ้นที่ด้านบนของlm()ฟังก์ชั่นรวมถึง แต่อาร์กิวเมนต์เพิ่มเติมที่เรียกว่าพิเศษErrorแง่เช่น
chl

aov () เป็นเพียง wrapper ถึง lm () มันมีความแตกต่างบางอย่างในการเข้ารหัสเบื้องหลังและบรรจุผลลัพธ์ในสไตล์ ANOVA ทั้งหมดนี้เป็นแบบจำลองโดย lm () ในบทความที่ฉันอ้างถึงข้างต้นมันจะบอกคุณถึงวิธีการตั้งค่าการเข้ารหัสเพื่อทำข้อแตกต่างซ้ำ ๆ ในตัวแบบการถดถอยรวมถึง lm ()
Brett

17

ฉันเห็นด้วยกับคำตอบของ Rob ทั้งหมด แต่ให้ฉันพูดอีกวิธีหนึ่ง (โดยใช้ wikipedia):

สมมติฐาน ANOVA :

  • ความเป็นอิสระของคดี - นี่คือสมมติฐานของรูปแบบที่ทำให้การวิเคราะห์ทางสถิติง่ายขึ้น
  • Normality - การแจกแจงของค่าตกค้างเป็นเรื่องปกติ
  • ความเสมอภาค (หรือ "ความเป็นเนื้อเดียวกัน") ของความแปรปรวนที่เรียกว่า homoscedasticity

สมมติฐานการทดสอบ t :

  • แต่ละประชากรสองคนที่ถูกเปรียบเทียบควรเป็นไปตามการแจกแจงแบบปกติ ...
  • ... ประชากรสองคนที่ถูกเปรียบเทียบควรมีความแปรปรวนเดียวกัน ...
  • ข้อมูลที่ใช้ในการทดสอบควรมีการสุ่มตัวอย่างอย่างอิสระจากประชากรสองคนที่ถูกเปรียบเทียบ

ดังนั้นฉันจะหักล้างคำถามเนื่องจากเห็นได้ชัดว่าพวกเขามีสมมติฐานเดียวกัน (แม้ว่าจะอยู่ในลำดับที่แตกต่างกัน :-))


ดูความคิดเห็นที่ Rob
Alexis

@ Alexis ฉันไม่แน่ใจว่าฉันเข้าใจ downvote ของคุณ ดูแลอย่างประณีต
Henrik

สมมติฐานการทดสอบtที่สองไม่เป็นความจริง ผลงานต้นฉบับของนักเรียนผ่านข้อสันนิษฐานนี้ แต่ "ความแปรปรวนที่ไม่เท่ากัน" เป็นข้อสันนิษฐานที่เพียงพอในการทำการทดสอบในภายหลัง
Alexis

5

จุดหนึ่งที่ชัดเจนที่ทุกคนมองข้าม: ด้วย ANOVA คุณกำลังทดสอบโมฆะว่าค่าเฉลี่ยนั้นเหมือนกันโดยไม่คำนึงถึงค่าของตัวแปรอธิบายของคุณ ด้วยการทดสอบ T-Test คุณสามารถทดสอบกรณีด้านเดียวได้ว่าค่าเฉลี่ยนั้นมีค่ามากกว่าหนึ่งค่าของตัวแปรอธิบายของคุณมากกว่าค่าอื่น ๆ


1
ยกเว้นว่าฉันเข้าใจผิดนี่ไม่ใช่ความแตกต่าง หากคุณทำ ANOVA ในสองกลุ่มคุณสามารถทำการทดสอบด้านเดียวเช่นเดียวกับการทดสอบ t ฉันใส่ "การทดสอบด้านเดียว" ในเครื่องหมายคำพูดเพราะจริงๆแล้วไม่มีความแตกต่างใน "การทดสอบ" ระหว่าง "การทดสอบด้านเดียว" และ "การทดสอบสองด้าน" ความแตกต่างเพียงอย่างเดียวคือวิธีที่คุณตีความนัยสำคัญทางสถิติของค่า p ดังนั้น "การทดสอบ" ด้านเดียวและสองด้านจึงเป็น "การทดสอบ" ที่เหมือนกันทั้งหมด วิธีการตีความผลลัพธ์ที่ถูกต้องนั้นแตกต่างกันไปเท่านั้น
Tripartio

-3

ฉันต้องการใช้ t-test เพื่อเปรียบเทียบสองกลุ่มและจะใช้ ANOVA มากกว่า 2 กลุ่มเนื่องจากเหตุผล เหตุผลสำคัญคือสมมติฐานของผลต่างที่เท่ากัน


5
ยินดีต้อนรับสู่เว็บไซต์ @syed คุณต้องการขยายคำตอบของคุณหรือไม่? ตัวอย่างเช่นคุณหมายถึง "เหตุผล" อะไร โปรดทราบว่าทั้ง t-test & ANOVA ถือว่ามีความแปรปรวนเท่ากัน
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.