เหตุใดเราจึงใช้การทดสอบ F-test แบบหางเดียวในการวิเคราะห์ความแปรปรวน (ANOVA)


13

คุณสามารถให้เหตุผลในการใช้การทดสอบแบบหางเดียวในการวิเคราะห์การทดสอบความแปรปรวนได้หรือไม่?

เหตุใดเราจึงใช้การทดสอบแบบหางเดียว - การทดสอบ F - ใน ANOVA


2
คำถามบางข้อเพื่อเป็นแนวทางในการคิดของคุณ ... สถิติเชิงลบหมายถึงอะไร? สามารถลบสถิติ F ได้หรือไม่ สถิติ F ที่ต่ำมากหมายถึงอะไร สถิติ F ที่สูงหมายถึงอะไร
russellpierce

เหตุใดคุณจึงรู้สึกว่าการทดสอบแบบด้านเดียวต้องเป็นแบบทดสอบ F เพื่อตอบคำถามของคุณ: การทดสอบ F อนุญาตให้ทดสอบสมมติฐานที่มีการรวมกันเชิงเส้นของพารามิเตอร์มากกว่าหนึ่งชุด
IMA

1
คุณต้องการที่จะรู้ว่าทำไมหนึ่งจะใช้แบบด้านเดียวแทนการทดสอบแบบสองด้าน?
Jens Kouros

@tree สิ่งใดที่ถือว่าเป็นแหล่งข้อมูลที่น่าเชื่อถือหรือเป็นทางการสำหรับจุดประสงค์ของคุณ
Glen_b -Reinstate Monica

1
ทราบว่า @tree Cynderella ของคำถามที่นี่คือไม่ได้เกี่ยวกับการทดสอบความแปรปรวน แต่เฉพาะ F-ทดสอบ ANOVA - ซึ่งเป็นที่สำหรับการทดสอบความเท่าเทียมกันของวิธีการ หากคุณสนใจในการทดสอบความเท่าเทียมกันของความแปรปรวนนั่นจะถูกกล่าวถึงในคำถามอื่น ๆ ในเว็บไซต์นี้ (สำหรับการทดสอบความแปรปรวนใช่คุณสนใจทั้งสองก้อยตามที่อธิบายไว้อย่างชัดเจนในประโยคสุดท้ายของส่วนนี้ด้านบน ' คุณสมบัติ ')
Glen_b

คำตอบ:


17

การทดสอบ F มักใช้เพื่อวัตถุประสงค์สองประการ:

  1. ใน ANOVA สำหรับการทดสอบความเท่าเทียมกันของวิธีการ (และการวิเคราะห์ที่คล้ายคลึงกันต่าง ๆ ); และ

  2. ในการทดสอบความเท่าเทียมกันของผลต่าง

ลองพิจารณากัน:

1) การทดสอบ F ใน ANOVA (และในทำนองเดียวกันการทดสอบไคสแควร์แบบปกติสำหรับข้อมูลนับ) ถูกสร้างขึ้นเพื่อให้ข้อมูลมีความสอดคล้องกับสมมติฐานทางเลือกมากขึ้นสถิติการทดสอบที่มีขนาดใหญ่ขึ้นมีแนวโน้มที่จะเป็นในขณะที่การเตรียมตัวอย่าง ข้อมูลที่มีลักษณะสอดคล้องกับค่า null มากที่สุดจะสอดคล้องกับค่าที่เล็กที่สุดของสถิติการทดสอบ

ลองพิจารณาสามตัวอย่าง (ขนาด 10 พร้อมความแปรปรวนตัวอย่างเท่ากัน) และจัดให้มีค่าเฉลี่ยตัวอย่างเท่ากันจากนั้นย้ายค่าเฉลี่ยในรูปแบบที่แตกต่างกัน เมื่อความแปรปรวนในตัวอย่างหมายถึงเพิ่มขึ้นจากศูนย์สถิติ F จะใหญ่ขึ้น:

การจัดเรียง 3 ตัวอย่างและสถิติ F ที่สอดคล้องกัน

เส้นสีดำ (||

หากสมมติฐานว่าง (ความเท่าเทียมกันของค่าเฉลี่ยประชากร) เป็นจริงคุณคาดหวังความผันแปรของค่าเฉลี่ยตัวอย่างและโดยทั่วไปคาดว่าจะเห็นอัตราส่วน F ประมาณ 1 สถิติ F ที่เล็กลงเป็นผลมาจากกลุ่มตัวอย่างที่อยู่ใกล้กันมากกว่าปกติ คาดหวัง ... คุณจะไม่สรุปความแตกต่างของประชากร

นั่นคือสำหรับ ANOVA คุณจะปฏิเสธสมมติฐานของความเท่าเทียมกันของค่าเฉลี่ยเมื่อคุณได้รับค่า F ขนาดใหญ่ผิดปกติและคุณจะไม่ปฏิเสธสมมติฐานของความเท่าเทียมกันของค่าเฉลี่ยเมื่อคุณได้รับค่าที่น้อยผิดปกติ (อาจบ่งบอกถึงบางสิ่งแต่ไม่ใช่ ประชากรมีความหมายแตกต่างกัน)

นี่คือภาพประกอบที่อาจช่วยให้คุณเห็นว่าเราต้องการปฏิเสธเฉพาะเมื่อ F อยู่ที่ส่วนบน:

คำอธิบายของ F สำหรับ ANOVA ปฏิเสธเมื่อ F-statistic อยู่ที่ส่วนบน

2) การทดสอบ F เพื่อความเท่าเทียมกันของความแปรปรวน * (ขึ้นอยู่กับอัตราส่วนความแปรปรวน) ที่นี่อัตราส่วนของการประมาณค่าความแปรปรวนตัวอย่างทั้งสองจะมีขนาดใหญ่หากความแปรปรวนตัวอย่างตัวเศษมีขนาดใหญ่กว่าความแปรปรวนในตัวส่วนมากและอัตราส่วนจะมีขนาดเล็กถ้าค่าความแปรปรวนตัวอย่างตัวส่วนมีขนาดใหญ่กว่าความแปรปรวนในตัวเศษ

นั่นคือสำหรับการทดสอบว่าอัตราส่วนของความแปรปรวนประชากรแตกต่างจาก 1 คุณจะต้องปฏิเสธค่า N ทั้งค่าขนาดใหญ่และขนาดเล็กของ F

* (ทิ้งประเด็นของความอ่อนไหวสูงต่อข้อสันนิษฐานการกระจายตัวของการทดสอบนี้ (มีทางเลือกที่ดีกว่า) และปัญหาที่ว่าหากคุณสนใจความเหมาะสมของสมมติฐานความแปรปรวนเท่ากันของ ANOVA กลยุทธ์ที่ดีที่สุดของคุณอาจไม่ใช่ การทดสอบอย่างเป็นทางการ)


2
@TaylerJones การทดสอบของ Levene ค่อนข้างแข็งแกร่งกว่า Browne-Forsythe นั้นแข็งแกร่งกว่า (แต่เสียพลังเล็กน้อยใกล้กับปกติ) Fligner-Killeen มากขึ้นอีกครั้ง ในหลายทศวรรษฉันใช้ Levene หรือ Browne-Forsythe ไม่เกินสองครั้ง (ถ้าเกิดขึ้นอีกครั้งมีแนวโน้มว่า Browne-Forsythe จะเหมาะกับฉันดี แต่โดยทั่วไปฉันไม่มีสถานการณ์ที่เหมาะสมที่จะทดสอบความแปรปรวนหลายกลุ่มเพื่อความเท่าเทียมกัน)
Glen_b

2
F=MSTREATMENTMSERROR1F

2
@ ทรีดูเหมือนว่าคุณไม่เข้าใจเกี่ยวกับการทดสอบสมมติฐานโดยทั่วไป แต่ก็ยากที่จะแน่ใจว่าอยู่ที่ไหน คุณบอกว่าคุณเข้าใจว่าถ้าคุณได้รับ F ที่มีขนาดใหญ่คุณต้องการที่จะปฏิเสธและถ้าคุณได้รับ F ที่น้อยคุณไม่ต้องการที่จะปฏิเสธ ค่าขนาดใหญ่ของ F คือค่าเหล่านั้นในหางส่วนบนในขณะที่ค่าขนาดเล็กของ F คือค่าเหล่านั้นในส่วนท้าย คุณต้องการปฏิเสธเฉพาะเมื่อค่ามีขนาดใหญ่ ... เช่นในส่วนบน แต่ไม่ได้ส่วนท้าย คุณจะไม่เห็นว่าเป็นหนึ่งในหางได้อย่างไร ฉันจะรวมพล็อตอื่นที่อาจช่วยได้
Glen_b -Reinstate Monica

1
@jeramy ความคิดเห็นของฉันอ้างถึงการทดสอบที่ขึ้นอยู่กับอัตราส่วนของความแปรปรวน (โดยเฉพาะฉันระบุ "ที่นี่อัตราส่วนของการประมาณค่าความแปรปรวนตัวอย่างสองตัวอย่างจะ ... ") การทดสอบที่คุณอ้างอิงเพื่อค้นหาความแตกต่างของตำแหน่งในส่วนที่เหลืออย่างสมบูรณ์จากการวัดตำแหน่งที่ตั้งบางแห่งเพื่อให้เห็นความแตกต่างในการแพร่กระจาย พวกมันทำงานตามปกติในการทดสอบความแตกต่างตำแหน่ง เนื่องจากฉันพยายามแสดงกรณีที่คุณจะดูที่ส่วนล่างของ F, Brown-Forsythe (และการทดสอบอื่น ๆ ที่มองหาความแตกต่างของตำแหน่งในการวัดความเบี่ยงเบนเพื่อสรุปความแตกต่างของการกระจาย) จะไม่มีประโยชน์
Glen_b - Reinstate Monica

1
@jeramy ฉันได้เพิ่มคำสองสามคำเพื่อให้ชัดเจนยิ่งขึ้น คุณอาจต้องการทราบว่าแม้ว่า Brown-Forsythe, Levene และอื่น ๆ เมื่อใช้ F-tables การกระจายตัวของสถิติการทดสอบจะไม่ได้รับการกระจายแบบ F จริง ๆ แม้จะอยู่ภายใต้สมมติฐานของการทดสอบ
Glen_b -Reinstate Monica

2

จะต้องเข้าใจว่าวัตถุประสงค์ของการวิเคราะห์ความแปรปรวนคือการตรวจสอบว่ามีความไม่เท่าเทียมกันของวิธีการ ... ซึ่งหมายความว่าเรามีความกังวลเกี่ยวกับรูปแบบขนาดใหญ่ระหว่างกลุ่มตัวอย่าง (คำนวณจากค่าเฉลี่ยตัวอย่างอีกครั้ง) เมื่อความแตกต่างระหว่างตัวอย่างมีขนาดเล็ก (ส่งผลให้ค่า F อยู่ทางด้านซ้าย) มันไม่สำคัญเนื่องจากความแตกต่างนี้ไม่มีนัยสำคัญ ความแตกต่างระหว่างตัวอย่างมีความสำคัญหากมันสูงกว่าความแปรปรวนภายใน & ในกรณีดังกล่าวค่า F จะมากกว่า 1 และในหางขวา

คำถามเดียวที่เหลืออยู่ก็คือเหตุผลที่ทำให้ระดับความสำคัญทั้งหมดอยู่ในส่วนท้ายขวา & คำตอบนั้นคล้ายกันอีกครั้ง การปฏิเสธจะเกิดขึ้นก็ต่อเมื่ออัตราส่วน F อยู่ทางด้านขวาและไม่เคยเกิดขึ้นเมื่ออัตราส่วน F อยู่ทางด้านซ้าย ระดับความสำคัญคือการวัดข้อผิดพลาดเนื่องจากข้อ จำกัด ทางสถิติ เมื่อการปฏิเสธเกิดขึ้นทางด้านขวาเท่านั้นระดับความสำคัญทั้งหมด (ความเสี่ยงข้อผิดพลาดจากการเข้าใจผิด) จะถูกเก็บไว้ในด้านขวา `


0

ค่าที่คาดหวังสำหรับ Mean Square (MS) ภายในการรักษาคือความแปรปรวนของประชากรในขณะที่ค่าคาดหวังสำหรับ MS ระหว่างการรักษาคือความแปรปรวนของประชากรบวกกับความแปรปรวนของการรักษา ดังนั้นอัตราส่วนของ F = MS ระหว่าง / MSwithin จะมากกว่า 1 เสมอและไม่น้อยกว่า 1

เนื่องจากความแม่นยำของการทดสอบแบบ 1 ด้านดีกว่าการทดสอบแบบ 2 ด้านเราจึงต้องการใช้การทดสอบแบบ 1 ด้าน


ฉันไม่เชื่อว่าการอ้างสิทธิ์ในประโยคสุดท้ายของย่อหน้าแรกของคุณถูกต้อง ... E (ตัวเศษ)> E (ตัวส่วน) ไม่ได้บอกเป็นนัยถึงตัวเศษนั้น> ตัวส่วน
Glen_b -Reinstate Monica

นอกเหนือจากจุดของ Glen_b ฉันไม่แน่ใจเกี่ยวกับ "เนื่องจากความแม่นยำของการทดสอบแบบ 1 ด้านดีกว่าการทดสอบแบบสองด้านเราจึงควรใช้การทดสอบแบบ 1 ด้าน" คุณช่วยอธิบายความหมายของสิ่งนี้ได้อย่างไร การพูดถึงความแม่นยำดูเหมือนจะทำให้ฉันพลาดจุดนี้
Silverfish

ความแม่นยำเท่ากับครึ่งความมั่นใจ สำหรับ F-stat เดียวกันการทดสอบแบบหาง 1 จะปฏิเสธสมมติฐานว่างด้วยค่า p ที่เล็กกว่า (ครึ่งจริง) อีกวิธีหนึ่งการทดสอบแบบ 1 หางสามารถปฏิเสธสมมติฐานว่างที่มีค่าน้อยกว่าของ F-stat นี่ก็หมายความว่าการทดสอบหาง 1 สามารถตรวจจับผลการรักษาที่มีตัวอย่างน้อยลงหรือมีความแปรปรวนสาเหตุที่พบบ่อยมากขึ้นในตัวอย่าง นี่ทำให้การทดสอบหาง 1 เป็นที่ต้องการมากขึ้นหากมีใครมองหาผลกระทบ
Jeff Cotter

ใช่สถิติ F ที่คำนวณได้อาจน้อยกว่า 1.0 อย่างไรก็ตามข้อสรุปจะล้มเหลวในการปฏิเสธสมมติฐานว่างของ "ไม่มีผลการรักษา" ดังนั้นจึงไม่มีภูมิภาคที่สำคัญในหางล่าง ดังนั้นการทดสอบ F คือการทดสอบแบบด้านเดียว ใน ANOVA อาร์กิวเมนต์ตรรกะจะยึดตามค่าที่คาดไว้สำหรับ MS_treat และ MS_error ภายใต้สมมติฐาน "ไม่มีผลการรักษา" H0: E (MS_treat) = E (MS_error) = ความแปรปรวนของประชากร ผลการรักษาที่สำคัญใด ๆ ส่งผลให้ HA: E (MS_treat)> E (MS_error) (ที่มาข้อความ Montgomery ใด ๆ ครอบคลุม ANOVA) ดังนั้น HA หมายถึงการทดสอบแบบด้านเดียว
Jeff Cotter
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.