การตรวจสอบสมมติฐานของโนวา


16

ไม่กี่เดือนที่ผ่านมาฉันโพสต์คำถามเกี่ยวกับการทดสอบความเป็นเนื้อเดียวกันใน R บน SO และ Ian Fellows ตอบว่า (ฉันจะถอดความคำตอบของเขาอย่างหลวม ๆ ):

การทดสอบความเป็นเนื้อเดียวกันนั้นไม่ใช่เครื่องมือที่ดีเมื่อทำการทดสอบความดีของแบบจำลองของคุณ ด้วยตัวอย่างขนาดเล็กคุณไม่มีพลังมากพอที่จะตรวจจับขาออกจากกระเทยขณะที่กลุ่มตัวอย่างขนาดใหญ่คุณมี "พลังมากมาย" ดังนั้นคุณจึงมีแนวโน้มที่จะคัดกรองแม้กระทั่งการออกเดินทางเล็กน้อยจากความเท่าเทียมกัน

คำตอบที่ยอดเยี่ยมของเขามาเป็นตบหน้าฉัน ฉันเคยตรวจสอบความเป็นมาตรฐานและข้อสมมุติฐานเรื่องความเป็นเนื้อเดียวกันทุกครั้งที่ฉันใช้ ANOVA

ในความเห็นของคุณคือวิธีปฏิบัติที่ดีที่สุดเมื่อตรวจสอบสมมติฐานของ ANOVA

คำตอบ:


11

ในการตั้งค่าที่นำไปใช้มักจะสำคัญกว่าที่จะทราบว่าการละเมิดข้อสันนิษฐานใด ๆ เป็นปัญหาสำหรับการอนุมาน

การทดสอบสมมติฐานจากการทดสอบนัยสำคัญไม่ค่อยเป็นที่สนใจในกลุ่มตัวอย่างขนาดใหญ่เนื่องจากการทดสอบเชิงอนุมานส่วนใหญ่มีความทนทานต่อการละเมิดสมมติฐานเล็กน้อย

หนึ่งในคุณสมบัติที่ดีของการประเมินแบบกราฟิกของสมมติฐานคือพวกเขามุ่งความสนใจไปที่ระดับของการละเมิดไม่ใช่ความสำคัญทางสถิติของการละเมิดใด ๆ

อย่างไรก็ตามคุณยังสามารถมุ่งเน้นไปที่ข้อมูลสรุปตัวเลขของคุณซึ่งกำหนดระดับของการละเมิดสมมติฐานและไม่ได้มีนัยสำคัญทางสถิติ (เช่นค่าความเบ้ค่าค่าเคิร์ตซีอัตราส่วนของความแปรปรวนของกลุ่มที่เล็กที่สุดและน้อยที่สุดเป็นต้น) นอกจากนี้คุณยังสามารถรับข้อผิดพลาดมาตรฐานหรือช่วงความมั่นใจในค่าเหล่านี้ซึ่งจะมีขนาดเล็กลงด้วยตัวอย่างขนาดใหญ่ มุมมองนี้สอดคล้องกับแนวคิดทั่วไปที่นัยสำคัญทางสถิติไม่เทียบเท่ากับความสำคัญในทางปฏิบัติ


1
+1 สำหรับคำตอบที่ยอดเยี่ยมที่รวมทุกอย่างไว้ วิธีการใช้วิธีการเชิงตัวเลขที่กล่าวถึงเป็นอย่างดีและมีใช้อธิบายไว้ใน Tabachnik และ Fidell ของใช้หลายตัวแปรสถิติ (สำหรับโปรแกรม SPSS และ SAS): amazon.com/Using-Multivariate-Statistics-Barbara-Tabachnick/dp/... ( แต่ดู Erratas บน พร้อมกับหน้าเว็บ)
Henrik

ฉันคิดว่าสรุปเวลาส่วนใหญ่เช่นความเบ้และความโด่งมีค่าน้อยการเปลี่ยนแปลงการสุ่มตัวอย่างของพวกเขานั้นใหญ่มาก หนึ่งสามารถพิจารณาแทนที่ด้วย L_skewness และ L-kurtosis แม้ว่า
kjetil b halvorsen

@kjetilbhalvorsen ฉันคิดว่ามันขึ้นอยู่กับประเภทขนาดตัวอย่างที่คุณมักใช้ด้วย จากประสบการณ์ของฉันการแปลงและสถิติความเบ้มีประโยชน์มากในการทำความเข้าใจเกี่ยวกับการกระจายของข้อมูล
Jeromy Anglim

@Jeromy Anglim: ตกลง ถ้าอย่างนั้นฉันคิดว่าคุณมักจะมีขนาดตัวอย่างใหญ่มาก! คุณลอง bootstrap ค่าสัมประสิทธิ์ความเบ้ของคุณหรือ kurtosis หรือไม่?
kjetil b halvorsen

9

สองสามกราฟมักจะให้ความสว่างมากกว่าค่า p จากการทดสอบความเป็นปกติหรือ homoskedasticity พล็อตสังเกตตัวแปรตามกับตัวแปรอิสระ พล็อตข้อสังเกตกับพอดี พล็อตที่เหลือเทียบกับตัวแปรอิสระ สำรวจสิ่งที่ดูแปลก ๆ ในแปลงเหล่านี้ หากสิ่งที่ไม่ได้ดูแปลกฉันจะไม่กังวลเกี่ยวกับการทดสอบสมมติฐานที่สำคัญ


คำแนะนำที่ดีมักใช้เวลา แต่สิ่งที่เกี่ยวกับกรณีของชุดข้อมูลขนาดใหญ่ที่คุณไม่สามารถดูข้อมูลทั้งหมดด้วยตนเองได้?
dsimcha

1
@dsimcha นอกจากนี้ยังขึ้นอยู่กับขนาดตัวอย่างต่อกลุ่ม มันเป็นที่รู้จักตัวอย่างเช่นเมื่อตัวอย่างมีขนาดเท่ากันการทดสอบ t นั้นมีความทนทานเมื่อเทียบกับการออกเดินทางจากข้อสันนิษฐานความเป็นเนื้อเดียวกัน ถ้าn1n2ดังนั้นความน่าจะเป็นที่จะเกิดข้อผิดพลาดประเภท I <α ถ้ายิ่งใหญ่ σ2มีความเกี่ยวข้องกับกลุ่มตัวอย่างขนาดใหญ่และในทางกลับกัน ดู Zar, JH การวิเคราะห์ชีวสถิติ (ฉบับที่ 4, Prentice Hall, 1998) สำหรับการอ้างอิงเพิ่มเติม
chl

2
@dsimcha re ชุดข้อมูลขนาดใหญ่: ขึ้นอยู่กับสิ่งที่คุณหมายถึงโดย "ใหญ่" ข้อสังเกตมากมาย? ใช้กราฟิกที่ดี (boxplot, dotplots ที่กระวนกระวายใจ, sunflowerplots) ตัวแปรอิสระมากมาย? ใช่คุณมีประเด็นอยู่ตรงนั้น ... แต่ถ้าคุณมี IV จำนวนมากที่คุณไม่สามารถพล็อต DV เทียบกับแต่ละ IV ได้ฉันถามคำถามด้วยการใช้ ANOVA เลย - ดูเหมือนว่ามันอาจตีความได้ยาก กรณี. วิธีการเรียนรู้ของเครื่องอัจฉริยะบางอย่างอาจดีกว่า (Brian D. Ripley: "การถอดความเร้าใจ, 'การเรียนรู้ของเครื่องจักรคือสถิติลบการตรวจสอบโมเดลและสมมติฐาน' ')
S. Kolassa - Reinstate Monica

ความคิดเห็นดี +1 แม้ว่าคำถามเฉพาะนี้เกี่ยวกับ ANOVA แต่ฉันคิดในระดับทั่วไปเกี่ยวกับคำถามเรื่องการแปลงกับการทดสอบเมื่อฉันเขียนคำตอบ
dsimcha

4

คู่มือแนะนำเว็บที่ดีมากในการตรวจสอบสมมติฐานของ ANOVA และสิ่งที่ต้องทำหากล้มเหลว นี่คือหนึ่ง นี่คืออีกหนึ่ง

เป็นหลักตาของคุณเป็นผู้ตัดสินที่ดีที่สุดเพื่อทำบางการวิเคราะห์ข้อมูลการสำรวจ นั่นหมายถึงการพล็อตข้อมูล - ฮิสโทแกรมและพล็อตกล่องเป็นวิธีที่ดีในการประเมินความเป็นปกติและ homoscedascity และโปรดจำไว้ว่า ANOVA นั้นแข็งแกร่งต่อการละเมิดเล็กน้อยเหล่านี้


4

QQ Plots are pretty good ways to detect non-normality.

For homoscedasticity, try Levene's test or a Brown-Forsythe test. Both are similar, though BF is a little more robust. They are less sensitive to non-normality than Bartlett's test, but even still, I've found them not to be the most reliable with small sample sizes.

Q-Q plot

Brown-Forsythe test

Levene's test


แผนการกระจายสัมพัทธ์ (หรือตัวอย่างเมื่อเทียบกับการแจกแจงแบบปกติ) อาจเป็นการทดแทนที่ดีเนื่องจากการตีความของพวกเขาอาจชัดเจนขึ้นสำหรับผู้เริ่มต้น
kjetil b halvorsen

3

ฉันเห็นด้วยกับคนอื่น ๆ ว่าการทดสอบสมมติฐานอย่างมีนัยสำคัญเป็นปัญหา

ฉันชอบที่จะจัดการกับปัญหานี้ด้วยการสร้างพล็อตเดียวที่เปิดเผยข้อสมมติฐานทั้งหมดที่จำเป็นต้องมีข้อผิดพลาดประเภท I ที่ถูกต้องและข้อผิดพลาดประเภท II ต่ำ (พลังงานสูง) สำหรับกรณีของ ANOVA ที่มี 2 กลุ่ม (สองตัวอย่าง t-test) พล็อตนี้เป็นค่าผกผันตามปกติของฟังก์ชันการแจกแจงสะสมเชิงประจักษ์ (ECDF) แบ่งเป็นชั้น ๆ ตามกลุ่ม (ดูความเห็นพล็อต QQ ในโพสต์ก่อนหน้า) เพื่อให้การทดสอบ t ทำได้ดีเส้นโค้งทั้งสองจะต้องเป็นเส้นตรงขนาน สำหรับการk- ปัญหาตัวอย่างของ ANOVA โดยทั่วไปคุณจะมี k เส้นตรงขนาน

วิธีกึ่งพาราเมตริก (อันดับ) เช่นการทดสอบ Wilcoxon และ Kruskal-Wallis ทำให้สมมติฐานน้อยลงมาก logit ของ ECDF ควรเป็นแบบขนานสำหรับการทดสอบ Wilcoxon-Kruskal-Wallis เพื่อให้ได้พลังงานสูงสุด (ข้อผิดพลาด type I ไม่เคยเป็นปัญหาสำหรับพวกเขา) ไม่จำเป็นต้องเป็นเชิงเส้น การทดสอบอันดับทำให้สมมติฐานเกี่ยวกับการแจกแจงของกลุ่มต่าง ๆ ที่เกี่ยวข้องกับอื่น ๆ แต่ไม่ได้ตั้งสมมติฐานเกี่ยวกับรูปร่างของการแจกแจงแบบใดแบบหนึ่ง


2
ดูเพิ่มเติมstats.stackexchange.com/questions/190223/…
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.