ออกเดินทางจากสมมติฐานปกติใน ANOVA: kurtosis หรือความเบ้สำคัญกว่าหรือไม่?


12

ประยุกต์แบบจำลองเชิงสถิติเชิงเส้นโดย Kutner และคณะ ระบุเกี่ยวกับการออกเดินทางต่อไปนี้จากสมมติฐานปกติของแบบจำลอง ANOVA: ความโด่งของการกระจายข้อผิดพลาด (อย่างใดอย่างหนึ่งมากหรือน้อยกว่ายอดการกระจายปกติ) มีความสำคัญมากกว่าเบ้ของการกระจายในแง่ของผลกระทบต่อการวินิจฉัย

ฉันรู้สึกสับสนนิดหน่อยจากคำแถลงนี้และไม่สามารถหาข้อมูลที่เกี่ยวข้องได้ทั้งในหนังสือหรือออนไลน์ ฉันสับสนเพราะฉันยังได้เรียนรู้ว่าแผนการ QQ ที่มีหางหนาเป็นข้อบ่งชี้ว่าสมมติฐานเชิงบรรทัดฐานคือ "ดีพอ" สำหรับโมเดลการถดถอยเชิงเส้นในขณะที่ QQ แปลงที่เบ้เป็นเรื่องที่น่าเป็นห่วงมากกว่า (เช่นการเปลี่ยนแปลงอาจเหมาะสม) .

ฉันถูกต้องหรือไม่ว่าการใช้เหตุผลเดียวกันสำหรับ ANOVA และการเลือกคำศัพท์ของพวกเขา ( สำคัญกว่าในแง่ของผลกระทบที่มีต่อการอนุมาน ) ได้รับการคัดเลือกไม่ดี? นั่นคือการแจกแจงแบบเบ้มีผลกระทบที่รุนแรงกว่าและควรหลีกเลี่ยงในขณะที่ปริมาณเคิร์ตซีสปริมาณเล็กน้อยสามารถยอมรับ

แก้ไข: ตามที่ได้รับการยอมรับจาก rolando2 มันยากที่จะกล่าวว่าสิ่งหนึ่งสำคัญกว่าอีกกรณีในทุกกรณี แต่ฉันแค่มองหาข้อมูลเชิงลึกทั่วไป ปัญหาหลักของฉันคือฉันได้รับการสอนว่าในการถดถอยเชิงเส้นอย่างง่าย QQ-plot ที่มีหางที่หนักกว่า (= kurtosis?) ก็โอเคเนื่องจากการทดสอบ F นั้นค่อนข้างแข็งแกร่งเทียบกับเรื่องนี้ ในทางกลับกัน QQ-แผนการแปลง (รูปทรงพาราโบลา) มักเป็นปัญหาที่ใหญ่กว่า สิ่งนี้ดูเหมือนจะขัดแย้งกับแนวทางที่ตำราเรียนของฉันให้ ANOVA แม้ว่าแบบจำลอง ANOVA สามารถแปลงเป็นแบบจำลองการถดถอยและควรมีสมมติฐานเดียวกัน

ฉันเชื่อว่าฉันมองอะไรบางอย่างหรือมีสมมติฐานที่ผิดพลาด แต่ฉันไม่สามารถเข้าใจได้ว่ามันจะเป็นอะไร


3
ในการตรวจสอบของเขาเกี่ยวกับความรุนแรง, DeCarlo (1997) แนะนำตรงข้ามที่แน่นอน, เอียงที่มีความสำคัญในการวิเคราะห์ความแปรปรวนและการทดสอบอื่น ๆ ของวิธีการที่เท่าเทียมกัน คุณอาจพบการอ้างอิงในหน้า 297 ว่ามีประโยชน์: columbia.edu/~ld208/psymeth97.pdf
Anthony

1
ฉันพบว่าคำถามมีประสิทธิผลมากที่สุดหากสามารถแก้ไขได้ในคำแถลงเช่น "ความเบ้สำคัญยิ่งกว่าการอนุมานมากกว่า kurtosis ที่ความเบ้ในระดับ ___ โดยทั่วไปแล้วจะบิดเบือนผลลัพธ์มากเท่ากับ kurtosis ที่ระดับ ___ ." หากไม่มีการวัดปริมาณดังกล่าวเพียงเพื่อบอกว่าอย่างใดอย่างหนึ่งสำคัญกว่าไม่ได้ช่วยอะไรเรามากนัก
rolando2

การจำลองนี้emis.de/journals/HOA/ADS/Volume7_4/206.pdfโดย Khan and Rayner (2003) ในวารสารคณิตศาสตร์ประยุกต์และการตัดสินใจระบุว่า "การทดสอบทั้ง ANOVA และ Kruskal-Wallis ของการแจกแจงความผิดพลาดมากกว่าความเบ้ "(หน้า 204)
bsbk

คำถามที่เกี่ยวข้องอย่างใกล้ชิดเกี่ยวกับการทดสอบสองตัวอย่าง - การวิเคราะห์ความแปรปรวนทางเดียวที่มีสองระดับในปัจจัย - คือstats.stackexchange.com/questions/38967/ …ขณะนี้มีการเพิ่มค่าตอบแทนการอ้างอิงว่าไม่มีคำตอบที่มีอยู่ใด ๆ ที่มีการอ้างอิงดังนั้นผู้ตอบคำถามนี้อาจต้องการที่จะดู
Silverfish

ฉันเห็นด้วยกับ @ rolando2: "ความเบ้นั้นแย่กว่า kurtosis" หรือในทางกลับกันเป็นคำพูดที่ค่อนข้างไร้สาระโดยไม่ต้องพูดถึงระดับความเบ้ / kurtosis แต่ยังต้องพิจารณาอีกมาก! ตัวอย่างเช่นความทนทานต่อการละเมิดกฎเกณฑ์เหล่านี้ส่วนหนึ่งขึ้นอยู่กับว่าขนาดของกลุ่มเท่ากันหรือไม่และความแข็งแกร่งของความเบ้นั้นขึ้นอยู่กับทิศทางของความเบ้ - มันแย่กว่านี้หากกลุ่มหนึ่งเบี่ยงเบนทางเดียวและกลุ่มอื่น ๆ ทางตรงกันข้ามกว่าถ้าทั้งสองกลุ่มเบ้ไปในทิศทางเดียวกัน (นี่คือจากหน่วยความจำและการทดสอบซ้ำ แต่เป็นประเภทของ ANOVA.)
Silverfish

คำตอบ:


6

ความยากลำบากคือความเบ้และความโด่งขึ้นอยู่กับ; เอฟเฟกต์ของพวกเขาไม่สามารถแยกออกจากกันได้อย่างสมบูรณ์

ปัญหาคือว่าถ้าคุณต้องการตรวจสอบผลกระทบของการกระจายแบบเอียงสูงคุณต้องมีการแจกแจงที่มีความรุนแรงสูงด้วย

โดยเฉพาะอย่างยิ่งโด่ง *เบ้ 12+1

* (ขนาดปกติช่วงเวลาที่สี่ปกติไม่เกินส่วนเกิน)

Khan และ Rayner (ซึ่งถูกกล่าวถึงในคำตอบก่อนหน้านี้) ทำงานร่วมกับครอบครัวที่อนุญาตการสำรวจผลกระทบของความเบ้และ kurtosis แต่พวกเขาไม่สามารถหลีกเลี่ยงปัญหานี้ได้ดังนั้นพวกเขาจึงพยายามแยกพวกเขาออกอย่างรุนแรง สามารถสำรวจความเบ้

หากหนึ่งถือโด่ง (ที่ ) คงที่หนึ่งไม่สามารถให้มากขึ้นกว่าเบ้beta_2-1} ถ้าใครอยากจะพิจารณาการแจกแจงแบบ Unimodal ความเบ้นั้น จำกัด มากยิ่งขึ้นβ2β21

ตัวอย่างเช่นหากคุณต้องการเห็นผลกระทบของความเบ้สูง - พูดความเบ้> 5 คุณจะไม่สามารถรับการแจกแจงที่มี kurtosis น้อยกว่า 26!

ดังนั้นหากคุณต้องการตรวจสอบผลกระทบของความเบ้สูงคุณไม่สามารถหลีกเลี่ยงการตรวจสอบผลกระทบของภาวะความเค็มสูงได้ ดังนั้นหากคุณพยายามแยกพวกเขาออกคุณจะไม่สามารถประเมินผลของการเพิ่มความเบ้ไปสู่ระดับสูงได้

ที่กล่าวว่าอย่างน้อยสำหรับตระกูลการแจกจ่ายที่พวกเขาพิจารณาและภายในขอบเขตที่ความสัมพันธ์ระหว่างพวกเขาโพสท่าการสอบสวนโดย Khan และ Rayner ดูเหมือนจะชี้ให้เห็นว่าการทำหน้าที่เป็นปัญหาหลัก

อย่างไรก็ตามแม้ว่าข้อสรุปจะเป็นเรื่องทั่วไปหากคุณมีการแจกแจงความเบ้ (พูด) 5 คุณอาจรู้สึกสบายใจเล็กน้อยที่จะพูดว่า "แต่ไม่ใช่ความเบ้ซึ่งเป็นปัญหา!" - เมื่อความเบ้ของคุณคือคุณจะไม่สามารถได้รับความโด่งจากปกติและยิ่งไปกว่านั้นความโด่งขั้นต่ำที่เป็นไปได้จะเพิ่มขึ้นอย่างรวดเร็วเมื่อความเบ้เพิ่มขึ้น>2


11

ปัญหานี้แก้ไขได้ใน"ความทนทานต่อการไม่ได้มาตรฐานของการทดสอบทั่วไปสำหรับปัญหาสถานที่หลายตัวอย่าง"โดย Khan และ Rayner

พวกเขาพบว่าการทดสอบ ANOVA นั้นได้รับผลกระทบจากความรุนแรงมากกว่าความเบ้อย่างมากและผลของความเบ้นั้นไม่เกี่ยวข้องกับทิศทางของมัน

หากสงสัยว่ามีความคลาดเคลื่อนจากภาวะปกติการทดสอบ Kruskal-Wallis อาจเป็นทางเลือกที่ดีกว่า ทดสอบ Kruskal-Wallis มีประสิทธิภาพมากขึ้นเพื่อเบี่ยงเบนไปจากปกติเพราะมันตรวจสอบสมมติฐานว่าการรักษามีเดียเหมือนกัน ANOVA ตรวจสอบสมมติฐานว่าการรักษาวิธีการเหมือนกัน


นี่ก็บ่งบอกว่าฉันควรตีความ QQ-plot ให้แตกต่างกันสำหรับการถดถอยเชิงเส้นและ ANOVA หรือไม่? การเปลี่ยนแปลงส่วนใหญ่ที่ฉันทำลดความเบ้ลง แต่เหลือก้อยหนักเล็กน้อย (= kurtosis?) ฉันรู้สึกว่าการทดสอบ F นั้นแข็งแกร่งพอที่จะรับมือกับเรื่องหลัง แต่ไม่ใช่ในอดีต หรือ "tails หนักตกลง" นี่เป็นความเข้าใจผิดในส่วนของฉันหรือไม่ ฉันไม่สามารถจินตนาการได้ว่ามีความแตกต่างพื้นฐานระหว่างทั้งสองเนื่องจากแบบจำลอง ANOVA สามารถเขียนใหม่เป็นแบบจำลองการถดถอยเชิงเส้น
เซนิต
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.