ทำไมการวัดซ้ำ ANOVA จึงถือว่าเป็นทรงกลม?


10

ทำไมการวัดซ้ำ ANOVA จึงถือว่าเป็นทรงกลม?

โดยความกลมกลืนฉันหมายถึงการสันนิษฐานว่าความแปรปรวนของความแตกต่างของจำนวนคู่ระหว่างกลุ่มควรจะเท่ากัน

โดยเฉพาะอย่างยิ่งฉันไม่เข้าใจว่าทำไมสิ่งนี้จึงควรเป็นข้อสันนิษฐานและไม่ใช่ว่าความแปรปรวนของกลุ่มที่สังเกตได้นั้นเหมือนกัน


1
ดังที่ฉันได้แสดงความคิดเห็นไว้ที่นี่เนื่องจากความแตกต่างของตัวแปรระหว่างระดับ RM นั้นเกิดขึ้นจากการกำเนิดของพวกเขาความกลมกลืนจึงบอกเป็นนัยว่าพวกเขามีความแปรปรวนเดียวกัน
ttnphns

1
ก่อนที่จะตอบจะเป็นประโยชน์ถ้ารู้ว่าคุณเข้าใจหรือไม่ว่าทำไมมาตรการอิสระ ANOVA จึงมีข้อสันนิษฐานเกี่ยวกับความแปรปรวนแบบเดียวกัน
จอห์น

@John ความเข้าใจของฉันคือคำตอบที่stats.stackexchange.com/questions/81914/…ตอบคำถามอย่างถูกต้อง
user1205901 - Reinstate Monica

@ttnphns น่าเสียดายที่ฉันไม่เข้าใจคำตอบของคุณ คุณหรือผู้โพสต์อื่น ๆ สนใจที่จะหมุนมันออกเป็นการตอบสนองที่ละเอียดกว่านี้ไหม?
user1205901 - Reinstate Monica

คำตอบ:


2

สัญชาตญาณที่อยู่เบื้องหลังการสันนิษฐานว่าเป็นทรงกลม

หนึ่งในข้อสันนิษฐานของมาตรการทั่วไปที่ไม่ได้ทำซ้ำ ANOVA คือความแปรปรวนที่เท่าเทียมกันในทุกกลุ่ม

(เราสามารถเข้าใจได้เพราะความแปรปรวนเท่ากันหรือที่เรียกว่าhomoscedasticityเป็นสิ่งจำเป็นสำหรับตัวประมาณ OLS ในการถดถอยเชิงเส้นจะเป็นสีน้ำเงินและสำหรับการทดสอบ t ที่สอดคล้องกันจะถูกต้องดูทฤษฎีบทเกาส์ - มาร์กอฟและ ANOVA การถดถอย.)

งั้นลองลดกรณี RM-ANOVA เป็นกรณีที่ไม่ใช่ RM เพื่อความเรียบง่ายฉันจะจัดการกับปัจจัยหนึ่ง RM-ANOVA (โดยไม่มีผลกระทบระหว่างเรื่องใด ๆ ) ที่มีวิชาที่บันทึกในเงื่อนไขk RMnk

แต่ละวิชาสามารถมีออฟเซ็ตเฉพาะเรื่องของตนเองหรือสกัดกั้น หากเราลบค่าในกลุ่มหนึ่งจากค่าในกลุ่มอื่นทั้งหมดเราจะยกเลิกการสกัดกั้นเหล่านี้และมาถึงสถานการณ์เมื่อเราสามารถใช้ non-RM-ANOVA เพื่อทดสอบแตกต่างของกลุ่มk - 1เป็นศูนย์ทั้งหมดหรือไม่ สำหรับการทดสอบนี้จะเป็นที่ถูกต้องเราต้องสมมติฐานของความแปรปรวนที่เท่ากันของเหล่าk - 1ความแตกต่างk-1k-1

ตอนนี้เราสามารถลบกลุ่ม # 2 จากกลุ่มอื่นทั้งหมดมาถึงความแตกต่างที่ควรมีความแปรปรวนเท่ากัน สำหรับแต่ละกลุ่มจากkความแปรปรวนของความแตกต่างk - 1 ที่สอดคล้องกันควรเท่ากัน ตามมาอย่างรวดเร็วว่าความแตกต่างที่เป็นไปได้k ( k - 1 ) / 2ควรเท่ากันk-1kk-1k(k-1)/2

ซึ่งเป็นข้อสันนิษฐานที่แม่นยำของทรงกลม

ทำไมความแตกต่างของกลุ่มไม่ควรเท่ากัน?

เมื่อเราคิดว่า RM-ANOVA เรามักจะคิดว่ารูปแบบการผสมรูปแบบสไตล์ที่เรียบง่ายสารเติมแต่งในรูปแบบที่α ฉันที่มีผลกระทบเรื่องβ เจมี ผลกระทบสภาพและε ~ N ( 0 , σ 2 )

YผมJ=μ+αผม+βJ+εผมJ,
αผมβJε~ยังไม่มีข้อความ(0,σ2)

สำหรับรุ่นนี้แตกต่างจะเป็นไปตามกลุ่มคือทุกคนจะมีความแปรปรวนเดียวกัน2 σ 2เพื่อให้เป็นทรงกลมถือ แต่แต่ละกลุ่มจะตามด้วยส่วนผสมของn Gaussians ด้วยค่าเฉลี่ยที่α iและค่าความแปรปรวนσ 2ซึ่งเป็นการกระจายที่ซับซ้อนด้วยความแปรปรวนV ( α , σ 2 )ที่คงที่ตลอดทั้งกลุ่มยังไม่มีข้อความ(βJ1-βJ2,2σ2)2σ2nαผมσ2V(α,σ2)

ดังนั้นในโมเดลนี้แน่นอนความแปรปรวนของกลุ่มก็เหมือนกัน covariances กลุ่มนี้ยังมีเหมือนกันที่มีความหมายว่ารูปแบบนี้หมายถึงความสมมาตรสารประกอบ นี่คือเงื่อนไขที่เข้มงวดมากขึ้นเมื่อเทียบกับความกลม เป็นอาร์กิวเมนต์ที่ใช้งานง่ายของฉันข้างต้นแสดงให้เห็นว่า RM-ANOVA สามารถทำงานได้ดีในสถานการณ์ทั่วไปมากขึ้นเมื่อรูปแบบสารเติมแต่งที่เขียนข้างต้นไม่ได้ถือ

คำสั่งทางคณิตศาสตร์ที่แม่นยำ

ฉันจะไปเพิ่มที่นี่บางสิ่งบางอย่างจากHuynh & Feldt 1970 อัตราส่วนภายใต้เงื่อนไขที่ Mean Square ในวัดซ้ำ Designs มีแน่นอนF -Distributions

จะเกิดอะไรขึ้นเมื่อทรงกลมแตก

เมื่อทรงกลมไม่ถือเราอาจคาดหวังว่า RM-ANOVA ถึง (i) มีขนาดที่สูงเกินจริง (ข้อผิดพลาดประเภทที่ 1 มากขึ้น) (ii) มีพลังงานลดลง (ข้อผิดพลาดประเภท II เพิ่มเติม) เราสามารถสำรวจได้โดยการจำลองสถานการณ์ แต่ฉันจะไม่ทำที่นี่


4

ปรากฎว่าผลของการละเมิด sphericity คือการสูญเสียพลังงาน (เช่นความน่าจะเป็นที่เพิ่มขึ้นของข้อผิดพลาด Type II) และสถิติทดสอบ (F-ratio) ที่ไม่สามารถเปรียบเทียบกับค่า tabulated ของการแจกแจงแบบ F การทดสอบ F กลายเป็นเสรีนิยมเกินไป (เช่นสัดส่วนการปฏิเสธสมมติฐานว่างใหญ่กว่าระดับอัลฟ่าเมื่อสมมติฐานว่างเป็นจริง

การตรวจสอบที่แม่นยำของเรื่องนี้เกี่ยวข้องมาก แต่โชคดีที่ Box et al เขียนบทความเกี่ยวกับเรื่องนี้: https://projecteuclid.org/download/pdf_1/euclid.aoms/1177728786

ในระยะสั้นสถานการณ์มีดังนี้ ก่อนอื่นสมมติว่าเรามีปัจจัยหนึ่งที่วัดการออกแบบซ้ำกับอาสาสมัคร S และการทดลองทดลองในกรณีนี้ผลของตัวแปรอิสระจะถูกทดสอบโดยการคำนวณสถิติ F ซึ่งคำนวณเป็นอัตราส่วนของกำลังสองเฉลี่ยโดยกำลังสองเฉลี่ย ของการปฏิสัมพันธ์ระหว่างปัจจัยเรื่องและตัวแปรอิสระ เมื่อความกลมมีสถิตินี้มีการแจกแจงแบบฟิชเชอร์กับและυ 2 = ( A - 1 ) ( S - 1 )องศาอิสระυ1=A-1υ2=(A-1)(S-1)

ในบทความข้างต้นกล่องเปิดเผยว่าเมื่อกลมล้มเหลวจำนวนที่ถูกต้องขององศาอิสระกลายเป็นอัตราส่วน F ขึ้นอยู่กับความกลมεชอบโดย: υ 1 = ε ( - 1 ) υ 2 = ε ( - 1 ) ( S - 1 )υ1ε

υ1=ε(A-1)
υ2=ε(A-1)(S-1)

นอกจากนี้ Box ยังได้แนะนำดัชนี sphericity ซึ่งใช้กับเมทริกซ์ความแปรปรวนร่วมของประชากร ถ้าเราเรียกรายการของตาราง Axa นี้แล้วดัชนีξa,a

ε=(Σaξa,a)2(A-1)Σa,a'ξa,a'2

ดัชนี Box of sphericity เป็นที่เข้าใจกันดีที่สุดเกี่ยวกับค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม จำได้ว่าเมทริกซ์ความแปรปรวนร่วมเป็นคลาสของเมทริกซ์กึ่งบวกแน่นอนและดังนั้นจึงมีค่าลักษณะเฉพาะเป็นค่าว่างเสมอ ดังนั้นสภาพความเป็นทรงกลมจึงเท่ากับค่าลักษณะเฉพาะทั้งหมดเท่ากับค่าคงที่

ดังนั้นเมื่อมีการละเมิด sphericity เราควรใช้การแก้ไขบางอย่างสำหรับสถิติ F ของเราและตัวอย่างที่เด่นที่สุดของการแก้ไขนี้คือ Greenhouse-Geisser และ Huynh-Feldt

หากไม่มีการแก้ไขผลลัพธ์ของคุณจะลำเอียงและไม่น่าเชื่อถือ หวังว่านี่จะช่วยได้!


+1 ฉันจะแสดงความคิดเห็นเพิ่มเติมในภายหลัง แต่สำหรับตอนนี้ย่อหน้าแรกของคุณผสมผสานพลังและขนาดของการทดสอบเข้าด้วยกัน อะไรคือความผิดปกติเมื่อมีการละเมิดทรงกลม? อัตราความผิดพลาดประเภทที่ฉันเป็นโมฆะ? หรือพลัง? หรือทั้งคู่? คุณอาจหมายถึงทั้งสอง แต่สูตรไม่ชัดเจน (ฉันคิดว่า) นอกจากนี้ยังไม่ใช่ "Box et al" มันเป็น Box alone :)
amoeba

ฉันคิดว่าพลังส่วนใหญ่จะลดลงเพราะตามที่ Box แสดงเมื่อทรงกลมถูกละเมิดเราต้องพึ่งพาสถิติที่แตกต่างอย่างสิ้นเชิง (ด้วยองศาอิสระอีกระดับ) หากเราไม่พึ่งพาสิ่งนั้นขึ้นอยู่กับว่าการละเมิดของเราแข็งแกร่งแค่ไหนเราจะมีสัดส่วนการปฏิเสธสมมติฐานว่างมากขึ้น
นักวิชาการที่กว้างใหญ่

ขออภัยคุณยังสับสนในขณะนี้โดยความคิดเห็นของคุณ: "สัดส่วนที่ใหญ่กว่าของการปฏิเสธโมฆะ" - คุณหมายถึงเมื่อโมฆะจริงหรือไม่ แต่นี่ไม่เกี่ยวอะไรกับกำลังงานนี่เป็นอัตราความผิดพลาดประเภทที่ 1
อะมีบา

+10 ฉันให้รางวัลแก่คำตอบของฉัน: มันดีและเป็นคำตอบเดียวที่ปรากฏในช่วงเวลาโปรดปราน ฉันไม่พอใจอย่างเต็มที่กับคำตอบของคุณ (และยัง?) และฉันเริ่มเขียนคำตอบของฉันเอง (ปัจจุบันยังไม่สมบูรณ์ แต่โพสต์แล้ว) แต่ฉันมีความเข้าใจเพียงบางส่วนเกี่ยวกับคณิตศาสตร์พื้นฐาน คำตอบของคุณช่วยอย่างแน่นอนและการอ้างอิงถึง Box 1954 ก็มีประโยชน์มาก
อะมีบา

εεξA×A

1

YผมJkผม=1,...,ผม;J=1,...,J;k=1,...,K.

ค่าเฉลี่ยตัวอย่างของกลุ่ม i-th คือ

Y¯ผม..=1JKΣJ=1JΣk=1KYผมJk

และนั่นคือเรื่องของ ij-th

Y¯ผมJ.=1KΣk=1KYผมJk

โดยการสมมติความเป็นอิสระของอาสาสมัครความแปรปรวนของความแตกต่างระหว่างสองกลุ่มหมายความว่า

VaR(Y¯ผม..-Y¯ผม'..)=1J2ΣJ=1JVaR(Y¯ผมJ.)+1J2ΣJ'=1JVaR(Y¯ผม'J'.)

VaR(Y¯ผมJ.)σ2/Kσ2VaR(Y¯ผมJ.)

ทีนี้คำถามเกี่ยวกับการทรงกลมที่เกิดขึ้น

Y¯..k-Y¯..k'

Y¯..k=1ผมJΣผม=1ผมΣJ=1JYผมJk.
YผมJkYผมJk'

VaR(Y¯..k-Y¯..k')=1(ผมJ)2Σผม=1ผมΣJ=1JVaR(YผมJk-YผมJk')

ดังนั้นการสมมติว่าค่าความแปรปรวนคงที่ของความแตกต่างของจำนวนคู่ทั้งหมดทำให้สามารถใช้การทดสอบ t ได้เมื่อประมาณค่าความแปรปรวนทั่วไป สมมติฐานนี้พร้อมกับความแปรปรวนคงที่ของการสังเกตแต่ละครั้งก็หมายความว่าค่าความแปรปรวนร่วมระหว่างคู่การวัดใด ๆ นั้นคงที่ในทุกคู่ - เซอร์จิโอมีโพสต์ที่ยอดเยี่ยมในหัวข้อนี้ สมมติฐานจึงทำให้โครงสร้างความแปรปรวนร่วม - ความแปรปรวนร่วมสำหรับการวัดซ้ำของแต่ละเรื่องเป็นเมทริกซ์ที่มีค่าคงที่ในแนวทแยงมุมและค่าคงที่นอกแนวทแยงมุมอื่น เมื่อรายการนอกแนวทแยงเป็นศูนย์ทั้งหมดมันจะลดลงเป็นโมเดลอิสระทั้งหมด (ซึ่งอาจไม่เหมาะสมสำหรับการศึกษาการวัดซ้ำหลายครั้ง) เมื่อรายการแนวทแยงออกเหมือนกันกับเส้นทแยงมุมการวัดซ้ำมีความสัมพันธ์อย่างสมบูรณ์สำหรับวัตถุหนึ่ง ๆ ซึ่งหมายความว่าการวัดเดี่ยวใด ๆ ก็ทำได้ดีเท่ากับการวัดทั้งหมดสำหรับแต่ละเรื่อง Final note - เมื่อ K = 2 ในการออกแบบการแบ่งแบบง่ายของเราสภาพทรงกลมจะถูกเติมเต็มโดยอัตโนมัติ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.