การเปรียบเทียบความแปรปรวนของการสังเกตแบบจับคู่


16

ฉันมีการสังเกตแบบจับคู่N ( Xi , Yi ) มาจากการแจกแจงที่ไม่รู้จักทั่วไปซึ่งมีช่วงเวลาที่หนึ่งและสองที่แน่นอนและมีความสมมาตรรอบค่าเฉลี่ย

ขอσXค่าเบี่ยงเบนมาตรฐานของX (ไม่มีเงื่อนไขบนY ), และσYเหมือนกันสำหรับ Y. ฉันอยากทดสอบสมมติฐาน

H0 :σX=σY

H1 :σXσY

ไม่มีใครรู้ว่าการทดสอบดังกล่าวหรือไม่ ฉันสามารถสันนิษฐานได้ในการวิเคราะห์ก่อนว่าการแจกแจงเป็นเรื่องปกติแม้ว่ากรณีทั่วไปน่าสนใจกว่า ฉันกำลังมองหาวิธีแก้ปัญหาแบบปิด Bootstrap เป็นทางเลือกสุดท้ายเสมอ


3
ฉันไม่แน่ใจว่าทำไมข้อมูลที่การสังเกตถูกจับคู่มีความสำคัญต่อสมมติฐานที่กำลังทดสอบ คุณอธิบายได้ไหม
russellpierce

1
@drknexus เป็นสิ่งสำคัญเนื่องจากการพึ่งพาทำให้การสอบเทียบของการทดสอบฟิชเชอร์เป็นเรื่องยาก
robin girard

คำตอบ:


4

คุณสามารถใช้ความจริงที่ว่าการแจกแจงความแปรปรวนตัวอย่างคือการแจกแจงแบบไคสแควร์ที่กึ่งกลางที่ผลต่างที่แท้จริง ภายใต้สมมติฐานว่างของคุณสถิติทดสอบของคุณจะเป็นความแตกต่างของสองตัวแปรไคสแควร์แบบสุ่มโดยมีศูนย์กลางที่ความแปรปรวนจริงที่ไม่รู้จักเหมือนกัน ฉันไม่ทราบว่าความแตกต่างของตัวแปรสุ่มแบบไคสแควร์สองตัวนั้นเป็นการแจกแจงที่สามารถระบุตัวตนได้ แต่สิ่งที่กล่าวมาข้างต้นอาจช่วยคุณได้บ้าง


3
@Svadali เป็นเรื่องปกติมากกว่าที่จะใช้อัตราส่วนที่นี่เนื่องจากการกระจายของอัตราส่วนของไคสแควร์เป็นแบบตาราง (ฟิชเชอร์ส F) อย่างไรก็ตามส่วนที่เป็นปัญหาของคำถาม (เช่นการพึ่งพาระหว่างและY ) ยังคงมีสิ่งที่คุณใช้ มันไม่ตรงไปตรงมาที่จะสร้างการทดสอบที่มีไคชีสแควร์สองตัว ... ฉันพยายามที่จะให้คำตอบกับคำตอบในจุดนั้น (ดูด้านล่าง) XY
robin girard

7

หากคุณต้องการลงเส้นทางที่ไม่ใช่พารามิเตอร์คุณสามารถลองทดสอบกำลังสองได้เสมอ

สำหรับกรณีที่ไม่มีการจับคู่สมมติฐานสำหรับการทดสอบนี้ (นำมาจากที่นี่ ) คือ:

  1. ทั้งสองตัวอย่างเป็นตัวอย่างแบบสุ่มจากประชากรที่เกี่ยวข้อง
  2. นอกเหนือจากความเป็นอิสระในแต่ละตัวอย่างแล้วยังมีความเป็นอิสระร่วมกันระหว่างสองตัวอย่าง
  3. มาตราส่วนการวัดเป็นช่วงเวลาอย่างน้อย

บันทึกการบรรยายเหล่านี้อธิบายรายละเอียดของกรณีที่ไม่ได้รับการจับคู่

สำหรับกรณีที่จับคู่คุณจะต้องเปลี่ยนขั้นตอนนี้เล็กน้อย ตรงกลางหน้านี้ควรให้แนวคิดว่าจะเริ่มจากตรงไหน


6

วิธีการที่ไร้เดียงสาที่สุดที่ฉันสามารถคิดคือการถอยหลัง VS X ฉันเป็นY ฉัน~ เมตร X ฉัน + Bแล้วทำการT -test บนสมมติฐานเมตร= 1 ดูt-test สำหรับสัมประสิทธิ์การถดถอยYiXiYim^Xi+b^tm=1

แนวทางที่ไร้เดียงสาน้อยกว่าคือการทดสอบของ Morgan-Pitman Let จากนั้นทำการทดสอบค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สันU ฉัน VS Vฉัน (หนึ่งสามารถทำได้โดยใช้การแปลง Fisher RZซึ่งให้ช่วงความมั่นใจรอบสัมประสิทธิ์ Pearson ตัวอย่างหรือผ่าน bootstrap)Ui=XiYi,Vi=Xi+Yi,UiVi

หากคุณกำลังใช้ R และไม่ต้องการให้รหัสทุกอย่างด้วยตัวเองฉันจะใช้bootdpciจากแพ็คเกจสถิติของ Robust สถิติ WRS ของวิลคอกซ์ (ดูหน้า Wilcox ' )


4

หากคุณสามารถสันนิษฐานได้ว่าค่าความแปรปรวนแบบ bivariate คุณสามารถพัฒนาแบบทดสอบความน่าจะเป็นอัตราส่วนเปรียบเทียบโครงสร้างเมทริกซ์ความแปรปรวนร่วมที่เป็นไปได้สองแบบ การประมาณความน่าจะเป็นสูงสุดที่ไม่ จำกัด (H_a) เป็นที่รู้จักกันดี - เพียงแค่เมทริกซ์ความแปรปรวนร่วมตัวอย่าง, ค่าที่ จำกัด (H_0) สามารถได้มาจากการเขียนความน่าจะเป็น (และอาจจะเป็นการประมาณ

หากคุณไม่ต้องการได้รับสูตรคุณสามารถใช้ SAS หรือ R เพื่อให้พอดีกับแบบจำลองการวัดซ้ำกับโครงสร้างความแปรปรวนร่วมแบบสมมาตรแบบไม่มีโครงสร้างและเปรียบเทียบความน่าจะเป็น


3

ความยากเกิดขึ้นได้อย่างชัดเจนเนื่องจากและYมีการ corellated (ฉันถือว่า( X , Y )เป็น gaussian ร่วมกันเหมือนกับ Aniko) และคุณไม่สามารถสร้างความแตกต่าง (เช่นในคำตอบของ @ svadali) หรืออัตราส่วน (เช่นเดียวกับ Standard Fisher-Snedecor "F-ทดสอบ") เพราะผู้จะมีขึ้นχ 2การจัดจำหน่ายและเพราะคุณไม่ได้รู้ว่าสิ่งที่พึ่งพานี้อยู่ซึ่งทำให้มันยากที่จะได้รับการจัดจำหน่ายภายใต้H 0XY(X,Y)χ2H0

คำตอบของฉันขึ้นอยู่กับสมการ (1) ด้านล่าง เนื่องจากความแตกต่างของความแปรปรวนสามารถแยกตัวประกอบกับความแตกต่างของค่าลักษณะเฉพาะและมุมการหมุนที่แตกต่างกันการทดสอบความเท่าเทียมสามารถปฏิเสธได้ในการทดสอบสองครั้ง ฉันแสดงให้เห็นว่าเป็นไปได้ที่จะใช้การทดสอบ Fisher-Snedecor ร่วมกับการทดสอบความชันเช่นที่แนะนำโดย @shabbychef เนื่องจากคุณสมบัติง่าย ๆ ของเวกเตอร์เกาส์ 2D

i=1,2 (Z1i,,Znii)λ^i2 and true variance λi2, then it is possible to test if λ1=λ2 using the fact that, under the null,

It uses the fact that

R=λ^X2λ^Y2
follows a Fisher-Snedecor distribution F(n11,n21)

A simple property of 2D gaussian vector Let us denote by

R(θ)=[cosθsinθsinθcosθ]
It is clear that there exists λ1,λ2>0 ϵ1, ϵ2 two independent gaussian N(0,λi2) such that

[XY]=R(θ)[ϵ1ϵ2]
and that we have
Var(X)Var(Y)=(λ12λ22)(cos2θsin2θ)[1]

Testing of Var(X)=Var(Y) can be done through testing if ( λ12=λ22 or θ=π/4mod[π/2])

Conclusion (Answer to the question) Testing for λ12=λ22 is easely done by using ACP (to decorrelate) and Fisher Scnedecor test. Testing θ=π/4[modπ/2] is done by testing if |β1|=1 in the linear regression Y=β1X+σϵ (I assume Y and X are centered).

Testing wether (λ12=λ22 or θ=π/4[modπ/2]) at level α is done by testing if λ12=λ22 at level α/3 or if |β1|=1 at level α/3.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.