ที่ระดับอะไรคือการทดสอบ


15

ความเป็นมา:ข้ามอย่างปลอดภัย - อยู่ที่นี่เพื่อการอ้างอิงและทำให้คำถามถูกต้อง

การเปิดอ่านบทความนี้:

"การทดสอบไคสแควร์ที่มีชื่อเสียงของคาร์ลเพียร์สันได้มาจากสถิติอื่นที่เรียกว่าสถิติซีตามการแจกแจงแบบปกติรุ่นที่ง่ายที่สุดของχ2สามารถแสดงให้เห็นว่าเป็นคณิตศาสตร์ในทางคณิตศาสตร์เหมือนกับการทดสอบซีที่เทียบเท่า ในทุกสถานการณ์สำหรับทุกเจตนารมณ์และวัตถุประสงค์ "ไคสแควร์" อาจเรียกว่า "ซีสแควร์" ค่าวิกฤตของχ2สำหรับระดับอิสระหนึ่งระดับคือจตุรัสของค่าวิกฤตที่สอดคล้องกันของซี "

นี้ได้รับการยืนยันหลายครั้งใน CV ( ที่นี่ , ที่นี่ , ที่นี่และอื่น ๆ )

และแน่นอนเราสามารถพิสูจน์ได้ว่าχ1df2เทียบเท่ากับX2ด้วยXN(0,1):

สมมติว่าXN(0,1)และY=X2และค้นหาความหนาแน่นของYโดยใช้วิธีcdf :

) ปัญหาคือเราไม่สามารถรวมความหนาแน่นของการแจกแจงแบบปกติในรูปแบบปิด แต่เราสามารถแสดงได้:p(Yy)=p(X2y)=p(yxy)

รับอนุพันธ์:

FX(y)=FX(y)FX(y).

fX(y)=FX(y)12y+FX(y)12y.

ตั้งแต่ค่าของปกติสมมาตร:pdf

Y การเทียบสิ่งนี้กับpdffX(y)=FX(y)1ypdfของปกติ (ตอนนี้ในp d fจะเท่ากับxpdfyที่จะเสียบเข้ากับex22ส่วนหนึ่งของปกติ ); และความทรงจำในรวม1pdfในตอนท้าย:1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

เปรียบเทียบกับ pdf ของตารางไค:

fX(x)=12ν/2Γ(ν2)ex2xν21

ตั้งแต่สำหรับ1df เราได้รับpdf อย่างแน่นอนΓ(1/2)=π1pdfของไคสแควร์ทุกประการ

ต่อไปหากเราเรียกฟังก์ชั่นprop.test()ในการวิจัยเราจะอัญเชิญเดียวกันทดสอบเช่นถ้าเราตัดสินใจχ2chisq.test()

คำถาม:

ดังนั้นฉันจึงได้รับคะแนนทั้งหมดเหล่านี้ แต่ฉันก็ยังไม่รู้ว่าการนำไปใช้กับการทดสอบสองครั้งจริงด้วยเหตุผลสองประการ:

  1. การทดสอบ z ไม่ได้ยกกำลังสอง

  2. สถิติการทดสอบจริงนั้นแตกต่างอย่างสิ้นเชิง:

ค่าของสถิติทดสอบสำหรับχ2คือ:

ที่χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2

= สถิติการทดสอบสะสมของ Pearson ซึ่ง asymptotically ใกล้ถึงการแจกแจง χ 2 O i = จำนวนการสังเกตประเภท i ; N = จำนวนการสังเกตทั้งหมด E ฉัน = N P ฉัน = ที่คาดว่าจะ (ทฤษฎี) ความถี่ของประเภทฉันถูกกล่าวหาโดยสันนิษฐานว่าส่วนของประเภทฉันในประชากรที่อยู่ หน้าฉัน ; nχ2χ2OiiNEiNpiiipin = จำนวนเซลล์ในตาราง

ในทางกลับกันสถิติทดสอบสำหรับการทดสอบคือ:z

ด้วยp=x1Z=x1n1x2n2p(1p)(1/n1+1/n2)โดยที่x1และx2เป็นจำนวน "ความสำเร็จ" เหนือจำนวนเรื่องในแต่ละระดับของตัวแปรเด็ดขาดเช่นn1และn2p=x1+x2n1+n2x1x2n1n2 2

สูตรนี้น่าจะขึ้นอยู่กับการแจกแจงทวินาม

สองคนนี้สถิติการทดสอบที่แตกต่างกันอย่างชัดเจนและส่งผลให้ผลลัพธ์ที่แตกต่างสำหรับสถิติการทดสอบจริงเช่นเดียวกับP -values : 5.8481สำหรับและสำหรับ Z-test ที่2.4183 2 = 5.84817 (ขอขอบคุณคุณ @ mark999 ) พี -value สำหรับχ 2ทดสอบในขณะที่สำหรับ Z-ทดสอบ ความแตกต่างที่อธิบายโดยสองด้านเทียบกับหนึ่งด้าน: 0.01559 / 2 = 0.007795 (ขอบคุณ @amoeba)χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

ดังนั้นในระดับใดที่เราบอกว่าพวกเขาเป็นหนึ่งเดียวกัน


แต่นี่เป็นการทดสอบสองแบบที่เหมือนกัน Z กำลังสองคือสถิติไคสแควร์ ให้คุณมีตารางความถี่ 2x2 ซึ่งคอลัมน์เป็นสองกลุ่มและแถวคือ "สำเร็จ" และ "ล้มเหลว" จากนั้นความถี่ที่คาดหวังที่เรียกว่าการทดสอบไคสแควร์ในคอลัมน์ที่กำหนดคือโปรไฟล์ (โดยกลุ่ม 'N) คอลัมน์เฉลี่ย (กลุ่ม)ถ่วงน้ำหนักคูณด้วย N ของกลุ่มนั้นดังนั้นจึงมาว่าไคสแควร์ทดสอบการเบี่ยงเบนของ แต่ละโปรไฟล์สองกลุ่มจากโปรไฟล์กลุ่มเฉลี่ยนี้ซึ่งเทียบเท่ากับการทดสอบโปรไฟล์ของกลุ่มที่แตกต่างจากกันคือการทดสอบ z ของสัดส่วน
ttnphns

ในตัวอย่างของการเชื่อมโยงหลายมิติสุดท้ายเกือบจะเป็นกำลังสองของสถิติการทดสอบ z แต่ไม่มากนักและค่า p แตกต่างกัน นอกจากนี้เมื่อคุณดูที่สูตรสำหรับสถิติที่เหลือด้านบนมันเป็นความจริงทันทีหรือไม่ที่พวกเขาเหมือนกัน? หรือแม้แต่หนึ่งจตุรัสของอีกอันหนึ่ง? χ2
Antoni Parellada

2
ในchisq.test()มีคุณพยายามใช้correct=FALSE?
mark999

1
อันโตนี การทดสอบทั้งสองมีอยู่โดยมีหรือไม่มีเยตส์ เป็นไปได้ไหมที่คุณคำนวณอันหนึ่งด้วย แต่อีกอันที่ไม่มีมัน?
ttnphns

1
ขอขอบคุณ! คุณถูก (คาดการณ์) ถูกต้อง เมื่อปิดการแก้ไข Yates หนึ่งจะเป็นเพียงกำลังสองของอีกอัน ฉันแก้ไขคำถามตามนั้นแม้ว่าจะเร็วสักเล็กน้อย ฉันยังต้องการที่จะพิสูจน์เกี่ยวกับพีชคณิตว่าสถิติการทดสอบทั้งสองเหมือนกัน (หรือหนึ่งในสองของอื่น ๆ ) และเข้าใจว่าทำไมค่า p แตกต่างกัน
Antoni Parellada

คำตอบ:


12

ให้เรามีตารางความถี่ 2x2 ที่คอลัมน์คือกลุ่มผู้ตอบสองกลุ่มและแถวคือคำตอบสองคำตอบ "ใช่" และ "ไม่" และเราได้เปลี่ยนความถี่ให้เป็นสัดส่วนภายในกลุ่มเช่นเป็นโปรไฟล์แนวตั้ง:

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

ปกติ (ไม่แก้ไข Yates) ของตารางนี้หลังจากที่คุณแทนสัดส่วนแทนความถี่ในสูตรของมันดูเหมือนว่า:χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

จำไว้ว่าp=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

(n12n2+n1n22)

(p1p2)2pq(1/n1+1/n2)=Z2,

the squared z-statistic of the z-test of proportions for "Yes" response.

Thus, the 2x2 homogeneity Chi-square statistic (and test) is equivalent to the z-test of two proportions. The so called expected frequencies computed in the chi-square test in a given column is the weighted (by the group n) average vertical profile (i.e. the profile of the "average group") multiplied by that group's n. Thus, it comes out that chi-square tests the deviation of each of the two groups profiles from this average group profile, - which is equivalent to testing the groups' profiles difference from each other, which is the z-test of proportions.

This is one demonstration of a link between a variables association measure (chi-square) and a group difference measure (z-test statistic). Attribute associations and group differences are (often) the two facets of the same thing.


(Showing the expansion in the first line above, By @Antoni's request):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


@ttnphs This is great! Any chance you could clarify the intermediate step in the first equation (χ2) formula - I don't see how the q's go away after the equal sign.
Antoni Parellada

@ttnphs When I expand it I get n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.