ความสัมพันธ์ระหว่างการทดสอบไคสแควร์และการทดสอบในสัดส่วนเท่ากันคืออะไร?


52

สมมติว่าฉันมีประชากรสามคนที่มีสี่ลักษณะที่ไม่เหมือนกันซึ่งกันและกัน ฉันสุ่มตัวอย่างตัวอย่างจากประชากรแต่ละคนและสร้างแท็บไขว้หรือตารางความถี่สำหรับลักษณะที่ฉันวัด ฉันถูกต้องในการพูดว่า:

  1. ถ้าฉันต้องการทดสอบว่ามีความสัมพันธ์ใด ๆ ระหว่างประชากรและลักษณะ (เช่นว่าหนึ่งประชากรมีความถี่สูงกว่าหนึ่งในลักษณะ) ฉันควรใช้การทดสอบไคสแควร์และดูว่าผลที่มีความสำคัญ

  2. หากการทดสอบแบบไคสแควร์มีความสำคัญแสดงให้ฉันเห็นว่ามีความสัมพันธ์ระหว่างประชากรและคุณลักษณะบางอย่าง แต่ไม่ใช่ความสัมพันธ์

  3. ยิ่งไปกว่านั้นคุณสมบัติบางอย่างนั้นไม่จำเป็นต้องเกี่ยวข้องกับประชากร ตัวอย่างเช่นหากประชากรที่แตกต่างกันมีการแจกแจงที่แตกต่างกันอย่างมากของคุณสมบัติ A และ B แต่ไม่ใช่ของ C และ D ดังนั้นการทดสอบไคสแควร์อาจยังกลับมามีความหมาย

  4. ถ้าผมต้องการที่จะวัดหรือไม่ว่าลักษณะที่เฉพาะเจาะจงได้รับผลกระทบโดยประชากรแล้วฉันสามารถเรียกใช้การทดสอบสำหรับสัดส่วนที่เท่ากัน (ฉันได้เห็นนี้เรียกว่า Z-test หรือเป็นprop.test()ในR) เพียงลักษณะที่

กล่าวอีกนัยหนึ่งเหมาะสมที่จะใช้prop.test()เพื่อกำหนดลักษณะของความสัมพันธ์ระหว่างชุดสองประเภทอย่างแม่นยำมากขึ้นเมื่อการทดสอบไคสแควร์บอกว่ามีความสัมพันธ์ที่สำคัญหรือไม่


อ่านเพิ่มเติม: stats.stackexchange.com/q/173415/3277
ttnphns

คำตอบ:


23

คำตอบสั้น ๆ :

การทดสอบไคสแควร์ ( chisq.test()ใน R) เปรียบเทียบความถี่ที่สังเกตได้ในแต่ละประเภทของตารางฉุกเฉินกับความถี่ที่คาดหวัง (คำนวณเป็นผลิตภัณฑ์ของความถี่ส่วนเพิ่ม) มันถูกใช้เพื่อตรวจสอบว่าการเบี่ยงเบนระหว่างการสังเกตและการนับที่คาดว่ามีขนาดใหญ่เกินไปที่จะประกอบกับโอกาส ออกเดินทางจากความเป็นอิสระได้อย่างง่ายดายตรวจสอบโดยการตรวจสอบสารตกค้าง (ลอง?mosaicplotหรือ?assocplotแต่ยังดูvcdแพคเกจ) ใช้fisher.test()สำหรับการทดสอบที่แน่นอน (อาศัยการกระจาย hypergeometric)

prop.test()z

z=(f1f2)p^(1p^)(1n1+1n2)

p^=(p1+p2)/(n1+n2)(1,2)H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

สำหรับการวิเคราะห์ข้อมูลที่ไม่ต่อเนื่องร่วมกับ R ฉันขอแนะนำให้ใช้R (และ S-PLUS) คู่มือการวิเคราะห์ข้อมูลหมวดหมู่ (2002)จาก Lora Thompson


2
มีชื่อสามัญสำหรับการทดสอบที่ prop.test () ทำงานหรือไม่
Atticus29

2
"มันถูกเรียกว่าการทดสอบซี"
russellpierce

@chl ฉันสับสนเล็กน้อย - ฉันคิดว่าprop.testและchisq.testทั้งสองใช้ไคสแควร์ซึ่งจะอธิบายค่า p ที่เหมือนกันรวมทั้งสาเหตุที่โพสต์นี้ในR-Bloggersพวกเขามีฟังก์ชั่นเฉพาะกิจของตัวเอง
Antoni Parellada

@ Antonton ใช่นี่คือสิ่งที่ Keith อธิบายไว้ในคำตอบของเขา
chl

3
n1n2f1f2p1p2

23

zp

α

α

การทดสอบที่มีประสิทธิภาพมากที่สุดเพื่อความเท่าเทียมกันของสัดส่วนที่เรียกว่าการทดสอบบาร์นาร์ดเหนือกว่า


@ gung ฉันสับสนเล็กน้อย - ฉันคิดว่าprop.testและchisq.testทั้งคู่ใช้ไคสแควร์ซึ่งจะอธิบายค่า p ที่เหมือนกันรวมทั้งสาเหตุที่โพสต์นี้ในR-Bloggersพวกเขามีฟังก์ชั่นเฉพาะกิจของตัวเอง
Antoni Parellada

ฉันไม่เข้าใจว่าคุณสับสนอะไร @AntoniParellada คำตอบนี้ระบุว่าพวกเขา "เหมือนกัน" ซึ่งทำให้รู้สึกว่า "ทั้งสองใช้ไคสแควร์"
gung - Reinstate Monica

@gung เดิมรัฐคำตอบ CHL ว่าprop.test()... จะเรียกว่าเป็นรูปตัว z chisq.test()ทดสอบในการขัด ต่อมา Keith กล่าวว่า "การทดสอบไคสแควร์เพื่อความเท่าเทียมกันของสองสัดส่วนนั้นเป็นสิ่งเดียวกันกับการทดสอบ z (นี่คือเหตุผลที่ @chl ได้รับ p-value ที่แน่นอนพร้อมการทดสอบทั้งสองแบบ)"
Antoni Parellada

1
นั่นดูเหมือนจะเป็นเพียงประโยคที่ไม่เหมาะสม @AntoniParellada ตามหลักการแล้วการทดสอบทั้งสองนั้นแตกต่างกันซึ่งเป็นสิ่งที่ฉันพูดถึงในคำตอบอื่น ๆ แต่ในทางคณิตศาสตร์พวกมันเทียบเท่ากัน ที่จริงแล้วฉันเชื่อว่าฟังก์ชั่น R prop.test()จริงๆแล้วเพียงแค่เรียกchisq.test()& พิมพ์ผลลัพธ์ที่ต่างออกไป
gung - Reinstate Monica

@ gung ฉันได้ทำงานในฟังก์ชั่นที่คล้ายกับ R-Bloggers และฉันจะโพสต์สำหรับคนที่อยู่ในระดับเริ่มต้นของฉันโดยอ้างถึงคุณในความเป็นจริงเกี่ยวกับแนวคิดหลักสองสามข้อที่คุณเขียนขึ้นมา square และ z-test จากนั้นให้รหัส R
Antoni Parellada
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.