การทดสอบสมมติฐานเพื่อความเท่าเทียมกันของสัดส่วนกับ 3 ตัวอย่าง


9

ฉันมีชุดข้อมูลของข้อมูลลูกค้าโทรศัพท์มือถือพร้อมทวีต คอลัมน์แรกมีหมวดหมู่บางอย่างที่บัญชีอยู่ (ทั้ง A, B หรือ C) และคอลัมน์ที่สองมีค่าไบนารีว่าบัญชีนั้นได้ยกเลิกหรือไม่ เช่น

A | cancelled
C | active
B | active
A | cancelled

สิ่งที่ฉันต้องการทำคือการทดสอบสมมติฐานบางอย่างเพื่อทดสอบว่าอัตราส่วนของบัญชีประเภท A, B และ C นั้นแตกต่างกันสำหรับบัญชีที่ใช้งานกับบัญชีที่ถูกยกเลิกหรือไม่ - สมมุติฐานว่าง ๆ นั้นเป็นสิ่งเดียวกัน มันเหมือนกับการทดสอบสมมุติฐานสำหรับสัดส่วนยกเว้นฉันไม่รู้ว่าจะทำอย่างไรกับ 3 ค่า


6
คุณสามารถใช้การเพื่อทดสอบความเท่าเทียมกันของสัดส่วนระหว่างสามกลุ่ม χ2

ฉันยังคิดว่าฉันสามารถทำการทดสอบสมมุติฐานสามแบบทดสอบ A กับ B, B กับ C และ A กับ C เพื่อดูว่าพวกมันแตกต่างหรือไม่
1893354

5
คุณทำได้ แต่โปรดทราบว่าคุณจะต้องแก้ไขปัญหาของการเปรียบเทียบหลาย ๆ อย่าง

ขอบคุณสำหรับคำตอบ. ฉันแค่อยากรู้ว่าคุณหมายถึงอะไรจากปัญหาการเปรียบเทียบหลาย ๆ หรือโดยเฉพาะเจาะจงว่าทำไมวิธีการทดสอบสมมติฐานทั้งสามจึงเสียเปรียบ ขอบคุณ!
user1893354

3
พวกเขามีสองปัญหากับการใช้การทดสอบสมมติฐานที่สาม อันดับแรกพวกเขาพึ่งพาซึ่งกันและกันเพราะแต่ละคู่นำข้อมูลบางส่วนมาใช้ซ้ำ ประการที่สองหากพวกเขาเป็นอิสระจริง ๆ แล้วโอกาสที่อย่างน้อยหนึ่งของพวกเขาจะมีความสำคัญแม้ว่าโมฆะจะเป็นจริง - นั่นคือโอกาสที่จะเกิดข้อผิดพลาดในเชิงบวกที่ผิดพลาด - จะสูงกว่าเท็จที่ต้องการเกือบสามเท่า อัตราบวก ปัญหาที่สองระบุว่าการทดสอบจะต้องมีการปรับ แต่คนแรกแสดงให้เห็นว่าการค้นหาการปรับที่เหมาะสมอาจมีปัญหา วิธีการหลีกเลี่ยงปัญหาเหล่านี้ χ2
whuber

คำตอบ:


13

ฉันจะให้คำตอบโดยทั่วไปและใส่ความคิดเห็นเกี่ยวกับปัญหาของคุณในกรอบการทดสอบ โดยทั่วไปเราสามารถทดสอบความเท่าเทียมกันของสัดส่วนโดยใช้การโดยที่สมมติฐานว่างทั่วไปคือมีดังต่อไปนี้:χ2H0

H0:p1=p2=...=pk

กล่าวคือสัดส่วนทั้งหมดมีค่าเท่ากัน ในกรณีของคุณคุณสมมติฐานว่างต่อไปนี้:

H0:p1=p2=p3
และสมมติฐานทางเลือกคือ
HA: at leat one pi is different for i=1,2,3

ตอนนี้เพื่อดำเนินการเราจำเป็นต้องคำนวณสถิติการทดสอบต่อไปนี้: ค่าของสถิติการทดสอบคือχ2

χ2=i=1n(OiEi)2Ei

ที่ไหน

  • χ2 = สถิติทดสอบเพียร์สันสะสมซึ่ง asymptotically แนวทางกระจายχ2
  • Oi = ความถี่ที่สังเกตได้
  • Ei = ความถี่ (ทฤษฎี) ที่คาดไว้ซึ่งถูกยืนยันโดยสมมติฐานว่าง
  • n = จำนวนเซลล์ในตาราง

ในกรณีของคุณเนื่องจากเราสามารถคิดว่าปัญหานี้เป็นตารางต่อไปนี้: n=6ป้อนคำอธิบายรูปภาพที่นี่

ตอนนี้เมื่อเรามีสถิติการทดสอบเรามีสองทางเลือกในการดำเนินการทดสอบสมมติฐานของเราให้เสร็จสมบูรณ์

ตัวเลือก 1)เราสามารถเปรียบเทียบการทดสอบของเราคงที่กับค่าวิกฤตที่เหมาะสมภายใต้สมมติฐานว่าง กล่าวคือถ้าเป็นจริงสถิติจากตารางฉุกเฉินพร้อมแถวและคอลัมน์ควรมีการมีองศาเสรีภาพ หลังจากการคำนวณค่าวิกฤตของเราหากเรามีจากนั้นเราจะปฏิเสธสมมติฐานว่าง เห็นได้ชัดว่าถ้าจากนั้นเราไม่สามารถปฏิเสธสมมติฐานว่างได้ χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

กราฟิก (ตัวเลขทั้งหมดถูกสร้างขึ้น) นี่คือต่อไปนี้: ป้อนคำอธิบายรูปภาพที่นี่

จากกราฟหากสถิติการทดสอบของเราตรงกับสถิติการทดสอบสีน้ำเงินเราจะไม่สามารถปฏิเสธสมมติฐานว่างได้เนื่องจากสถิติการทดสอบนี้ไม่ได้ตกอยู่ในภูมิภาควิกฤติ (เช่น ) อีกวิธีหนึ่ง, สถิติทดสอบสีเขียวตกอยู่ในพื้นที่วิกฤตและเราจะปฏิเสธสมมติฐานว่างถ้าเราคำนวณสถิติทดสอบสีเขียวχ2χ2<χ

ในตัวอย่างของคุณองศาอิสระของคุณเท่ากับ

df=(R1)×(C1)=(21)×(31)=1×2=2

ตัวเลือกที่ 2)เราสามารถคำนวณค่า p-value ที่เกี่ยวข้องกับสถิติการทดสอบภายใต้สมมติฐานว่างและถ้าค่า p นี้น้อยกว่าบางค่าที่ระบุ level แล้วเราสามารถปฏิเสธสมมติฐานว่างได้ ถ้า p-value มากกว่าระดับแล้วเราไม่สามารถปฏิเสธสมมติฐานว่างได้ โปรดทราบว่า p-value คือความน่าจะเป็นที่การมากกว่าสถิติทดสอบααχ(R1)×(C1)2

ภาพกราฟิกเรามีสิ่งนั้น ป้อนคำอธิบายรูปภาพที่นี่

โดยที่การคำนวณค่า p เป็นพื้นที่ที่มีค่ามากกว่าสถิติการทดสอบของเรา (พื้นที่แรเงาสีน้ำเงินในตัวอย่าง)

ดังนั้นถ้าแล้วไม่สามารถปฏิเสธสมมติฐานมิฉะนั้นα>p-valueH0

ถ้าการปฏิเสธสมมติฐานαp-valueH0

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.