ทำความเข้าใจกับการทดสอบแบบไคสแควร์และการแจกแจงแบบไคสแควร์


13

ฉันพยายามเข้าใจตรรกะหลังการทดสอบไคสแควร์

การทดสอบไคสแควร์เป็น{} จะถูกเปรียบเทียบกับการแจกแจงแบบ Chi-squared เพื่อค้นหา p.value เพื่อปฏิเสธหรือไม่สมมุติฐานว่าง : การสังเกตมาจากการแจกแจงที่เราเคยสร้างค่าที่เราคาดหวัง ตัวอย่างเช่นเราสามารถทดสอบความน่าจะเป็นที่จะได้รับจากตามที่เราคาดหวัง ดังนั้นเราจึงพลิก 100 ครั้งและหาและ1เราต้องการเปรียบเทียบการค้นพบของเรากับสิ่งที่คาดหวัง ( ) เราสามารถใช้การแจกแจงทวินามได้ด้วย แต่มันก็ไม่ใช่ประเด็นของคำถาม ... คำถามคือ: χ2H0pnH1-nH100pχ2=(obsexp)2expχ2H0headpnH Heads1nH tails100p

คุณช่วยอธิบายได้ไหมว่าทำไมภายใต้สมมติฐานว่างตามหลังการแจกแจงแบบไคสแควร์?(obsexp)2exp

สิ่งที่ฉันรู้เกี่ยวกับการกระจายตัวไคสแควร์คือการกระจายตัวไคสแควร์ของดีกรีคือผลรวมของการแจกแจงปกติกำลังสองมาตรฐานkkk


2
ไม่: นี่เป็นการประมาณ (มาก) เพิ่มเติมเกี่ยวกับปรากฏในกระทู้ที่stats.stackexchange.com/questions/16921/...
whuber

สิ่งนี้อาจพิสูจน์ได้ว่าเป็นความสนใจของKarl Pearson และการทดสอบ Chi-squared, (Placket, 1983) {pdf}
Avraham

คำถามที่เกี่ยวข้องเกี่ยวกับสาเหตุที่ใช้การแจกแจงแบบไคสแควร์สำหรับการทดสอบแบบพอดีแม้ว่าจะไม่ได้ซ้ำกัน: stats.stackexchange.com/questions/125312/…
Silverfish

คำตอบ:


12

เราสามารถใช้การแจกแจงทวินามได้ด้วย แต่มันก็ไม่ใช่ประเด็นของคำถาม ...

อย่างไรก็ตามมันเป็นจุดเริ่มต้นของเราแม้สำหรับคำถามที่แท้จริงของคุณ ฉันจะครอบคลุมมันค่อนข้างไม่เป็นทางการ

ลองพิจารณากรณีทวินามมากกว่าโดยทั่วไป:

YBin(n,p)

สมมติว่าและเป็นเช่นนั้นโดยที่มีการประมาณค่าที่ดีโดยมีค่าเฉลี่ยและความแปรปรวนเท่ากัน (ข้อกำหนดทั่วไปบางอย่างมีค่ามากกว่าไม่เล็กหรือไม่เล็ก)npYmin(np,n(1p))np(1p)

จากนั้นจะอยู่ที่ประมาณ\ที่นี่คือจำนวนความสำเร็จ(YE(Y))2/Var(Y)χ12Y

เรามีและ(1-P)E(Y)=npVar(Y)=np(1p)

(ในกรณีทดสอบเป็นที่รู้จักและมีการระบุภายใต้เราไม่ได้ทำการประเมินใด ๆ )npH0

ดังนั้นจะอยู่ที่ประมาณ\(Ynp)2/np(1p)χ12

โปรดทราบว่า 2 นอกจากนี้ทราบว่า(1-P)}(Ynp)2=[(nY)n(1p)]21p+11p=1p(1p)

ดังนั้น(Ynp)2np(1p)=(Ynp)2np+(Ynp)2n(1p)=(Ynp)2np+[(nY)n(1p)]2n(1p)=(OSES)2ES+(OFEF)2EF

ซึ่งเป็นเพียงสถิติไคสแควร์สำหรับกรณีทวินาม

ดังนั้นในกรณีนี้สถิติไคสแควร์ควรมีการแจกแจงของสแควร์ของตัวแปรสุ่มปกติประมาณ (มาตรฐาน)

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.