ความเป็นมา:ข้ามอย่างปลอดภัย - อยู่ที่นี่เพื่อการอ้างอิงและทำให้คำถามถูกต้อง
การเปิดอ่านบทความนี้:
"การทดสอบไคสแควร์ที่มีชื่อเสียงของคาร์ลเพียร์สันได้มาจากสถิติอื่นที่เรียกว่าสถิติซีตามการแจกแจงแบบปกติรุ่นที่ง่ายที่สุดของสามารถแสดงให้เห็นว่าเป็นคณิตศาสตร์ในทางคณิตศาสตร์เหมือนกับการทดสอบซีที่เทียบเท่า ในทุกสถานการณ์สำหรับทุกเจตนารมณ์และวัตถุประสงค์ "ไคสแควร์" อาจเรียกว่า "ซีสแควร์" ค่าวิกฤตของสำหรับระดับอิสระหนึ่งระดับคือจตุรัสของค่าวิกฤตที่สอดคล้องกันของซี "
นี้ได้รับการยืนยันหลายครั้งใน CV ( ที่นี่ , ที่นี่ , ที่นี่และอื่น ๆ )
และแน่นอนเราสามารถพิสูจน์ได้ว่าเทียบเท่ากับด้วย:
สมมติว่าและและค้นหาความหนาแน่นของโดยใช้วิธี :
) ปัญหาคือเราไม่สามารถรวมความหนาแน่นของการแจกแจงแบบปกติในรูปแบบปิด แต่เราสามารถแสดงได้:
รับอนุพันธ์:
ตั้งแต่ค่าของปกติสมมาตร:
Y การเทียบสิ่งนี้กับpdfของปกติ (ตอนนี้ในp d fจะเท่ากับ√ที่จะเสียบเข้ากับส่วนหนึ่งของปกติ ); และความทรงจำในรวม1ในตอนท้าย:
เปรียบเทียบกับ pdf ของตารางไค:
ตั้งแต่สำหรับ1df เราได้รับpdf อย่างแน่นอนของไคสแควร์ทุกประการ
ต่อไปหากเราเรียกฟังก์ชั่นprop.test()
ในการวิจัยเราจะอัญเชิญเดียวกันทดสอบเช่นถ้าเราตัดสินใจchisq.test()
คำถาม:
ดังนั้นฉันจึงได้รับคะแนนทั้งหมดเหล่านี้ แต่ฉันก็ยังไม่รู้ว่าการนำไปใช้กับการทดสอบสองครั้งจริงด้วยเหตุผลสองประการ:
การทดสอบ z ไม่ได้ยกกำลังสอง
สถิติการทดสอบจริงนั้นแตกต่างอย่างสิ้นเชิง:
ค่าของสถิติทดสอบสำหรับคือ:
ที่
= สถิติการทดสอบสะสมของ Pearson ซึ่ง asymptotically ใกล้ถึงการแจกแจง χ 2 O i = จำนวนการสังเกตประเภท i ; N = จำนวนการสังเกตทั้งหมด E ฉัน = N P ฉัน = ที่คาดว่าจะ (ทฤษฎี) ความถี่ของประเภทฉันถูกกล่าวหาโดยสันนิษฐานว่าส่วนของประเภทฉันในประชากรที่อยู่ หน้าฉัน ; n = จำนวนเซลล์ในตาราง
ในทางกลับกันสถิติทดสอบสำหรับการทดสอบคือ:
ด้วยp=x1โดยที่x1และx2เป็นจำนวน "ความสำเร็จ" เหนือจำนวนเรื่องในแต่ละระดับของตัวแปรเด็ดขาดเช่นn1และn2 2
สูตรนี้น่าจะขึ้นอยู่กับการแจกแจงทวินาม
สองคนนี้สถิติการทดสอบที่แตกต่างกันอย่างชัดเจนและส่งผลให้ผลลัพธ์ที่แตกต่างสำหรับสถิติการทดสอบจริงเช่นเดียวกับP -values : 5.8481
สำหรับและสำหรับ Z-test ที่2.4183 2 = 5.84817 (ขอขอบคุณคุณ @ mark999 ) พี -value สำหรับχ 2ทดสอบในขณะที่สำหรับ Z-ทดสอบ ความแตกต่างที่อธิบายโดยสองด้านเทียบกับหนึ่งด้าน: 0.01559 / 2 = 0.007795 (ขอบคุณ @amoeba)2.4183
0.01559
0.0077
ดังนั้นในระดับใดที่เราบอกว่าพวกเขาเป็นหนึ่งเดียวกัน
chisq.test()
มีคุณพยายามใช้correct=FALSE
?