สำหรับตารางฉุกเฉินแบบ 2 คูณ 2 บางคนกล่าวว่าการทดสอบที่แน่นอนของ Fisherใช้การนับ ในเซลล์ (1,1) ในตารางเป็นสถิติการทดสอบและภายใต้สมมติฐานว่าง จะมีการแจกแจง hypergeometric
บางคนบอกว่าสถิติการทดสอบของมันคือ
สำหรับตารางฉุกเฉินแบบ 2 คูณ 2 บางคนกล่าวว่าการทดสอบที่แน่นอนของ Fisherใช้การนับ ในเซลล์ (1,1) ในตารางเป็นสถิติการทดสอบและภายใต้สมมติฐานว่าง จะมีการแจกแจง hypergeometric
บางคนบอกว่าสถิติการทดสอบของมันคือ
คำตอบ:
(เพื่อทำให้ความคิดของเรามีความแม่นยำมากขึ้นเราเรียก 'สถิติการทดสอบ' การกระจายตัวของสิ่งที่เรามองหาเพื่อคำนวณค่า p จริง ๆ ซึ่งหมายความว่าสำหรับการทดสอบแบบสองทางสถิติการทดสอบของเราจะเป็น ค่อนข้างมากกว่า .)
สถิติทดสอบทำในสิ่งที่ทำให้เกิดการสั่งซื้อในพื้นที่ตัวอย่าง (หรือมากกว่านั้นเป็นการสั่งซื้อบางส่วน) เพื่อให้คุณสามารถระบุกรณีที่รุนแรง (กรณีที่สอดคล้องกับทางเลือกมากที่สุด)
ในกรณีของการทดสอบที่แน่นอนฟิชเชอร์ที่มีอยู่แล้วสั่งในความรู้สึก - ที่มีความน่าจะเป็นของตาราง 2x2 ต่างๆตัวเอง เมื่อมันเกิดขึ้นพวกเขาสอดคล้องกับการสั่งซื้อใน ในแง่ที่ว่าค่าที่มากที่สุดหรือน้อยที่สุดของ เป็น 'มาก' และพวกเขาจะยังคนที่มีความน่าจะเป็นขนาดเล็กที่สุด ดังนั้นแทนที่จะดูค่าของ ในวิธีที่คุณแนะนำเราสามารถทำงานจากปลายขนาดใหญ่และขนาดเล็กในแต่ละขั้นตอนเพียงแค่เพิ่มค่าใดก็ตาม (ใหญ่ที่สุดหรือเล็กที่สุด) - มูลค่าที่ไม่ได้อยู่ในนั้น) มีความน่าจะเป็นน้อยที่สุดที่เกี่ยวข้องกับมันดำเนินต่อไปจนกว่าคุณจะถึงตารางที่คุณสังเกต ในการรวมความน่าจะเป็นทั้งหมดของตารางสุดขีดทั้งหมดนั้นคือค่า p
นี่คือตัวอย่าง:
> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
x prob rank
1 0 1.871194e-04 2
2 1 5.613581e-03 4
3 2 5.052223e-02 6
4 3 1.886163e-01 8
5 4 3.300786e-01 10
6 5 2.829245e-01 9
7 6 1.178852e-01 7
8 7 2.245433e-02 5
9 8 1.684074e-03 3
10 9 3.402171e-05 1
คอลัมน์แรกคือ ค่าคอลัมน์ที่สองคือความน่าจะเป็นและคอลัมน์ที่สามคือการสั่งซื้อที่เกิดขึ้น
ดังนั้นในกรณีเฉพาะของการทดสอบที่แม่นยำของฟิชเชอร์ความน่าจะเป็นของแต่ละตาราง (เท่ากันของแต่ละตารางค่า) สามารถพิจารณาสถิติการทดสอบจริง
หากคุณเปรียบเทียบสถิติการทดสอบที่แนะนำ มันก่อให้เกิดการเรียงลำดับเดียวกันในกรณีนี้ (และฉันเชื่อว่ามันทำโดยทั่วไป แต่ฉันไม่ได้ตรวจสอบ) ในค่าที่ใหญ่กว่าของสถิตินั้นเป็นค่าที่น้อยกว่าของความน่าจะเป็นดังนั้นจึงสามารถพิจารณาได้ว่า 'สถิติ' - แต่อาจมีปริมาณอื่น ๆ อีกมากมาย - แน่นอนใด ๆ ที่รักษาลำดับนี้ไว้s ในทุกกรณีเป็นสถิติการทดสอบที่เทียบเท่ากันเพราะมันจะสร้างค่า p เหมือนกันเสมอ
นอกจากนี้โปรดทราบว่าด้วยความคิดที่แม่นยำยิ่งขึ้นของ 'สถิติการทดสอบ' ที่นำมาใช้ในตอนเริ่มต้นไม่มีสถิติการทดสอบที่เป็นไปได้สำหรับปัญหานี้จริง ๆ แล้วมีการกระจาย hypergeometric; ทำ แต่มันไม่ใช่สถิติการทดสอบที่เหมาะสมสำหรับการทดสอบแบบสองทาง (ถ้าเราทำการทดสอบด้านเดียวซึ่งมีความสัมพันธ์เพิ่มเติมในเส้นทแยงมุมหลักเท่านั้น สถิติทดสอบ) นี่เป็นปัญหาเดียวที่ฉันได้เริ่มต้นด้วย
[แก้ไข: บางโปรแกรมนำเสนอสถิติทดสอบสำหรับการทดสอบฟิชเชอร์; ฉันคิดว่านี่น่าจะเป็นการคำนวณประเภท -2logL ที่เทียบได้กับ asymptotically กับไคสแควร์ บางคนอาจแสดงอัตราต่อรองหรือบันทึกของมัน แต่ก็ไม่เทียบเท่า]
ไม่สามารถมีการแจกแจง hypergeometric โดยทั่วไปได้เพราะ ไม่จำเป็นต้องเป็นค่าจำนวนเต็มจากนั้น จะไม่เป็นจำนวนเต็ม แต่มีเงื่อนไขบนขอบ จะมีการแจกแจง hypergeometric
หากคุณทำอย่างถูกต้องและกำหนดระยะขอบให้เป็นค่าที่รู้จักคุณสามารถพิจารณาได้ (หรือเซลล์อื่น ๆ ) เพื่อเป็นสถิติของคุณ ด้วยการเปรียบเทียบการวาด ลูกบอลจากโกศที่มี ลูกบอลสีขาวและ ลูกบอลสีดำโดยไม่มีการเปลี่ยน สามารถตีความได้ว่าเป็นจำนวนลูกบอลสีขาวที่ถูกลากไปที่ไหน คือผลรวมของแถวแรก คือผลรวมของแถวที่สอง คือผลรวมของคอลัมน์แรก
มันไม่มีจริงๆ สถิติการทดสอบเป็นความผิดปกติทางประวัติศาสตร์ - เหตุผลเดียวที่เรามีสถิติการทดสอบคือการได้รับ p-value การทดสอบที่แน่นอนของฟิชเชอร์กระโดดผ่านสถิติการทดสอบและตรงไปที่ค่า p