สถิติการทดสอบในการทดสอบที่แน่นอนของฟิชเชอร์คืออะไร?


9

สำหรับตารางฉุกเฉินแบบ 2 คูณ 2 บางคนกล่าวว่าการทดสอบที่แน่นอนของ Fisherใช้การนับX1,1 ในเซลล์ (1,1) ในตารางเป็นสถิติการทดสอบและภายใต้สมมติฐานว่าง X1,1 จะมีการแจกแจง hypergeometric

บางคนบอกว่าสถิติการทดสอบของมันคือ

|X1,1μ|
ที่ไหน μคือค่าเฉลี่ยของการแจกแจงไฮเพอร์เมตริกซ์ (ดังที่ได้กล่าวไว้แล้ว) ภายใต้ null นอกจากนี้ยังกล่าวว่าค่า p ถูกกำหนดโดยยึดตามตารางของการแจกแจงแบบไฮเปอร์เมตริกซ์ ฉันสงสัยว่ามีเหตุผลบางอย่างที่จะลบค่าเฉลี่ยแล้วก็ใช้ค่าสัมบูรณ์หรือไม่?|X1,1μ| ไม่มีการแจกแจงไฮเปอร์มิติมิติภายใต้ค่าว่าง

คำตอบ:


10

(เพื่อทำให้ความคิดของเรามีความแม่นยำมากขึ้นเราเรียก 'สถิติการทดสอบ' การกระจายตัวของสิ่งที่เรามองหาเพื่อคำนวณค่า p จริง ๆ ซึ่งหมายความว่าสำหรับการทดสอบแบบสองทางสถิติการทดสอบของเราจะเป็น |T| ค่อนข้างมากกว่า T.)

สถิติทดสอบทำในสิ่งที่ทำให้เกิดการสั่งซื้อในพื้นที่ตัวอย่าง (หรือมากกว่านั้นเป็นการสั่งซื้อบางส่วน) เพื่อให้คุณสามารถระบุกรณีที่รุนแรง (กรณีที่สอดคล้องกับทางเลือกมากที่สุด)

ในกรณีของการทดสอบที่แน่นอนฟิชเชอร์ที่มีอยู่แล้วสั่งในความรู้สึก - ที่มีความน่าจะเป็นของตาราง 2x2 ต่างๆตัวเอง เมื่อมันเกิดขึ้นพวกเขาสอดคล้องกับการสั่งซื้อในX1,1 ในแง่ที่ว่าค่าที่มากที่สุดหรือน้อยที่สุดของ X1,1เป็น 'มาก' และพวกเขาจะยังคนที่มีความน่าจะเป็นขนาดเล็กที่สุด ดังนั้นแทนที่จะดูค่าของX1,1 ในวิธีที่คุณแนะนำเราสามารถทำงานจากปลายขนาดใหญ่และขนาดเล็กในแต่ละขั้นตอนเพียงแค่เพิ่มค่าใดก็ตาม (ใหญ่ที่สุดหรือเล็กที่สุด) X1,1- มูลค่าที่ไม่ได้อยู่ในนั้น) มีความน่าจะเป็นน้อยที่สุดที่เกี่ยวข้องกับมันดำเนินต่อไปจนกว่าคุณจะถึงตารางที่คุณสังเกต ในการรวมความน่าจะเป็นทั้งหมดของตารางสุดขีดทั้งหมดนั้นคือค่า p

นี่คือตัวอย่าง:

ฟังก์ชันความน่าจะเป็น hypergeometric

> data.frame(x=x,prob=dhyper(x,9,12,10),rank=rank(dhyper(x,9,12,10)))
   x         prob rank
1  0 1.871194e-04    2
2  1 5.613581e-03    4
3  2 5.052223e-02    6
4  3 1.886163e-01    8
5  4 3.300786e-01   10
6  5 2.829245e-01    9
7  6 1.178852e-01    7
8  7 2.245433e-02    5
9  8 1.684074e-03    3
10 9 3.402171e-05    1

คอลัมน์แรกคือ X1,1 ค่าคอลัมน์ที่สองคือความน่าจะเป็นและคอลัมน์ที่สามคือการสั่งซื้อที่เกิดขึ้น

ดังนั้นในกรณีเฉพาะของการทดสอบที่แม่นยำของฟิชเชอร์ความน่าจะเป็นของแต่ละตาราง (เท่ากันของแต่ละตารางX1,1ค่า) สามารถพิจารณาสถิติการทดสอบจริง

หากคุณเปรียบเทียบสถิติการทดสอบที่แนะนำ |X1,1μ|มันก่อให้เกิดการเรียงลำดับเดียวกันในกรณีนี้ (และฉันเชื่อว่ามันทำโดยทั่วไป แต่ฉันไม่ได้ตรวจสอบ) ในค่าที่ใหญ่กว่าของสถิตินั้นเป็นค่าที่น้อยกว่าของความน่าจะเป็นดังนั้นจึงสามารถพิจารณาได้ว่า 'สถิติ' - แต่อาจมีปริมาณอื่น ๆ อีกมากมาย - แน่นอนใด ๆ ที่รักษาลำดับนี้ไว้X1,1s ในทุกกรณีเป็นสถิติการทดสอบที่เทียบเท่ากันเพราะมันจะสร้างค่า p เหมือนกันเสมอ

นอกจากนี้โปรดทราบว่าด้วยความคิดที่แม่นยำยิ่งขึ้นของ 'สถิติการทดสอบ' ที่นำมาใช้ในตอนเริ่มต้นไม่มีสถิติการทดสอบที่เป็นไปได้สำหรับปัญหานี้จริง ๆ แล้วมีการกระจาย hypergeometric; X1,1ทำ แต่มันไม่ใช่สถิติการทดสอบที่เหมาะสมสำหรับการทดสอบแบบสองทาง (ถ้าเราทำการทดสอบด้านเดียวซึ่งมีความสัมพันธ์เพิ่มเติมในเส้นทแยงมุมหลักเท่านั้น สถิติทดสอบ) นี่เป็นปัญหาเดียวที่ฉันได้เริ่มต้นด้วย

[แก้ไข: บางโปรแกรมนำเสนอสถิติทดสอบสำหรับการทดสอบฟิชเชอร์; ฉันคิดว่านี่น่าจะเป็นการคำนวณประเภท -2logL ที่เทียบได้กับ asymptotically กับไคสแควร์ บางคนอาจแสดงอัตราต่อรองหรือบันทึกของมัน แต่ก็ไม่เทียบเท่า]


ขอบคุณ Glen_b! การกระจายของX1,1 ภายใต้ null คือการแจกแจงไฮเพอร์เมตริกซ์ซึ่งไม่สมมาตรรอบค่าเฉลี่ย μ. ดังนั้นฉันสงสัยว่า|X1,1μ|สถิติการทดสอบที่เหมาะสมคืออะไร
ทิม

ดูเหมือนว่าสถิติการทดสอบที่สมเหตุสมผลอย่างชัดเจนเนื่องจากสามารถตีความได้อย่างสมบูรณ์และเข้าใจได้ง่าย แน่นอนไม่มีสถิติที่เป็นไปได้จะมีการกระจายสมมาตร ลองลืมความเฉพาะของการทดสอบฟิชเชอร์สักครู่ - ถ้าสถิตินั้นมีความหมายสำหรับคุณคุณสามารถคำนวณการทดสอบที่แน่นอนบนพื้นฐานนั้น (โดยใช้การคำนวณไฮเพอร์เมตริกซ์เพื่อค้นหาความน่าจะเป็น) หากคุณต้องการแสดงให้เห็นว่าพวกเขากำลังทำให้เกิดการเรียงลำดับเดียวกันในทุกกรณีนั่นอาจเป็นคำถามใหม่
Glen_b -Reinstate Monica

6

|X1,1μ| ไม่สามารถมีการแจกแจง hypergeometric โดยทั่วไปได้เพราะ μ ไม่จำเป็นต้องเป็นค่าจำนวนเต็มจากนั้น |X1,1μ|จะไม่เป็นจำนวนเต็ม แต่มีเงื่อนไขบนขอบX1,1 จะมีการแจกแจง hypergeometric

หากคุณทำอย่างถูกต้องและกำหนดระยะขอบให้เป็นค่าที่รู้จักคุณสามารถพิจารณาได้ X1,1(หรือเซลล์อื่น ๆ ) เพื่อเป็นสถิติของคุณ ด้วยการเปรียบเทียบการวาดk ลูกบอลจากโกศที่มี W ลูกบอลสีขาวและ B ลูกบอลสีดำโดยไม่มีการเปลี่ยน X1,1 สามารถตีความได้ว่าเป็นจำนวนลูกบอลสีขาวที่ถูกลากไปที่ไหน B คือผลรวมของแถวแรก W คือผลรวมของแถวที่สอง k คือผลรวมของคอลัมน์แรก


4

มันไม่มีจริงๆ สถิติการทดสอบเป็นความผิดปกติทางประวัติศาสตร์ - เหตุผลเดียวที่เรามีสถิติการทดสอบคือการได้รับ p-value การทดสอบที่แน่นอนของฟิชเชอร์กระโดดผ่านสถิติการทดสอบและตรงไปที่ค่า p


ขอบคุณ แต่มีสถิติทดสอบไม่จริงเหรอ? คุณจะกำหนดค่า p ได้อย่างไร?
ทิม

ผลลัพธ์ของการทดสอบที่แน่นอนของฟิชเชอร์คือค่า p
Jeremy Miles

@JeremyMiles: คุณหมายถึงสถิติการทดสอบเป็นความผิดปกติทางประวัติศาสตร์ในช่วงก่อนการคำนวณราคาประหยัดผู้ใช้คำนวณ Z, t และอื่น ๆ จากนั้นเปรียบเทียบสถิติการทดสอบนี้กับตารางที่คำนวณล่วงหน้าเพื่อกำหนดนัยสำคัญทางสถิติและเป็นผลให้ ผู้ใช้สถิติเชิงอนุมานจำนวนมากยังคงคิดในแง่ของสถิติทดสอบเมื่อพวกเขาสามารถให้ค่า p ได้อย่างง่ายดายหรือไม่ พูดอีกอย่างคือนี่เป็นเอฟเฟ็กต์ generational ไหม
rabidotter

1
@rabidotter - ใช่ฉันเดาว่าฉัน คุณเห็นคนที่เขียน "F = 14.352, df = 2, 568, p <0.05" เหตุผลเดียวที่ทุกคนใส่ใจเกี่ยวกับ F ก็คือการคำนวณ P แต่พวกเขาให้ความแม่นยำสูงกับ F และให้ความแม่นยำน้อยมาก
Jeremy Miles
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.