สรุป
จำนวนของข้อมูลเกินมีการกระจายทวินามที่มีความน่าจะเป็นที่ไม่รู้จักหน้าใช้นี้เพื่อดำเนินการทดสอบทวินามของกับทางเลือก1/23.5pp=1/2p≠1/2
ส่วนที่เหลือของโพสต์นี้จะอธิบายรูปแบบพื้นฐานและแสดงวิธีการคำนวณ มันมีR
รหัสการทำงานเพื่อดำเนินการพวกเขาออก บัญชีที่กว้างขวางของทฤษฎีการทดสอบสมมติฐานที่ให้ไว้ในคำตอบของฉัน "ความหมายของค่า p และค่า t ในการทดสอบทางสถิติคืออะไร? .
แบบจำลองทางสถิติ
สมมติว่าค่ามีความหลากหลายพอสมควร (มีความสัมพันธ์ไม่กี่ตัวที่ ) จากนั้นภายใต้สมมติฐานว่างของคุณค่าสุ่มใด ๆ ที่สุ่มมีโอกาสมากกว่า (ตั้งแต่มีลักษณะเป็นค่ากลางของประชากร) . สมมติทั้งหมดค่าสุ่มและเป็นอิสระตัวอย่างจำนวนของพวกเขาเกินจึงจะมีทวินามการจัดจำหน่าย ขอให้เราโทรไปยังหมายเลขนี้ "นับ" k3.51/2=50%3.53.52503.5(250,1/2)k
ในทางตรงกันข้ามถ้าแตกต่างจากประชากรเฉลี่ยโอกาสของค่าสุ่มเกินจะแตกต่างจาก1/2นี่คือสมมติฐานทางเลือก3.53.51/2
การค้นหาแบบทดสอบที่เหมาะสม
วิธีที่ดีที่สุดในการแยกแยะสถานการณ์ว่างเปล่าจากทางเลือกคือดูค่าที่มีแนวโน้มมากที่สุดภายใต้ null และมีโอกาสน้อยกว่าภายใต้ทางเลือก เหล่านี้เป็นค่าที่อยู่ใกล้ของเท่ากับ125ดังนั้นภูมิภาคที่สำคัญสำหรับการทดสอบของคุณประกอบด้วยค่าค่อนข้างห่างไกลจาก : ใกล้กับหรือใกล้เคียงกับ250แต่ไกลจากพวกเขาจะต้องเป็นหลักฐานสำคัญว่าไม่ใช่ประชากรเฉลี่ย?k1/225012512502501253.5
ในขึ้นอยู่กับมาตรฐานของคุณมีความสำคัญ:นี้เรียกว่าขนาดการทดสอบมักจะเรียกว่า\ภายใต้สมมติฐานว่างควรมี - แต่ไม่เกิน - และมีโอกาสที่จะอยู่ในพื้นที่วิกฤติααk
ตามปกติแล้วเมื่อเราไม่มีอคติใด ๆ เกี่ยวกับตัวเลือกที่จะนำไปใช้ - ค่ามัธยฐานมากกว่าหรือน้อยกว่า - เราพยายามสร้างพื้นที่วิกฤตเพื่อให้มีโอกาสครึ่งหนึ่ง ,นั้นต่ำและ อีกครึ่ง ,นั้นสูง เนื่องจากเรารู้ว่าการกระจายตัวของภายใต้สมมติฐานว่างข้อมูลนี้เพียงพอที่จะกำหนดภูมิภาคที่สำคัญ3.5α/2kα/2kk
ในทางเทคนิคมีวิธีการทั่วไปสองวิธีในการคำนวณ: คำนวณความน่าจะเป็นแบบทวินามหรือประมาณพวกมันด้วยการแจกแจงแบบปกติ
การคำนวณด้วยความน่าจะเป็นทวินาม
ใช้ฟังก์ชันเปอร์เซ็นต์จุด (ควอนไทด์) ในR
ตัวอย่างนี้เรียกว่าqbinom
และจะถูกเรียกเช่น
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
ผลลัพธ์สำหรับคือα=0.05
109 141
มันหมายความว่าพื้นที่ที่สำคัญประกอบด้วยค่าต่ำทั้งหมดของระหว่าง (และรวม)และร่วมกับทุกค่าสูงของระหว่าง (และรวม)และ250เพื่อเป็นการตรวจสอบเราสามารถขอให้คำนวณโอกาสที่อยู่ในภูมิภาคนั้นเมื่อค่า Null เป็นจริง:k0109k141250R
k
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
เอาท์พุทเป็นมากใกล้กับ - แต่ไม่มากขึ้น than--ตัวเอง เนื่องจากพื้นที่วิกฤตต้องสิ้นสุดที่จำนวนเต็มจึงไม่สามารถทำการทดสอบขนาดจริงนี้ได้เท่ากับขนาดการทดสอบเล็กน้อยแต่ในกรณีนี้ค่าทั้งสองจะใกล้เคียงกันมาก0.0497αα
การคำนวณด้วยการประมาณปกติ
ค่าเฉลี่ยของการแจกแจงแบบทวินามคือและความแปรปรวนคือทำให้ส่วนเบี่ยงเบนมาตรฐาน เท่ากับ7.9 เราจะแทนที่การแจกแจงแบบทวินามด้วยการแจกแจงแบบปกติ การแจกแจงแบบปกติมาตรฐานมีของความน่าจะเป็นน้อยกว่าซึ่งคำนวณโดยคำสั่ง(250,1/2)250×1/2=125250×1/2×(1−1/2)=250/4250/4−−−−−√≈7.9α/2=0.05/2−1.95996R
qnorm(alpha/2)
เพราะการแจกแจงปกติสมมาตรก็ยังมีของความน่าจะเป็นมากขึ้นกว่า1.95996ดังนั้นภูมิภาคที่สำคัญประกอบด้วยค่าที่มีมากขึ้นกว่าค่าเบี่ยงเบนมาตรฐานห่างจาก125คำนวณเกณฑ์เหล่านี้พวกเขาเท่ากับ140.5 การคำนวณสามารถทำได้ในหนึ่งโฉบเช่น0.05/2+1.95996k1.95996125125±7.9×1.96≈109.5,140.5
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
เนื่องจากต้องเป็นจำนวนเต็มเราจึงเห็นว่ามันจะตกอยู่ในภูมิภาควิกฤติเมื่อเป็นหรือน้อยกว่าหรือหรือมากกว่า คำตอบนี้เหมือนกับคำตอบที่ได้จากการคำนวณแบบทวินาม นี่เป็นกรณีปกติเมื่อใกล้มากกว่าหรือขนาดตัวอย่างอยู่ในระดับปานกลางถึงมาก (หลายสิบหรือมากกว่า) และไม่เล็กมาก (ไม่กี่เปอร์เซ็นต์)k109141p1/201α
การทดสอบนี้เนื่องจากไม่มีข้อสันนิษฐานเกี่ยวกับประชากร (ยกเว้นว่ามีความน่าจะเป็นไม่มากนักที่มุ่งเน้นที่ค่ามัธยฐานของมัน) จึงไม่มีประสิทธิภาพเท่ากับการทดสอบอื่น ๆ ที่มีสมมติฐานเฉพาะเกี่ยวกับประชากร หากการทดสอบยังคงปฏิเสธโมฆะก็ไม่จำเป็นต้องกังวลเกี่ยวกับการขาดพลังงาน มิฉะนั้นคุณต้องทำการแลกเปลี่ยนที่ละเอียดอ่อนบางอย่างระหว่างสิ่งที่คุณยินดีที่จะคิดและสิ่งที่คุณสามารถสรุปเกี่ยวกับประชากร