ช่วงความเชื่อมั่นประมาณค่าทวินามของ 0 หรือ 1


36

อะไรคือวิธีที่ดีที่สุดในการคำนวณช่วงความเชื่อมั่นของการทดลองทวินามหากประมาณการของคุณคือ (หรือในทำนองเดียวกัน ) และขนาดของกลุ่มตัวอย่างมีขนาดค่อนข้างเล็กเช่น ?p = 1 n = 25p=0p=1n=25


ใกล้ศูนย์แค่ไหน มันมักจะเป็นศูนย์หรือตามลำดับ 0.001 หรือ 0.01 หรือ ... ? และคุณมีข้อมูลมากแค่ไหน? p^
jbowman

เรามักจะมีการทดลองมากกว่า 800 ครั้ง โดยปกติเราคาดหวัง 0 ถึง 0.1 สำหรับp^
AI2.0

ใช้ Clopper – Pearson ช่วงที่คุณเชื่อมโยง หลักการทั่วไป: ลองช่วงเวลา Clopper – Pearson ก่อน หากคอมพิวเตอร์ไม่สามารถหาคำตอบได้ให้ลองใช้วิธีการประมาณเช่นการประมาณปกติ ตามความเร็วของคอมพิวเตอร์ในปัจจุบันฉันไม่คิดว่าเราต้องประมาณสถานการณ์ส่วนใหญ่
user158565

สำหรับการรับขีด จำกัด สูงสุดของช่วงความมั่นใจด้วย (1-ระดับความมั่นใจเราจะใช้ B (1− ; x + 1, n − x) โดยที่ x คือจำนวนความสำเร็จ (หรือความล้มเหลว), n คือขนาดตัวอย่างในไพ ธ อนเราเพิ่งใช้ถ้านี่คือ TRUE เราสามารถสรุปได้ว่าเราเป็น 1−มั่นใจหรือไม่ว่าขีด จำกัด ด้านบนจะถูก จำกัด ด้วยค่าที่เราคำนวณได้หรือไม่อัลฟ่าอัลฟ่าααscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x) αscipy.stats.beta.ppf(1−$\alpha$;x+1,n−x)
AI2.0

1
ด้วยการทดลอง 800 ครั้งการประมาณปกติตามปกติจะทำงานได้ดีพอที่ประมาณ (แบบจำลองของฉันระบุการครอบคลุมจริง 94.5% ของช่วงความมั่นใจ 95%) ที่การทดลอง 1,000 ครั้งและความครอบคลุมจริงประมาณ 92.7% (ทั้งหมดขึ้นอยู่กับ 100,000 ซ้ำ) ดังนั้นนี่เป็นเพียงปัญหาสำหรับต่ำมากให้นับการทดลองของคุณ p = 0.01 pp=0.015p=0.01p
jbowman

คำตอบ:


53

อย่าใช้การประมาณปกติ

มีคนมากมายที่เขียนเกี่ยวกับปัญหานี้ คำแนะนำทั่วไปคือไม่เคยใช้การประมาณปกติ (เช่นช่วงความมั่นใจ asymptotic / Wald) เนื่องจากมีคุณสมบัติการรายงานที่แย่มาก รหัส R เพื่อแสดงสิ่งนี้:

library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")

ความน่าจะเป็นของการครอบคลุมสำหรับช่วงความเชื่อมั่นซีมโทติกสำหรับสัดส่วนทวินาม

สำหรับความน่าจะเป็นที่จะประสบความสำเร็จเล็กน้อยคุณอาจขอช่วงความมั่นใจ 95% แต่จริง ๆ แล้วขอพูดช่วงเวลาความมั่นใจ 10%!

ข้อเสนอแนะ

แล้วเราควรใช้อะไร ฉันเชื่อว่าข้อเสนอแนะปัจจุบันเป็นสิ่งที่ระบุไว้ในการประมาณค่าแบบช่วงเวลาของกระดาษสำหรับสัดส่วนแบบทวินามโดย Brown, Cai และ DasGupta ในสถิติทางวิทยาศาสตร์ 2001, vol. หมายเลข 16 2 หน้า 101–133 ผู้เขียนตรวจสอบหลายวิธีในการคำนวณช่วงความมั่นใจ

[W] อีแนะนำช่วงเวลาที่วิลสันหรือเท่ากับนกฟรีย์ช่วงก่อนสำหรับขนาดเล็กและnและช่วงเวลาที่แนะนำในอาเกรสติและ Coull สำหรับขนาดใหญ่n

บางครั้งช่วงเวลาวิลสันก็บางครั้งเรียกว่าช่วงคะแนนเนื่องจากมันขึ้นอยู่กับการคว่ำการทดสอบคะแนน

การคำนวณช่วงเวลา

ในการคำนวณช่วงความมั่นใจเหล่านี้คุณสามารถใช้เครื่องคิดเลขออนไลน์นี้หรือbinom.confint()ฟังก์ชั่นในbinomแพ็คเกจใน R ตัวอย่างเช่นสำหรับ 0 ความสำเร็จในการทดลอง 25 ครั้งรหัส R จะเป็น:

> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
  type="central")
         method x  n  mean  lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2         bayes 0 25 0.019  0.000 0.073
3        wilson 0 25 0.000  0.000 0.133

นี่bayesคือช่วงเวลาของ Jeffreys ( type="central"จำเป็นต้องมีอาร์กิวเมนต์เพื่อให้ได้ช่วงเวลาที่เท่าเทียมกัน )

โปรดทราบว่าคุณควรตัดสินใจว่าจะใช้วิธีใดในสามวิธีก่อนที่จะคำนวณช่วงเวลา การดูทั้งสามและการเลือกที่สั้นที่สุดจะทำให้ความน่าจะเป็นของการครอบคลุมน้อยเกินไป

คำตอบที่รวดเร็วและคาดคะเน

ในฐานะโน้ตสุดท้ายหากคุณสังเกตว่าความสำเร็จเป็นศูนย์ในการทดลองnของคุณและเพียงแค่ต้องการช่วงความมั่นใจโดยประมาณที่รวดเร็วมากคุณสามารถใช้กฎสามข้อ เพียงแค่แบ่งจำนวน 3 โดยn ในตัวอย่างข้างต้นnคือ 25 ดังนั้นขอบเขตบนคือ 3/25 = 0.12 (ขอบล่างเป็น 0 แน่นอน)


ขอบคุณมากสำหรับคำตอบของคุณ ลองนึกภาพตัวอย่างชีวิตจริงนี้: สถาปนิกต้องทดสอบในตึกระฟ้าหากติดตั้งฉนวนกันความร้อนในเพดานอย่างถูกต้อง เขาเปิดเพดาน 25 แผ่นบนการเลือกแบบสุ่มของพื้นและพบว่าเหนือสิ่งเหล่านี้ฉนวนกันความร้อนฝ้าเพดาน ดังนั้นเราสามารถสรุปความน่าจะเป็นที่แท้จริงของการมีแผงฉนวนกันความร้อนได้ด้วยความมั่นใจ 95% ระหว่าง CI [0.867 ถึง 1] ตามช่วงคะแนนวิลสัน?
Kasper

2
ฉันจะไม่บอกว่าคุณสามารถสรุปได้ด้วย '95% ความแน่นอน' (Google สำหรับ 'การตีความช่วงความเชื่อมั่นที่ถูกต้อง') นอกจากนี้ยังขึ้นอยู่กับสมมติฐานของการทดลองอิสระที่มีโอกาสประสบความสำเร็จเท่ากันซึ่งอาจไม่เหมือนจริงที่นี่ บางทีการติดตั้งครั้งสุดท้ายอาจมีความเสี่ยงสูงที่จะถูกติดตั้งอย่างไม่ถูกต้อง (คนที่ติดตั้งพวกเขาก็เริ่มเบื่อ / เบื่อ) หรืออาจจะเป็นคนแรกเพราะคนที่มีประสบการณ์น้อยกว่านั้น อย่างไรก็ตามถ้าสถาปนิกบอกว่าจะทดสอบว่าทุกแผงที่ติดตั้งอย่างถูกต้องเขาควรจะทำผลงานของเขาไม่ได้เป็นเพียงการทดสอบตัวอย่าง!
Karl Ove Hufthammer

5
bayesใช้เครื่องแบบก่อนหน้า (แทนที่จะเป็นเจฟฟรีย์) เมื่อพารามิเตอร์รูปร่างทั้งสองเป็น 1 ฉันส่งอีเมลไปยังผู้ดูแลแพคเกจ binom ด้วยความอยากรู้เกี่ยวกับข้อดี (dis) ของเจฟฟรีย์กับเครื่องแบบก่อนหน้าและเขาบอกฉันว่า ชุดก่อนเป็นค่าเริ่มต้น ดังนั้นอย่าสงสัยว่าผลลัพธ์ในอนาคตจะแตกต่างกันเล็กน้อย
cbeleites รองรับ Monica

3
นี่คือคำตอบที่ยอดเยี่ยม มันบ่งบอกถึงข้อมูลสำคัญทั้งหมดที่คุณสามารถอ่านในเอกสารในหัวข้อ แต่รวบรัดและชัดเจน ถ้าฉันสามารถโหวตได้สองครั้งฉันก็ทำได้
SigmaX

6
binconfวิธีการในHmiscยังคำนวณช่วงเวลาเหล่านี้ มันเริ่มต้นที่วิธีการวิลสัน
SigmaX

0

Agretsi (2007, pp.9-10) แสดงให้เห็นว่าเมื่อสัดส่วนใกล้เคียงกับ 0 หรือ 1 ช่วงความเชื่อมั่นทำงานได้ไม่ดี ใช้ "การทดสอบความสำคัญแบบคู่กับ ... [ว่า] ประกอบด้วยค่าทั้งหมดของสำหรับพารามิเตอร์สมมติฐานว่างที่ตัดสินได้" โดยที่เป็นพารามิเตอร์ที่ไม่รู้จัก ทำเช่นนี้โดยการแก้สำหรับในสมการ 0 ทำได้โดยการยกกำลังสองทั้งสองให้ได้ แก้โดยใช้สูตรสมการกำลังสองซึ่งจะให้ ค่า z วิกฤตที่เหมาะสมp±zα/2p(1p)/nπ0π0π0

|pπ0|p(1p)/n=0
(1+z02/n)π02+(2pz02/n)π0+p2=0


1
ขอบคุณสำหรับบันทึก เพียงแค่ต้องการชี้แจง: คืออัตราความล้มเหลวที่คาดการณ์ (หรือความสำเร็จ) ในประชากรในขณะที่ p คือความล้มเหลวที่สังเกตได้ (หรืออัตราความสำเร็จ) จากตัวอย่าง และ n คือขนาดตัวอย่างเราจึงพยายามหาค่า z โดยประมาณ? (อะไรคือสมมติฐานพื้นฐานที่นี่?) (คุณช่วยเชื่อมโยงฉันไปที่บทความ Agretsi (2007, pp.9-10) ได้ไหม π0
AI2.0

ใช่เป็นพารามิเตอร์ประชากรคือการประมาณการพารามิเตอร์ตามตัวอย่างของคุณและคือขนาดตัวอย่าง ขั้นตอนนี้จะให้ค่า z ที่สำคัญที่คุณต้องการ สมมติฐานพื้นฐานถูกสร้างขึ้นใน Agretsi และ Coull (1998) ซึ่งเป็นลิงค์ท้ายที่สุด น่าเสียดายที่ Agretsi (2007) เป็นหนังสือเรียนดังนั้นฉันจึงไม่สามารถลิงก์กับหนังสือได้ scholar.google.com/… p nπ0pn
Jay Schyler Raadt

นั่นคือ Agresti
Nick Cox

@NickCox มันเป็นงานที่แตกต่าง
Jay Schyler Raadt

1
Alan Agresti ได้ตีพิมพ์ข้อความต่าง ๆ ฉันเดาว่าคุณกำลังพูดถึงการวิเคราะห์ข้อมูลเบื้องต้นอย่างละเอียด (ฉบับที่ 2 ปี 2007 ฉบับที่ 3 ที่กำหนดไว้สำหรับการตีพิมพ์ในเดือนตุลาคม 2018 และอาจมีวันที่ 2019) จาก John Wiley
Nick Cox
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.