ฉันควรใช้ cdf ทวินามหรือ cdf ปกติเมื่อพลิกเหรียญ?


11

เหรียญจะต้องมีการทดสอบเพื่อความเป็นธรรม 30 หัวขึ้นหลัง 50 พลิก สมมติว่าเหรียญมีความยุติธรรมความน่าจะเป็นที่คุณจะได้รับอย่างน้อย 30 หัวใน 50 ครั้งคือเท่าไหร่?

วิธีที่ถูกต้องในการทำปัญหาตามครูของฉันคือทำ

normalcdf(min = .6, max = ∞, p = .5, σ = sqrt(.5 * .5 / 50) = 0.0786

อย่างไรก็ตามฉันใช้ฟังก์ชันการแจกแจงสะสมแบบทวินามเช่นนี้

1 - binomcdf(n = 50, p = .5, x = 29) = 0.1013

ฉันเชื่อว่าเกณฑ์สำหรับการแจกแจงทวินามเป็นที่พึงพอใจ: แต่ละเหตุการณ์มีความเป็นอิสระมีเพียงสองผลลัพธ์ที่เป็นไปได้ (หัวกับก้อย) ความน่าจะเป็นคงที่สำหรับคำถาม (0.5) และจำนวนการทดลองถูกกำหนดไว้ที่ 50 เห็นได้ชัดว่าทั้งสองวิธีให้คำตอบที่ต่างกันและการจำลองสนับสนุนคำตอบของฉัน (อย่างน้อยสองสามครั้งที่ฉันวิ่งมันชัดเจนว่าฉันไม่สามารถรับประกันได้ว่าคุณจะได้ผลลัพธ์เดียวกัน)

ครูของฉันผิดที่สมมติว่าเส้นโค้งการแจกแจงแบบปกติจะเป็นวิธีที่ถูกต้องในการทำปัญหานี้ (ไม่ว่าจะเป็นการกล่าวว่าการแจกแจงเป็นแบบปกติ แต่n * pและn * (1-p)นั้นทั้งคู่มากกว่า 10) หรือฉันเข้าใจผิดบางอย่างเกี่ยวกับการแจกแจงทวินาม?


5
คนที่มีประสบการณ์ในการใช้การประมาณแบบปกติกับ Binomial จะดำเนินการแตกต่างกันเล็กน้อย: พวกเขาจะใช้การแก้ไขความต่อเนื่อง (ปกติ) เช่นเดียวกับใน1 - pnorm((30-0.5)/50, mean=0.5, sd=sqrt(0.5*(1-0.5)/50))(นี่คือการแสดงออก R) ซึ่งมีค่า 0.1015 ในข้อตกลงอย่างใกล้ชิดกับ Binomial cdf .
whuber

คำตอบ:


10

นี่คือภาพประกอบของคำตอบของเสียงหวือและเสียงบนพื้น

การแก้ไขความต่อเนื่อง

ในสีแดงการกระจายตัวแบบทวินามในสีดำความหนาแน่นของการประมาณปกติN ( 25 , 12.5 )และสีน้ำเงินพื้นผิวที่สอดคล้องกับP ( Y > 29.5 )สำหรับY N ( 25 , 12.5 ) .Bin(50,0.5)N(25,12.5)P(Y>29.5)YN(25,12.5)

P(X=k)XBin(50,0.5)P(k12<Y<k+12)P(X30)P(Y>29.5)

P(Y>29.5)0.1015459,
1-pnorm(29.5,25,sqrt(12.5))
P(X30)0.1013194:

P(X=22)

P(X=22)=(5022)0.5220.5280.07882567,P(21.5<Y<22.5)0.23975010.16109940.07865066.

4

การกระจายปกติให้ประมาณใกล้ชิดกับทวินามถ้าคุณใช้การแก้ไขต่อเนื่อง ใช้สิ่งนี้เป็นตัวอย่างของคุณฉันได้ 0.1015 เนื่องจากเป็นการบ้านฉันจะปล่อยให้คุณกรอกรายละเอียด


4

พิจารณาสิ่งนี้. ในการแจกแจงทวินามแบบไม่ต่อเนื่องคุณมีความน่าจะเป็นจริงสำหรับตัวเลขแต่ละตัว ในภาวะปกติอย่างต่อเนื่องที่ไม่ใช่กรณีนี้คุณต้องมีช่วงของค่า ดังนั้น ... หากคุณประมาณความน่าจะเป็นของค่าแต่ละตัวสมมุติว่า X จากทวินามด้วยค่าปกติคุณจะทำอย่างไร ดูฮิสโทแกรมความน่าจะเป็นของการแจกแจงทวินามโดยมีเส้นโค้งปกติวางอยู่ คุณจะต้องเลือกจาก X ± 0.5 เพื่อจับภาพสิ่งที่คล้ายกับความน่าจะเป็นแบบทวินามของ X ด้วยการประมาณปกติ

ตอนนี้ขยายไปที่เมื่อคุณเลือกส่วนท้ายของการกระจาย เมื่อคุณใช้วิธีทวินามคุณกำลังเลือกความน่าจะเป็นของค่าทั้งหมด (30 ในกรณีของคุณ) บวกกับทุกอย่างที่สูงขึ้น ดังนั้นเมื่อคุณทำสิ่งต่อเนื่องคุณต้องตรวจสอบให้แน่ใจว่าคุณจับภาพนั้นและเลือก 0.5 น้อยลงเช่นกันดังนั้นการตัดการกระจายอย่างต่อเนื่องคือ 29.5


3
ที่จริงแล้วคำถามแสดงให้เห็นถึงความเข้าใจอย่างถ่องแท้ของปัญหาและดูเหมือนจะไม่ได้มองหาคำตอบสำหรับคำถามการบ้านประจำ แม้ว่าจะเป็นการติดแท็กการบ้านให้ลองทำข้อยกเว้นที่นี่ โดยเฉพาะอย่างยิ่งการสนทนาที่ดีในการใช้การแจกแจงแบบปกติเพื่อการกระจายแบบไม่ต่อเนื่องโดยประมาณ (เช่น Binomials และ Poissons ที่มี N ขนาดใหญ่) จะเหมาะสมและยินดีมากที่สุดที่นี่
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.