ข้อผิดพลาดมาตรฐานสำหรับค่าเฉลี่ยของตัวอย่างของตัวแปรสุ่มแบบทวินาม


43

สมมติว่าผมใช้การทดสอบที่สามารถมีผล 2 และฉันสมมติว่าพื้นฐานการกระจาย "ความจริง" ของ 2 ผลคือการกระจายทวินามกับพารามิเตอร์และ :P)p B ฉันn o m ฉันa l ( n , p )npBinomial(n,p)

ฉันสามารถคำนวณข้อผิดพลาดมาตรฐานจากรูปแบบของความแปรปรวนของ : ที่1-P ดังนั้น{} สำหรับข้อผิดพลาดมาตรฐานที่ฉันได้รับ:แต่ผมเคยเห็นบางที่{n}} ฉันทำผิดอะไร? Bฉันnomฉันal(n,p)SEX=σXnBinomial(n,p)

σX2=npq
q=1pσX=npqSEX=pqSEX=pqn

บทความนี้มีประโยชน์มากในการเข้าใจข้อผิดพลาดมาตรฐานของค่าเฉลี่ยinfluentialpoints.com/Training/ …
Sanghyun Lee

จาก googling ของฉันปรากฏว่าเรื่องที่เกี่ยวข้องอย่างใกล้ชิดของการได้รับช่วงความเชื่อมั่นสำหรับการแจกแจงทวินามนั้นค่อนข้างที่เหมาะสมและซับซ้อน โดยเฉพาะอย่างยิ่งดูเหมือนว่าช่วงความเชื่อมั่นที่ได้รับจากสูตรนี้ซึ่งจะเป็น "ช่วงเวลา Wald" (ดูen.wikipedia.org/wiki/Binomial_proportion_confidence_interval ) ดูจะค่อนข้างแย่และควรหลีกเลี่ยง ดูjstor.org/stable/2676784?seq=1#metadata_info_tab_contentsสำหรับข้อมูลเพิ่มเติม
aquirdturtle

คำตอบ:


58

ดูเหมือนว่าคุณกำลังใช้สองครั้งในสองวิธีที่แตกต่างกัน - ทั้งสองเป็นขนาดตัวอย่างและเป็นจำนวนการทดลองเบร์โนลลีที่ประกอบด้วยตัวแปรสุ่มแบบทวินาม เพื่อกำจัดความคลุมเครือใด ๆ ฉันจะใช้เพื่ออ้างถึงหลังnk

ถ้าคุณมีกลุ่มที่เป็นอิสระจากการกระจายความแปรปรวนของค่าเฉลี่ยของกลุ่มตัวอย่างของพวกเขาคือnBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

โดยที่และเป็นค่าเฉลี่ยเดียวกัน สิ่งนี้ติดตามมาตั้งแต่¯ Xq=1pX¯

(1) ,สำหรับตัวแปรสุ่มและคงที่ใด ๆคvar(cX)=c2var(X)cXc

(2) ความแปรปรวนของผลรวมของตัวแปรสุ่มอิสระเท่ากับผลรวมของความแปรปรวนที่

ข้อผิดพลาดมาตรฐานของเป็นรากที่สองของความแปรปรวน:{n}} ดังนั้น,X¯kpqn

  • เมื่อคุณจะได้สูตรที่คุณต้องการ:k=npq

  • เมื่อและตัวแปร Binomial เป็นเพียงการทดลองแบบเบอนูลลี่คุณจะได้สูตรที่คุณเห็นที่อื่น:k=1pqn


3
เมื่อคือBernoulliตัวแปรสุ่มแล้วPQ เมื่อมีตัวแปรสุ่มแบบทวินามโดยยึดตามการทดลองด้วยความน่าจะเป็นที่สำเร็จดังนั้นv a r ( X ) = p q X n p v a r ( X ) = n p qXvar(X)=pqXnpvar(X)=npq
มาโคร

2
ขอบคุณ! คุณทำให้ฉันสับสน ขออภัยที่มันเป็นระดับประถมศึกษาฉันยังคงเรียนรู้ :-)
แฟรงค์

6
เห็นได้ชัดว่าแฟรงค์นั้นเราใช้ความจริงนั้นกับค่าคงที่ c Var (cX) = c Var (x) หรือไม่? เนื่องจากค่าประมาณตัวอย่างของสัดส่วนคือ X / n เราจึงมี Var (X / n) = Var (X) / n = npq / n = pq / n และ SEx คือรากที่สองของนั้น ฉันคิดว่ามันชัดเจนสำหรับทุกคนถ้าเราสะกดทุกขั้นตอน 2 2222
Michael Chernick

1
@MichaelChernick ฉันได้ชี้แจงรายละเอียดที่คุณพูดถึง จากคำอธิบายปัญหาฉันพบว่า Frank รู้ข้อเท็จจริงเหล่านี้ แต่คุณคิดถูกว่ามันจะเป็นการศึกษาสำหรับผู้อ่านในอนาคตที่จะรวมรายละเอียดเพิ่มเติม
มาโคร

2
Sol Lago - ในกรณีนี้ k = 1 หากคุณโยนเหรียญ 50 ครั้งและคำนวณจำนวนความสำเร็จจากนั้นทำการทดสอบซ้ำ 50 ครั้งดังนั้น k = n = 50 การพลิกของเหรียญส่งผลให้ 1 หรือ 0 เป็น
rou

9

เป็นเรื่องง่ายที่จะสับสนการแจกแจงทวินามสองครั้ง:

  • การกระจายของจำนวนความสำเร็จ
  • การกระจายสัดส่วนของความสำเร็จ

npq คือจำนวนของความสำเร็จในขณะที่ npq / n = pq คืออัตราส่วนของความสำเร็จ ผลลัพธ์นี้มีสูตรข้อผิดพลาดมาตรฐานที่แตกต่างกัน


6

เราสามารถดูได้ในวิธีต่อไปนี้:

สมมติว่าเรากำลังทำการทดลองที่เราต้องโยนเหรียญเป็นกลางครั้ง ผลลัพธ์โดยรวมของการทดลองคือซึ่งเป็นผลรวมของการโยนของแต่ละบุคคล (พูดหัวเป็น 1 และหางเป็น 0) ดังนั้นสำหรับการทดสอบนี้โดยที่เป็นผลลัพธ์ของการทอยแต่ละครั้งY Y = n i = 1 X ฉันX inYY=i=1nXiXi

ที่นี่ผลลัพธ์ของการโยนแต่ละครั้งตามการแจกแจงเบอร์นูลลีและผลลัพธ์โดยรวมตามการแจกแจงทวินาม YXiY

การทดลองที่สมบูรณ์สามารถถูกคิดเป็นตัวอย่างเดียว ดังนั้นหากเราทำการทดสอบซ้ำเราจะได้ค่าอีกค่าซึ่งจะเป็นตัวอย่างอีกตัวอย่างหนึ่ง ค่าที่เป็นไปได้ทั้งหมดของจะประกอบด้วยประชากรทั้งหมดYYY

กลับมาที่เหรียญเดียวโยนซึ่งต่อไปนี้การกระจาย Bernoulli แปรปรวนจะได้รับโดยที่คือความน่าจะเป็นของหัว (ความสำเร็จ) และPppqpq=1p

ตอนนี้ถ้าเรามองไปที่ความแปรปรวนของ ,(x_i) แต่สำหรับการทดลอง Bernoulli ทั้งหมดแต่ละPQ เนื่องจากมีโยนหรือทดลอง Bernoulli ในการทดสอบnpq นี่ก็หมายความว่ามีความแปรปรวนnpqYV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

ตอนนี้สัดส่วนตัวอย่างถูกกำหนดโดยซึ่งให้ 'สัดส่วนของความสำเร็จหรือหัว' ที่นี่เป็นค่าคงที่เมื่อเราวางแผนที่จะไม่ทิ้งเหรียญเหมือนกันสำหรับการทดลองทั้งหมดในประชากรp^=Ynn

ดังนั้น nV(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

ดังนั้นข้อผิดพลาดมาตรฐานสำหรับ (สถิติตัวอย่าง) คือp^pq/n


คุณสามารถใช้น้ำยางข้นเรียงพิมพ์โดยการวางดอลลาร์รอบคณิตศาสตร์ของคุณเช่น$x$ให้xx
Silverfish

โปรดทราบว่าขั้นตอนสมควรได้รับการพิสูจน์แล้ว! V(Xi)=V(Xi)
Silverfish

มีการพิมพ์ผิดในการหักเงินครั้งสุดท้าย V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n ควรเป็นการหักที่ถูกต้อง
Tarashankar

ขอโทษฉันแนะนำว่าเมื่อทำการเรียงพิมพ์ หวังว่าตอนนี้เรียง
Silverfish

1
นั่นเป็นความจริงหากไม่มีความเกี่ยวข้อง - เพื่อให้เหตุผลนี้เราใช้ความจริงที่ว่าการทดลองนั้นถือว่าเป็นอิสระ Xi
Silverfish

2

ฉันคิดว่ายังมีความสับสนในโพสต์เริ่มต้นระหว่างข้อผิดพลาดมาตรฐานและส่วนเบี่ยงเบนมาตรฐาน ค่าเบี่ยงเบนมาตรฐานคือ sqrt ของความแปรปรวนของการแจกแจง ข้อผิดพลาดมาตรฐานคือค่าเบี่ยงเบนมาตรฐานของค่าเฉลี่ยโดยประมาณของตัวอย่างจากการแจกแจงนั้นคือการแพร่กระจายของค่าเฉลี่ยที่คุณจะสังเกตได้ถ้าคุณทำตัวอย่างนั้นหลายครั้งอย่างไม่สิ้นสุด อดีตเป็นคุณสมบัติที่แท้จริงของการกระจาย; หลังเป็นตัวชี้วัดคุณภาพของการประมาณของคุณสมบัติ (ค่าเฉลี่ย) ของการแจกแจง เมื่อคุณทำการทดลองเกี่ยวกับการทดลอง N Bernouilli เพื่อประเมินความน่าจะเป็นที่ไม่ทราบความสำเร็จความไม่แน่นอนของ p = k / N โดยประมาณหลังจากที่เห็นความสำเร็จ k เป็นข้อผิดพลาดมาตรฐานของสัดส่วนโดยประมาณ sqrt (pq / N) โดยที่ q = 1 -p การแจกแจงที่แท้จริงนั้นมีลักษณะโดยพารามิเตอร์ P ซึ่งเป็นความน่าจะเป็นที่แท้จริงของความสำเร็จ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.