ทำไมโพลทางการเมืองถึงมีขนาดตัวอย่างขนาดใหญ่เช่นนี้?


32

เมื่อฉันดูข่าวฉันสังเกตเห็นว่าการสำรวจของ Gallup สำหรับสิ่งต่าง ๆ เช่นการเลือกตั้งประธานาธิบดีมีขนาดตัวอย่างมากกว่า 1,000 ตัวอย่าง จากสิ่งที่ฉันจำได้จากสถิติของวิทยาลัยคือขนาดตัวอย่าง 30 เป็นตัวอย่าง "มีขนาดใหญ่มาก" ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง


9
ในที่สุดใครบางคนอยู่ที่นี่เพื่อพูดคุยเกี่ยวกับเสื้อผ้าใหม่ของ Big Data Emperor ใครต้องการผู้ใช้ทวีตเตอร์ 600M ถ้าคุณจะได้รับทุกคำตอบจากขนาดของกลุ่มตัวอย่างสถิติวิทยาลัย 30
StasK

1
StasK นั่นเป็นเฮฮา
Aaron Hall

สุดยอดความคิดเห็น @StasK
Brennan

คำตอบ:


36

เวย์นได้กล่าวถึงประเด็น "30" เป็นอย่างดีพอ (กฎง่ายๆของฉัน: การกล่าวถึงหมายเลข 30 ที่เกี่ยวกับสถิติน่าจะผิด)

เหตุใดจึงใช้ตัวเลขในบริเวณใกล้เคียง 1,000 ตัว

จำนวนประมาณ 1,000-2,000 มักใช้ในการสำรวจแม้ในกรณีที่มีสัดส่วนอย่างง่าย (" คุณชอบอะไร><> ?")

สิ่งนี้ทำเพื่อให้ได้การประมาณสัดส่วนที่แม่นยำอย่างสมเหตุสมผล

หากสันนิษฐานว่าสุ่มตัวอย่างทวินามความผิดพลาดมาตรฐาน * ของสัดส่วนตัวอย่างจะใหญ่ที่สุดเมื่อสัดส่วนคือ - แต่ขีด จำกัด สูงสุดนั้นยังคงเป็นค่าประมาณที่ดีสำหรับอัตราส่วนระหว่างประมาณ 25% ถึง 75%12

* "standard error" = "ค่าเบี่ยงเบนมาตรฐานของการแจกแจง"

เป้าหมายร่วมกันคือการประมาณเปอร์เซ็นต์ภายในประมาณของเปอร์เซ็นต์ที่แท้จริงประมาณของเวลา นั่นคือเรียกว่า ' ระยะขอบของข้อผิดพลาด '95 % 3 %±3%95%3%

ในข้อผิดพลาดมาตรฐาน 'กรณีที่เลวร้ายที่สุด' ภายใต้การสุ่มตัวอย่างแบบทวินามสิ่งนี้นำไปสู่:

1.96×12(112)/n0.03

0.98×1/n0.03

n0.98/0.03

n1067.11

... หรือ 'มากกว่า 1,000 บิต'

ดังนั้นถ้าคุณสำรวจคน 1,000 คนโดยการสุ่มจากประชากรที่คุณต้องการอ้างถึงและ 58% ของกลุ่มตัวอย่างสนับสนุนข้อเสนอคุณสามารถมั่นใจได้ว่าสัดส่วนประชากรอยู่ระหว่าง 55% ถึง 61%

(บางครั้งอาจใช้ค่าอื่น ๆ สำหรับระยะขอบของข้อผิดพลาดเช่น 2.5% หากคุณลดระยะขอบของข้อผิดพลาดลงครึ่งหนึ่งขนาดของกลุ่มตัวอย่างจะเพิ่มขึ้นเป็นทวีคูณของ 4)

ในการสำรวจที่ซับซ้อนซึ่งต้องการการประมาณสัดส่วนที่ถูกต้องในประชากรย่อยบางคน (เช่นสัดส่วนของบัณฑิตวิทยาลัยผิวดำจากเท็กซัสที่เห็นด้วยกับข้อเสนอ) ตัวเลขอาจมีขนาดใหญ่พอที่กลุ่มย่อยนั้นมีขนาดหลายร้อยบางที รวมถึงการตอบสนองนับหมื่นโดยรวม

เนื่องจากอาจกลายเป็นสิ่งที่ไม่สามารถทำได้อย่างรวดเร็วจึงเป็นเรื่องปกติที่จะแบ่งประชากรออกเป็นประชากรย่อย (strata) และสุ่มแต่ละตัวอย่างแยกกัน ถึงแม้ว่าคุณจะสามารถจบการสำรวจที่มีขนาดใหญ่มาก

ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง

มันขึ้นอยู่กับขนาดของเอฟเฟกต์และความแปรปรวนแบบสัมพันธ์ เอฟเฟกต์ต่อความแปรปรวนหมายความว่าคุณอาจต้องการตัวอย่างที่ค่อนข้างใหญ่ในบางสถานการณ์n

ฉันตอบคำถามที่นี่ (ฉันคิดว่ามันมาจากวิศวกร) ที่จัดการกับกลุ่มตัวอย่างที่มีขนาดใหญ่มาก (ในบริเวณใกล้เคียงกับหนึ่งล้านถ้าฉันจำได้ถูกต้อง) แต่เขากำลังมองหาเอฟเฟกต์เล็ก ๆ น้อย ๆ

มาดูกันว่ากลุ่มตัวอย่างที่มีขนาดตัวอย่าง 30 เท่าให้อะไรกับเราเมื่อประมาณสัดส่วนตัวอย่าง

ลองนึกภาพเราถามคน 30 คนว่าพวกเขาได้รับการอนุมัติจากที่อยู่สหภาพหรือไม่ (เห็นด้วยอย่างยิ่งเห็นด้วยไม่เห็นด้วยไม่เห็นด้วยอย่างยิ่ง) ลองจินตนาการอีกว่าดอกเบี้ยอยู่ในสัดส่วนที่เห็นด้วยหรือเห็นด้วยอย่างยิ่ง

พูด 11 ข้อจากที่สัมภาษณ์เห็นด้วยและ 5 ข้อตกลงอย่างยิ่งรวมเป็น 16

16/30 ประมาณ 53% ขอบเขตของเราสำหรับสัดส่วนในประชากรคืออะไร (ด้วยช่วงเวลา 95%)

เราสามารถระบุสัดส่วนประชากรลงไปที่ระหว่าง 35% ถึง 71% (ประมาณ) หากสมมติฐานของเรามี

ไม่ใช่ทุกอย่างที่มีประโยชน์


+1 คำตอบทั้งหมดนั้นยอดเยี่ยม แต่บรรทัดแรกนั้นคุ้มค่ากับการลงคะแนนด้วยตัวเอง
Matt Krause

1
และแน่นอนคุณสามารถย้อนกลับการคำนวณและคำนวณระยะขอบของข้อผิดพลาดด้วยตัวอย่าง 30 ...
Calimo

ย่อหน้าสุดท้ายของคุณคือที่ฉันเชื่อว่ามีการสุ่มตัวอย่างแบบแบ่งชั้น อย่างที่คนอื่นพูดกันการสุ่มตัวอย่างแบบง่าย ๆ จากประชากรผู้มีสิทธิ์ลงคะแนนไม่ได้เกิดขึ้นจริงในระดับประเทศ
เวย์น

@ เวย์นขอบคุณ; ฉันกลับไปและเพิ่มอีกนิดในตอนท้าย
Glen_b -Reinstate Monica

2
+1 และฉันก็ชอบความขัดแย้งของกฎนิ้วโป้งของคุณ
James Stanley

10

กฎของหัวแม่มือนั้นแสดงให้เห็นว่า 30 คะแนนนั้นเพียงพอที่จะสรุปได้ว่าข้อมูลนั้นถูกแจกจ่ายตามปกติ (เช่นมีลักษณะเป็นเส้นโค้งระฆัง) แต่นี่เป็นแนวทางที่ดีที่สุด หากเรื่องนี้ตรวจสอบข้อมูลของคุณ! นี่เป็นการแนะนำว่าคุณต้องการผู้ตอบแบบสอบถามอย่างน้อย 30 คนสำหรับการสำรวจของคุณหากการวิเคราะห์ของคุณขึ้นอยู่กับสมมติฐานเหล่านี้ แต่มีปัจจัยอื่น ๆ ด้วย

ปัจจัยหนึ่งที่สำคัญคือ "ขนาดผลกระทบ" เผ่าพันธุ์ส่วนใหญ่มักจะใกล้เคียงกันดังนั้นกลุ่มตัวอย่างที่มีขนาดใหญ่พอสมควรจึงจำเป็นต้องตรวจสอบความแตกต่างเหล่านี้อย่างน่าเชื่อถือ (หากคุณสนใจที่จะกำหนดขนาดตัวอย่าง "ถูกต้อง" คุณควรพิจารณาการวิเคราะห์พลังงาน ) หากคุณมีตัวแปรสุ่มของ Bernoulli (บางสิ่งที่มีสองผลลัพธ์) นั่นคือประมาณ 50:50 คุณต้องมีการทดลองประมาณ 1,000 ครั้งเพื่อให้ได้ข้อผิดพลาดมาตรฐานลดลงเหลือ 1.5% นั่นอาจแม่นยำพอที่จะคาดการณ์ผลลัพธ์ของการแข่งขัน (การเลือกตั้งประธานาธิบดี 4 ครั้งล่าสุดของสหรัฐอเมริกามีค่าเฉลี่ยอยู่ที่ประมาณ 3.2 เปอร์เซ็นต์) ซึ่งตรงกับการสังเกตของคุณ

ข้อมูลโพลมักจะถูกหั่นและหั่นสี่เหลี่ยมลูกเต๋าในรูปแบบที่แตกต่างกัน: "ผู้สมัครที่มีผู้ชายเป็นเจ้าของปืนมากกว่า 75 คน" หรืออะไรก็ตาม สิ่งนี้ต้องการตัวอย่างที่มีขนาดใหญ่กว่าเนื่องจากผู้ตอบแต่ละคนมีหมวดหมู่เพียงไม่กี่หมวด

การเลือกตั้งประธานาธิบดีบางครั้งอาจ "รวม" กับคำถามสำรวจอื่น ๆ (เช่นเชื้อชาติของรัฐสภา) ด้วย เนื่องจากสิ่งเหล่านี้แตกต่างกันไปในแต่ละรัฐจึงมีข้อมูลการลงคะแนนเสียงแบบ "พิเศษ" บางส่วน


กระจาย Bernoulli มีแจกแจงความน่าจะไม่ต่อเนื่องมีเพียงสองผล: ตัวเลือกที่ 1 ได้รับการแต่งตั้งด้วยความน่าจะในขณะที่ตัวเลือกที่ 2 จะเลือกด้วยความน่าจะเป็น1-P1 - หน้าp1p

ความแปรปรวนของการกระจาย Bernoulli คือดังนั้นข้อผิดพลาดมาตรฐานของค่าเฉลี่ยเป็น{n}} เสียบ (การเลือกตั้งคือเสมอ) ตั้งค่าข้อผิดพลาดมาตรฐานเป็น 1.5% (0.015) และแก้ไข คุณต้องได้ 1,111 วิชาเพื่อรับ 1.5% SEพี(1-พี) p=0.5พี(1-พี)nพี=0.5


4
+1 อย่างไรก็ตาม "30 คะแนนก็พอที่จะคิดได้ว่าข้อมูลนั้นถูกกระจายตามปกติ" ไม่เป็นความจริง อาจเป็นไปได้ว่าผู้คนเชื่อเช่นนี้ แต่ต้องใช้ข้อมูลจำนวนเท่าใดสำหรับ CLT ในการกระจายการสุ่มตัวอย่างมาบรรจบกันอย่างเพียงพอให้เป็นปกติขึ้นอยู่กับลักษณะของการกระจายข้อมูล (ดูที่นี่ ) แทน 30 (อาจ) ประมาณพอถ้าข้อมูลเป็นปกติอยู่แล้ว แต่ SD ประมาณจากชุดข้อมูลเดียวกัน (cf, การแจกแจงแบบ t)
gung - Reinstate Monica

@Gung เห็นด้วยทั้งหมด แต่ฉันไม่ต้องการออกไปไกลเกินไป อย่าลังเลที่จะแก้ไขเพิ่มเติมหากคุณคิดว่าควรทำประเด็นนี้ให้ดียิ่งขึ้น
Matt Krause

8

มีอยู่แล้วบางคำตอบที่ดีสำหรับคำถามนี้มี แต่ฉันต้องการคำตอบว่าทำไมข้อผิดพลาดมาตรฐานคือสิ่งที่มันเป็นเหตุผลที่เราใช้เป็นกรณีที่เลวร้ายและวิธีการที่ข้อผิดพลาดมาตรฐานแตกต่างกันกับnnพี=0.5n

สมมติว่าเรามีการสำรวจความคิดเห็นของผู้มีสิทธิเลือกตั้งเพียงคนเดียวเราจะเรียกเขาว่าผู้ออกเสียงลงคะแนน 1 และถามว่า "คุณจะลงคะแนนให้พรรคม่วงไหม" เราสามารถเขียนรหัสคำตอบเป็น 1 สำหรับ "ใช่" และ 0 สำหรับ "ไม่" สมมติว่าน่าจะเป็นของ "ใช่" ที่เป็นพีขณะนี้เรามีไบนารีตัวแปรสุ่มซึ่งเป็น 1 ด้วยความน่าจะและ 0 พร้อมด้วยความน่าจะเป็น1-Pเราบอกว่าเป็นตัวแปร Bernouilli กับความน่าจะเป็นของความสำเร็จของซึ่งเราสามารถเขียน(P) ที่คาดหวังหรือหมายถึงพีX1พี1-พีX1พีX1~BอีRnโอยูผมล.ล.ผม(พี)X1E(X1)=xP(X1=x)xX1. แต่มีเพียงสองผล 0 พร้อมด้วยความน่าจะเป็น 1 และมีความน่าจะพีดังนั้นผลรวมเป็นเพียงE ( X 1 ) = 0 ( 1 - P ) + 1 ( P ) = P หยุดและคิด. สิ่งนี้ดูสมเหตุสมผลอย่างสมบูรณ์ - หากมีโอกาส 30% ของผู้ลงคะแนนเสียง 1 ที่สนับสนุนพรรคม่วงและเราได้กำหนดให้ตัวแปรเป็น 1 ถ้าพวกเขาพูดว่า "ใช่" และ 0 ถ้าพวกเขาพูดว่า "ไม่" เราก็จะ คาดว่าX 1จะเท่ากับ 0.3 โดยเฉลี่ย1ppE(X1)=0(1p)+1(p)=pX1

ลองคิดว่าเกิดอะไรขึ้นเราตาราง 1 ถ้าX 1 = 0แล้วX 2 1 = 0และถ้าX 1 = 1แล้วX 2 1 = 1 ดังนั้นในความเป็นจริงX 2 1 = X 1ไม่ว่าในกรณีใด เนื่องจากพวกเขาจะเหมือนกันแล้วพวกเขาก็ต้องมีค่าคาดว่าเดียวกันดังนั้นE ( X 2 1 ) = P นี่ทำให้ฉันได้วิธีง่ายๆในการคำนวณความแปรปรวนของตัวแปร Bernouilli: ฉันใช้V aX1X1=0X12=0X1=1X12=1X12=X1E(X12)=พีและค่าเบี่ยงเบนมาตรฐานคือ σ X 1 = Var(X1)=E(X12)E(X1)2=pp2=p(1p) )σX1=p(1p)

เห็นได้ชัดว่าผมต้องการที่จะพูดคุยกับผู้มีสิทธิเลือกตั้งอื่น ๆ - ช่วยให้เรียกพวกเขามีสิทธิเลือกตั้งที่ 2 ผู้มีสิทธิเลือกตั้งที่ 3 ผ่านไปยังผู้มีสิทธิเลือกตั้งnสมมติว่าพวกเขาทั้งหมดมีความน่าจะเป็นเหมือนกันหน้าในการสนับสนุนพรรคสีม่วง ตอนนี้เรามีnตัวแปร Bernouilli, X 1 , X 2ผ่านไปยังX nกับแต่ละX ฉัน ~ B E R n o ยูลิตรลิตรฉัน( P )สำหรับผมตั้งแต่ 1 ถึงn พวกเขาทั้งหมดมีค่าเฉลี่ยpและความแปรปรวนเดียวกันp (npnX1X2XnXiBernoulli(p)inp )p(1p)

ฉันต้องการที่จะพบว่าหลายคนในกลุ่มตัวอย่างของฉันบอกว่า "ใช่" และจะทำอย่างนั้นฉันก็สามารถเพิ่มขึ้นทุกฉัน ฉันจะเขียนX = Σ n ฉัน= 1 Xฉัน ฉันสามารถคำนวณค่าเฉลี่ยหรือค่าที่คาดหวังของXโดยใช้กฎที่E ( X + Y ) = E ( X ) + E ( Y )หากความคาดหวังเหล่านั้นมีอยู่และขยายไปถึงE ( X 1 + X 2 + + XXiX=i=1nXiXE(X+Y)=E(X)+E(Y) ) แต่ผมเพิ่มขึ้น nของความคาดหวังเหล่านั้นและแต่ละหน้าเพื่อให้ฉันได้รับในจำนวนทั้งหมดที่ E ( X ) = n P หยุดและคิด. ถ้าฉันสำรวจ 200 คนและแต่ละคนมีโอกาส 30% ที่บอกว่าพวกเขาสนับสนุนพรรคม่วงแน่นอนว่าฉันคาดหวังว่า 0.3 x 200 = 60 คนจะพูดว่า "ใช่" ดังนั้นสูตร n p จึงดูถูกต้อง หัก "ชัดเจน" เป็นวิธีจัดการกับความแปรปรวนE(X1+X2++Xn)=E(X1)+E(X2)++E(Xn)npE(X)=npnp

มีเป็นกฎที่บอกว่า แต่ฉันสามารถ เพียงใช้มันถ้าตัวแปรสุ่มของฉันมีความเป็นอิสระของแต่ละอื่น ๆ งั้นลองทำสมมุติฐานนั้นและตามตรรกะที่คล้ายกันก่อนที่ฉันจะเห็นV

Var(X1+X2++Xn)=Var(X1)+Var(X2)++Var(Xn)
) หากตัวแปร Xคือผลรวมของ nอิสระทดลอง Bernoulli ด้วยโอกาสที่จะประสบความสำเร็จที่เหมือนกันของหน้าแล้วเราบอกว่า Xมีการกระจายทวินาม X ~ B ฉันn o ฉันลิตร( n , P ) เราเพิ่งแสดงให้เห็นว่าค่าเฉลี่ยของการแจกแจงทวินามเช่น n pและความแปรปรวนคือ n pVar(X)=np(1p)Xn pXXBinomial(n,p)np )np(1p)

ปัญหาดั้งเดิมของเราคือวิธีประมาณค่าจากตัวอย่าง วิธีที่เหมาะสมในการกำหนดประมาณการของเราคือP = X / n ตัวอย่างเช่น 64 จากตัวอย่าง 200 คนของเราพูดว่า "ใช่" เราคาดว่า 64/200 = 0.32 = 32% ของคนบอกว่าพวกเขาสนับสนุนพรรคม่วง คุณจะเห็นว่าหน้าคือ "ลดขนาดลง" รุ่นจำนวนรวมของเราใช่ผู้มีสิทธิเลือกตั้งX นั่นหมายความว่ามันยังคงเป็นตัวแปรสุ่ม แต่ไม่เป็นไปตามการแจกแจงทวินามอีกต่อไป เราสามารถหาค่าเฉลี่ยและความแปรปรวนของมันได้เพราะเมื่อเราปรับขนาดตัวแปรสุ่มด้วยค่าคงที่kแล้วมันจะปฏิบัติตามกฎต่อไปนี้: E ( k X )pp^=X/np^Xk (เพื่อให้เกล็ดเฉลี่ยโดยปัจจัยเดียวกัน k ) และ V R ( k X ) = k 2 V R ( X ) สังเกตว่าความแปรปรวนจะลดลงตาม k 2ได้อย่างไร มันสมเหตุสมผลเมื่อคุณรู้ว่าโดยทั่วไปความแปรปรวนจะถูกวัดในหน่วยสี่เหลี่ยมของหน่วยใดก็ตามที่ตัวแปรนั้นวัดใน: ใช้ไม่ได้ที่นี่ แต่ถ้าตัวแปรสุ่มของเรามีความสูงเป็นเซนติเมตรความแปรปรวนจะเป็น c m 2ซึ่งมีขนาดแตกต่างกัน - หากคุณเพิ่มความยาวเป็นสองเท่าคุณจะเพิ่มพื้นที่สี่เท่าE(kX)=kE(X)kVar(kX)=k2Var(X)k2cm2

นี่คือตัวคูณสเกลของเราคือ . นี้จะช่วยให้เราE( P )=11nP มันเยี่ยมมาก! โดยเฉลี่ยประมาณการของเราหน้าเป็นสิ่งที่ "ควร" จะเป็นจริง (หรือประชากร) น่าจะเป็นที่ผู้มีสิทธิเลือกตั้งสุ่มบอกว่าพวกเขาจะลงคะแนนให้พรรคสีม่วง เรากล่าวว่าประมาณการของเราคือเป็นกลาง แต่ในขณะที่มันถูกต้องโดยเฉลี่ยบางครั้งมันจะเล็กเกินไปและบางครั้งก็สูงเกินไป เราสามารถเห็นความผิดพลาดที่อาจเกิดขึ้นจากการดูความแปรปรวน VR( P )=1E(p^)=1nE(X)=npn=pp^ . ค่าเบี่ยงเบนมาตรฐานเป็นรากVar(p^)=1n2Var(X)=np(1p)n2=p(1p)nและเพราะมันทำให้เราเข้าใจว่าตัวประมาณของเราจะไม่ดีอย่างไร (มันเป็นรูตค่าเฉลี่ยของความคลาดเคลื่อนกำลังสองได้อย่างมีประสิทธิภาพวิธีการคำนวณข้อผิดพลาดเฉลี่ยที่ปฏิบัติต่อข้อผิดพลาดเชิงบวกและเชิงลบ ) มันเป็นเรื่องปกติที่เรียกว่าข้อผิดพลาดมาตรฐาน กฎง่ายๆที่ใช้งานได้ดีสำหรับตัวอย่างขนาดใหญ่และสามารถจัดการกับการใช้ทฤษฎีการ จำกัด ที่มีชื่อเสียงอย่างเข้มงวดมากขึ้นคือส่วนใหญ่ (ประมาณ 95%) การประมาณจะผิดโดยข้อผิดพลาดมาตรฐานน้อยกว่าสองข้อp(1p)n

เนื่องจากปรากฏในส่วนของเศษส่วนค่าที่สูงขึ้นของ - ตัวอย่างที่ใหญ่กว่า - ทำให้ข้อผิดพลาดมาตรฐานมีขนาดเล็กลง นั่นเป็นข่าวที่ดีราวกับว่าฉันต้องการข้อผิดพลาดมาตรฐานขนาดเล็กฉันแค่ทำให้ขนาดตัวอย่างใหญ่พอ ข่าวร้ายคือnอยู่ในสแควร์รูทดังนั้นถ้าฉันเพิ่มขนาดตัวอย่างเป็นสี่เท่าฉันจะลดความผิดพลาดมาตรฐานลงครึ่งหนึ่งเท่านั้น ข้อผิดพลาดมาตรฐานขนาดเล็กมากจะเกี่ยวข้องกับตัวอย่างที่มีขนาดใหญ่มากดังนั้นจึงมีราคาแพง มีปัญหาอื่น: หากฉันต้องการกำหนดเป้าหมายข้อผิดพลาดมาตรฐานที่เจาะจงให้พูด 1% แล้วฉันต้องรู้ค่าp ที่จะใช้ในการคำนวณของฉัน ฉันอาจใช้ค่าในอดีตหากฉันมีข้อมูลการสำรวจที่ผ่านมา แต่ฉันต้องการเตรียมพร้อมสำหรับกรณีที่เลวร้ายที่สุดที่เป็นไปได้ ค่าใดของpnnppเป็นปัญหามากที่สุด? กราฟเป็นคำแนะนำ

กราฟของ sqrt (p (1-p))

ที่เลวร้ายที่สุดกรณี (สูงสุด) ข้อผิดพลาดมาตรฐานจะเกิดขึ้นเมื่อ 0.5 เพื่อพิสูจน์ว่าฉันสามารถใช้แคลคูลัสได้ แต่พีชคณิตมัธยมบางแห่งจะใช้กลอุบายตราบใดที่ฉันรู้วิธี " เติมสี่เหลี่ยมให้เสร็จ " p=0.5

p(1p)=pp2=14(p2p+14)=14(p12)2

p12=0p=12

0.25n=0.5n<0.01n>50n>2500

pXin

p=0.5p=0.7p=0.3p(1p)

กราฟขนาดตัวอย่างที่ต้องการสำหรับข้อผิดพลาดมาตรฐานที่ต้องการที่แตกต่างกัน


มาตราส่วน log10 ในแกน y อาจช่วยได้ที่นี่
EngrStudent - Reinstate Monica

7

กฎ "อย่างน้อย 30" ได้รับการแก้ไขในการโพสต์อีกครั้งในการตรวจสอบข้าม มันเป็นกฎง่ายๆที่ดีที่สุด

เมื่อคุณนึกถึงตัวอย่างที่ควรจะเป็นตัวแทนของผู้คนหลายล้านคนคุณจะต้องมีตัวอย่างที่มีขนาดใหญ่กว่าแค่ 30 คนโดยสังเขป 30 คนไม่สามารถรวมหนึ่งคนจากแต่ละรัฐได้! จากนั้นคิดว่าคุณต้องการเป็นตัวแทนของพรรครีพับลิกันเดโมแครตและที่ปรึกษาอิสระ (อย่างน้อย) และสำหรับแต่ละคนที่คุณต้องการเป็นตัวแทนกลุ่มอายุที่แตกต่างกันสองประเภทและสำหรับกลุ่มรายได้ที่แตกต่างกันสองประเภท

มีเพียง 30 คนที่โทรหาคุณจะพลาดกลุ่มประชากรจำนวนมากที่คุณต้องการเก็บตัวอย่าง

แก้ไข 2: [ฉันได้ลบย่อหน้าที่ abaumann และ StasK คัดค้าน ฉันยังไม่ได้ชักชวน 100% แต่โดยเฉพาะอย่างยิ่งการโต้แย้งของ StasK ที่ฉันไม่เห็นด้วย] ถ้าคน 30 คนได้รับการคัดเลือกอย่างสมบูรณ์แบบสุ่มจากผู้มีสิทธิ์ลงคะแนนที่มีสิทธิ์ทั้งหมดตัวอย่างจะมีเหตุผล แต่มีขนาดเล็กเกินไปที่จะ ให้คุณแยกแยะว่าคำตอบสำหรับคำถามของคุณจริงหรือเท็จ (ในบรรดาผู้มีสิทธิ์ลงคะแนนที่มีสิทธิ์ทั้งหมด) StasK อธิบายว่ามันจะแย่แค่ไหนในความคิดเห็นที่สามของเขาด้านล่าง

แก้ไข: ในการตอบกลับความคิดเห็นของ sampleize999 มีวิธีการอย่างเป็นทางการในการพิจารณาว่ามีขนาดใหญ่พอเรียกว่า " การวิเคราะห์พลังงาน " ซึ่งอธิบายไว้ที่นี่ด้วย ความคิดเห็นของ abaumann แสดงให้เห็นว่ามีการแลกเปลี่ยนระหว่างความสามารถของคุณในการแยกความแตกต่างและปริมาณของข้อมูลที่คุณต้องใช้เพื่อการปรับปรุงจำนวนหนึ่ง ในขณะที่เขาแสดงให้เห็นว่ามีรากที่สองในการคำนวณซึ่งหมายถึงประโยชน์ (ในแง่ของพลังงานที่เพิ่มขึ้น) เติบโตช้าลงหรือมากขึ้นหรือต้นทุน (ในแง่ของจำนวนตัวอย่างที่คุณต้องการ) เติบโตอย่างรวดเร็วมากขึ้นดังนั้นคุณต้องการ ตัวอย่างเพียงพอ แต่ไม่มาก


2
"จุดตัวอย่างทั้งหมด - ความถูกต้องทั้งหมด - คือมันสะท้อนถึงประชากรไม่ใช่แบบสุ่ม" นั่นเป็นความผิดพลาดอย่างชัดแจ้ง! ความถูกต้อง (ในแง่ของลักษณะทั่วไป) เกิดจากตัวอักษรแบบสุ่มของขั้นตอนการสุ่มตัวอย่าง กรณีนี้ค่อนข้างเป็นเพราะคุณสนใจที่จะมีระยะขอบที่น้อยมากคุณต้องมีการประมาณที่แม่นยำโดยจำเป็นต้องมีกลุ่มตัวอย่างที่มีขนาดใหญ่
abaumann

3
@ บาวมันน์: เท่าที่ฉันเข้าใจในสิ่งต่าง ๆ ไม่มีเวทมนตร์ในการสุ่มตัวอย่าง: มันเป็นวิธีที่มีวัตถุประสงค์มากที่สุดที่เรามีในการสร้างตัวอย่างที่สะท้อนถึงประชากร นั่นเป็นเหตุผลที่เราอาจใช้การสุ่มภายในชั้นหรือใช้การแบ่งชั้นและน้ำหนักเพื่อพยายามชดเชยการสุ่มที่ไม่มากนัก
เวย์น

2
samplesize: สิ่งนี้มีน้อยหรือไม่มีส่วนเกี่ยวข้องกับการเป็น "ผู้เชี่ยวชาญ" ตัวอย่างเช่นผู้สมัครชิงตำแหน่งประธานาธิบดีสหรัฐเรียกใช้ "การติดตามแบบสำรวจ" ทุกสัปดาห์และทุกวันในระหว่างการรณรงค์และสำรวจเพียง 200-300 คนเท่านั้น ขนาดตัวอย่างเหล่านี้ให้ความสมดุลของค่าใช้จ่ายและข้อมูลที่เพียงพอ ในอีกขั้นหนึ่งการศึกษาที่เกี่ยวข้องกับสุขภาพอย่าง NHANES นั้นลงทะเบียนผู้คนหลายสิบหรือหลายแสนคนเพราะมันเป็นสิ่งที่จำเป็นในการผลิตข้อมูลที่สามารถนำไปใช้งานได้ซึ่งมีมูลค่าสูงเช่นนี้ ในทั้งสองกรณีผู้เชี่ยวชาญกำลังพิจารณาขนาดตัวอย่าง
whuber

2
ในทางเทคนิคการวางนัยทั่วไปจะใช้ได้ถ้าตัวอย่างเป็นตัวแทนของประชากร แนวคิดคือการมีกลุ่มตัวอย่างแบบสุ่มรับรองว่ากลุ่มตัวอย่างจะเป็นตัวแทน แต่นี่เป็นเรื่องยาก (ไม่จำเป็นว่าจะเป็นไปไม่ได้) ที่จะบรรลุถ้ากลุ่มตัวอย่างนั้นไม่ได้สุ่ม FWIW ไม่มีการสำรวจความคิดเห็นใช้การสุ่มตัวอย่างแบบง่าย
gung - Reinstate Monica

1
@sashkello มีพื้นกลาง: หนึ่งสามารถใช้ตัวอย่างแบบแบ่งชั้น (โดยหลักตัวเลือกของคุณ # 1) หรือพยายามที่จะ reweight / มาตรฐานตัวอย่างหลังจากนั้น เช่นเดียวกับ Gung ฉันคิดว่าการสำรวจครั้งใหญ่ส่วนใหญ่ทำอะไรที่ซับซ้อนกว่าตัวอย่างแบบสุ่มง่าย ๆ
Matt Krause

0

มีการโพสต์คำตอบที่ยอดเยี่ยมจำนวนมากแล้ว ฉันขอแนะนำกรอบที่แตกต่างที่ให้การตอบสนองเหมือนกัน แต่สามารถขับสัญชาตญาณเพิ่มเติม

พีพี

พีพี~Bอีเสื้อa(α=1,β=1)พี

พีพีδYδnพี~Bอีเสื้อa(α=1+δY,β=1+δn)

n=δY+δnnqbeta(0.025, n/2, n/2)

n=1067

> qbeta(0.025, 1067/2, 1067/2) [1] 0.470019

ซึ่งเป็นผลลัพธ์ที่เราต้องการ

โดยสรุปผู้ตอบแบบสอบถาม 1,067 คนที่แบ่งระหว่างคำตอบ "ใช่" และ "ไม่" อย่างเท่าเทียมกันจะทำให้เรามั่นใจ 95% ว่าสัดส่วนที่แท้จริงของผู้ตอบแบบสอบถาม "ใช่" อยู่ระหว่าง 47% และ 53%

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.