ทำไมโพลทางการเมืองถึงมีขนาดตัวอย่างขนาดใหญ่เช่นนี้?

32

เมื่อฉันดูข่าวฉันสังเกตเห็นว่าการสำรวจของ Gallup สำหรับสิ่งต่าง ๆ เช่นการเลือกตั้งประธานาธิบดีมีขนาดตัวอย่างมากกว่า 1,000 ตัวอย่าง จากสิ่งที่ฉันจำได้จากสถิติของวิทยาลัยคือขนาดตัวอย่าง 30 เป็นตัวอย่าง "มีขนาดใหญ่มาก" ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง

sampling sample-size power-analysis

— samplesize999
แหล่งที่มา

9

ในที่สุดใครบางคนอยู่ที่นี่เพื่อพูดคุยเกี่ยวกับเสื้อผ้าใหม่ของ Big Data Emperor ใครต้องการผู้ใช้ทวีตเตอร์ 600M ถ้าคุณจะได้รับทุกคำตอบจากขนาดของกลุ่มตัวอย่างสถิติวิทยาลัย 30

— StasK

1

StasK นั่นเป็นเฮฮา

— Aaron Hall

สุดยอดความคิดเห็น @StasK

— Brennan

36

เวย์นได้กล่าวถึงประเด็น "30" เป็นอย่างดีพอ (กฎง่ายๆของฉัน: การกล่าวถึงหมายเลข 30 ที่เกี่ยวกับสถิติน่าจะผิด)

เหตุใดจึงใช้ตัวเลขในบริเวณใกล้เคียง 1,000 ตัว

จำนวนประมาณ 1,000-2,000 มักใช้ในการสำรวจแม้ในกรณีที่มีสัดส่วนอย่างง่าย (" คุณชอบอะไร $<$ $>$ ?")

สิ่งนี้ทำเพื่อให้ได้การประมาณสัดส่วนที่แม่นยำอย่างสมเหตุสมผล

หากสันนิษฐานว่าสุ่มตัวอย่างทวินามความผิดพลาดมาตรฐาน * ของสัดส่วนตัวอย่างจะใหญ่ที่สุดเมื่อสัดส่วนคือ - แต่ขีด จำกัด สูงสุดนั้นยังคงเป็นค่าประมาณที่ดีสำหรับอัตราส่วนระหว่างประมาณ 25% ถึง 75% $\frac{1}{2}$

* "standard error" = "ค่าเบี่ยงเบนมาตรฐานของการแจกแจง"

เป้าหมายร่วมกันคือการประมาณเปอร์เซ็นต์ภายในประมาณของเปอร์เซ็นต์ที่แท้จริงประมาณของเวลา นั่นคือเรียกว่า ' ระยะขอบของข้อผิดพลาด ' $\pm 3\%$ $95\%$ $3\%$

ในข้อผิดพลาดมาตรฐาน 'กรณีที่เลวร้ายที่สุด' ภายใต้การสุ่มตัวอย่างแบบทวินามสิ่งนี้นำไปสู่:

$1.96 \times \sqrt{\frac{1}{2}\cdot(1-\frac{1}{2})/n} \leq 0.03$

$0.98 \times \sqrt{1/n} \leq 0.03$

$\sqrt{n} \geq 0.98/0.03$

$n \geq 1067.11$

... หรือ 'มากกว่า 1,000 บิต'

ดังนั้นถ้าคุณสำรวจคน 1,000 คนโดยการสุ่มจากประชากรที่คุณต้องการอ้างถึงและ 58% ของกลุ่มตัวอย่างสนับสนุนข้อเสนอคุณสามารถมั่นใจได้ว่าสัดส่วนประชากรอยู่ระหว่าง 55% ถึง 61%

(บางครั้งอาจใช้ค่าอื่น ๆ สำหรับระยะขอบของข้อผิดพลาดเช่น 2.5% หากคุณลดระยะขอบของข้อผิดพลาดลงครึ่งหนึ่งขนาดของกลุ่มตัวอย่างจะเพิ่มขึ้นเป็นทวีคูณของ 4)

ในการสำรวจที่ซับซ้อนซึ่งต้องการการประมาณสัดส่วนที่ถูกต้องในประชากรย่อยบางคน (เช่นสัดส่วนของบัณฑิตวิทยาลัยผิวดำจากเท็กซัสที่เห็นด้วยกับข้อเสนอ) ตัวเลขอาจมีขนาดใหญ่พอที่กลุ่มย่อยนั้นมีขนาดหลายร้อยบางที รวมถึงการตอบสนองนับหมื่นโดยรวม

เนื่องจากอาจกลายเป็นสิ่งที่ไม่สามารถทำได้อย่างรวดเร็วจึงเป็นเรื่องปกติที่จะแบ่งประชากรออกเป็นประชากรย่อย (strata) และสุ่มแต่ละตัวอย่างแยกกัน ถึงแม้ว่าคุณจะสามารถจบการสำรวจที่มีขนาดใหญ่มาก

ดูเหมือนว่าขนาดตัวอย่างที่มากกว่า 30 นั้นไม่มีจุดหมายเนื่องจากผลตอบแทนลดลง

มันขึ้นอยู่กับขนาดของเอฟเฟกต์และความแปรปรวนแบบสัมพันธ์ เอฟเฟกต์ต่อความแปรปรวนหมายความว่าคุณอาจต้องการตัวอย่างที่ค่อนข้างใหญ่ในบางสถานการณ์ $\sqrt n$

ฉันตอบคำถามที่นี่ (ฉันคิดว่ามันมาจากวิศวกร) ที่จัดการกับกลุ่มตัวอย่างที่มีขนาดใหญ่มาก (ในบริเวณใกล้เคียงกับหนึ่งล้านถ้าฉันจำได้ถูกต้อง) แต่เขากำลังมองหาเอฟเฟกต์เล็ก ๆ น้อย ๆ

มาดูกันว่ากลุ่มตัวอย่างที่มีขนาดตัวอย่าง 30 เท่าให้อะไรกับเราเมื่อประมาณสัดส่วนตัวอย่าง

ลองนึกภาพเราถามคน 30 คนว่าพวกเขาได้รับการอนุมัติจากที่อยู่สหภาพหรือไม่ (เห็นด้วยอย่างยิ่งเห็นด้วยไม่เห็นด้วยไม่เห็นด้วยอย่างยิ่ง) ลองจินตนาการอีกว่าดอกเบี้ยอยู่ในสัดส่วนที่เห็นด้วยหรือเห็นด้วยอย่างยิ่ง

พูด 11 ข้อจากที่สัมภาษณ์เห็นด้วยและ 5 ข้อตกลงอย่างยิ่งรวมเป็น 16

16/30 ประมาณ 53% ขอบเขตของเราสำหรับสัดส่วนในประชากรคืออะไร (ด้วยช่วงเวลา 95%)

เราสามารถระบุสัดส่วนประชากรลงไปที่ระหว่าง 35% ถึง 71% (ประมาณ) หากสมมติฐานของเรามี

ไม่ใช่ทุกอย่างที่มีประโยชน์

— Glen_b -Reinstate Monica
แหล่งที่มา

+1 คำตอบทั้งหมดนั้นยอดเยี่ยม แต่บรรทัดแรกนั้นคุ้มค่ากับการลงคะแนนด้วยตัวเอง

— Matt Krause

1

และแน่นอนคุณสามารถย้อนกลับการคำนวณและคำนวณระยะขอบของข้อผิดพลาดด้วยตัวอย่าง 30 ...

— Calimo

ย่อหน้าสุดท้ายของคุณคือที่ฉันเชื่อว่ามีการสุ่มตัวอย่างแบบแบ่งชั้น อย่างที่คนอื่นพูดกันการสุ่มตัวอย่างแบบง่าย ๆ จากประชากรผู้มีสิทธิ์ลงคะแนนไม่ได้เกิดขึ้นจริงในระดับประเทศ

— เวย์น

@ เวย์นขอบคุณ; ฉันกลับไปและเพิ่มอีกนิดในตอนท้าย

— Glen_b -Reinstate Monica

2

+1 และฉันก็ชอบความขัดแย้งของกฎนิ้วโป้งของคุณ

— James Stanley

10

กฎของหัวแม่มือนั้นแสดงให้เห็นว่า 30 คะแนนนั้นเพียงพอที่จะสรุปได้ว่าข้อมูลนั้นถูกแจกจ่ายตามปกติ (เช่นมีลักษณะเป็นเส้นโค้งระฆัง) แต่นี่เป็นแนวทางที่ดีที่สุด หากเรื่องนี้ตรวจสอบข้อมูลของคุณ! นี่เป็นการแนะนำว่าคุณต้องการผู้ตอบแบบสอบถามอย่างน้อย 30 คนสำหรับการสำรวจของคุณหากการวิเคราะห์ของคุณขึ้นอยู่กับสมมติฐานเหล่านี้ แต่มีปัจจัยอื่น ๆ ด้วย

ปัจจัยหนึ่งที่สำคัญคือ "ขนาดผลกระทบ" เผ่าพันธุ์ส่วนใหญ่มักจะใกล้เคียงกันดังนั้นกลุ่มตัวอย่างที่มีขนาดใหญ่พอสมควรจึงจำเป็นต้องตรวจสอบความแตกต่างเหล่านี้อย่างน่าเชื่อถือ (หากคุณสนใจที่จะกำหนดขนาดตัวอย่าง "ถูกต้อง" คุณควรพิจารณาการวิเคราะห์พลังงาน ) หากคุณมีตัวแปรสุ่มของ Bernoulli (บางสิ่งที่มีสองผลลัพธ์) นั่นคือประมาณ 50:50 คุณต้องมีการทดลองประมาณ 1,000 ครั้งเพื่อให้ได้ข้อผิดพลาดมาตรฐานลดลงเหลือ 1.5% นั่นอาจแม่นยำพอที่จะคาดการณ์ผลลัพธ์ของการแข่งขัน (การเลือกตั้งประธานาธิบดี 4 ครั้งล่าสุดของสหรัฐอเมริกามีค่าเฉลี่ยอยู่ที่ประมาณ 3.2 เปอร์เซ็นต์) ซึ่งตรงกับการสังเกตของคุณ

ข้อมูลโพลมักจะถูกหั่นและหั่นสี่เหลี่ยมลูกเต๋าในรูปแบบที่แตกต่างกัน: "ผู้สมัครที่มีผู้ชายเป็นเจ้าของปืนมากกว่า 75 คน" หรืออะไรก็ตาม สิ่งนี้ต้องการตัวอย่างที่มีขนาดใหญ่กว่าเนื่องจากผู้ตอบแต่ละคนมีหมวดหมู่เพียงไม่กี่หมวด

การเลือกตั้งประธานาธิบดีบางครั้งอาจ "รวม" กับคำถามสำรวจอื่น ๆ (เช่นเชื้อชาติของรัฐสภา) ด้วย เนื่องจากสิ่งเหล่านี้แตกต่างกันไปในแต่ละรัฐจึงมีข้อมูลการลงคะแนนเสียงแบบ "พิเศษ" บางส่วน

กระจาย Bernoulli มีแจกแจงความน่าจะไม่ต่อเนื่องมีเพียงสองผล: ตัวเลือกที่ 1 ได้รับการแต่งตั้งด้วยความน่าจะในขณะที่ตัวเลือกที่ 2 จะเลือกด้วยความน่าจะเป็น1-P

p

$p$

1 - p

$1-p$

ความแปรปรวนของการกระจาย Bernoulli คือดังนั้นข้อผิดพลาดมาตรฐานของค่าเฉลี่ยเป็น{n}} เสียบ (การเลือกตั้งคือเสมอ) ตั้งค่าข้อผิดพลาดมาตรฐานเป็น 1.5% (0.015) และแก้ไข คุณต้องได้ 1,111 วิชาเพื่อรับ 1.5% SE $p(1-p)$ $\sqrt{\frac{p(1-p)}{n}}$ $p=0.5$

— แมตต์กรอส
แหล่งที่มา

4

+1 อย่างไรก็ตาม "30 คะแนนก็พอที่จะคิดได้ว่าข้อมูลนั้นถูกกระจายตามปกติ" ไม่เป็นความจริง อาจเป็นไปได้ว่าผู้คนเชื่อเช่นนี้ แต่ต้องใช้ข้อมูลจำนวนเท่าใดสำหรับ CLT ในการกระจายการสุ่มตัวอย่างมาบรรจบกันอย่างเพียงพอให้เป็นปกติขึ้นอยู่กับลักษณะของการกระจายข้อมูล (ดูที่นี่ ) แทน 30 (อาจ) ประมาณพอถ้าข้อมูลเป็นปกติอยู่แล้ว แต่ SD ประมาณจากชุดข้อมูลเดียวกัน (cf, การแจกแจงแบบ t)

— gung - Reinstate Monica

@Gung เห็นด้วยทั้งหมด แต่ฉันไม่ต้องการออกไปไกลเกินไป อย่าลังเลที่จะแก้ไขเพิ่มเติมหากคุณคิดว่าควรทำประเด็นนี้ให้ดียิ่งขึ้น

— Matt Krause

8

มีอยู่แล้วบางคำตอบที่ดีสำหรับคำถามนี้มี แต่ฉันต้องการคำตอบว่าทำไมข้อผิดพลาดมาตรฐานคือสิ่งที่มันเป็นเหตุผลที่เราใช้เป็นกรณีที่เลวร้ายและวิธีการที่ข้อผิดพลาดมาตรฐานแตกต่างกันกับn $p = 0.5$ $n$

สมมติว่าเรามีการสำรวจความคิดเห็นของผู้มีสิทธิเลือกตั้งเพียงคนเดียวเราจะเรียกเขาว่าผู้ออกเสียงลงคะแนน 1 และถามว่า "คุณจะลงคะแนนให้พรรคม่วงไหม" เราสามารถเขียนรหัสคำตอบเป็น 1 สำหรับ "ใช่" และ 0 สำหรับ "ไม่" สมมติว่าน่าจะเป็นของ "ใช่" ที่เป็นพีขณะนี้เรามีไบนารีตัวแปรสุ่มซึ่งเป็น 1 ด้วยความน่าจะและ 0 พร้อมด้วยความน่าจะเป็น1-Pเราบอกว่าเป็นตัวแปร Bernouilli กับความน่าจะเป็นของความสำเร็จของซึ่งเราสามารถเขียน(P) ที่คาดหวังหรือหมายถึง $p$ $X_1$ $p$ $1-p$ $X_1$ $p$ $X_1 \sim Bernouilli(p)$ $X_1$ $\mathbb{E}(X_1)=\sum{xP(X_1=x)}$ $x$ $X_1$ . แต่มีเพียงสองผล 0 พร้อมด้วยความน่าจะเป็น 1 และมีความน่าจะดังนั้นผลรวมเป็นเพียง Pหยุดและคิด. สิ่งนี้ดูสมเหตุสมผลอย่างสมบูรณ์ - หากมีโอกาส 30% ของผู้ลงคะแนนเสียง 1 ที่สนับสนุนพรรคม่วงและเราได้กำหนดให้ตัวแปรเป็น 1 ถ้าพวกเขาพูดว่า "ใช่" และ 0 ถ้าพวกเขาพูดว่า "ไม่" เราก็จะ คาดว่าจะเท่ากับ 0.3 โดยเฉลี่ย $1-p$ $p$ $\mathbb{E}(X_1)=0(1-p)+1(p)=p$ $X_1$

ลองคิดว่าเกิดอะไรขึ้นเราตาราง 1ถ้าแล้วและถ้าแล้ว 1ดังนั้นในความเป็นจริงไม่ว่าในกรณีใด เนื่องจากพวกเขาจะเหมือนกันแล้วพวกเขาก็ต้องมีค่าคาดว่าเดียวกันดังนั้น Pนี่ทำให้ฉันได้วิธีง่ายๆในการคำนวณความแปรปรวนของตัวแปร Bernouilli: ฉันใช้ $X_1$ $X_1 = 0$ $X_1^2 = 0$ $X_1 = 1$ $X_1^2 = 1$ $X_1^2 = X_1$ $\mathbb{E}(X_1^2)=p$ และค่าเบี่ยงเบนมาตรฐานคือ $Var(X_1)=\mathbb{E}(X_1^2)-\mathbb{E}(X_1)^2=p - p^2 = p(1-p)$ ) $\sigma_{X_1}=\sqrt{p(1-p)}$

เห็นได้ชัดว่าผมต้องการที่จะพูดคุยกับผู้มีสิทธิเลือกตั้งอื่น ๆ - ช่วยให้เรียกพวกเขามีสิทธิเลือกตั้งที่ 2 ผู้มีสิทธิเลือกตั้งที่ 3 ผ่านไปยังผู้มีสิทธิเลือกตั้งnสมมติว่าพวกเขาทั้งหมดมีความน่าจะเป็นเหมือนกันในการสนับสนุนพรรคสีม่วง ตอนนี้เรามีตัวแปร Bernouilli, , ผ่านไปยังกับแต่ละสำหรับตั้งแต่ 1 ถึงnพวกเขาทั้งหมดมีค่าเฉลี่ยและความแปรปรวนเดียวกัน $n$ $p$ $n$ $X_1$ $X_2$ $X_n$ $X_i \sim Bernoulli(p)$ $i$ $n$ $p$ ) $p(1-p)$

ฉันต้องการที่จะพบว่าหลายคนในกลุ่มตัวอย่างของฉันบอกว่า "ใช่" และจะทำอย่างนั้นฉันก็สามารถเพิ่มขึ้นทุกฉันฉันจะเขียนฉันฉันสามารถคำนวณค่าเฉลี่ยหรือค่าที่คาดหวังของโดยใช้กฎที่หากความคาดหวังเหล่านั้นมีอยู่และขยายไปถึง $X_i$ $X=\sum_{i=1}^{n}X_i$ $X$ $\mathbb{E}(X+Y)=\mathbb{E}(X)+\mathbb{E}(Y)$ )แต่ผมเพิ่มขึ้นของความคาดหวังเหล่านั้นและแต่ละเพื่อให้ฉันได้รับในจำนวนทั้งหมดที่ Pหยุดและคิด. ถ้าฉันสำรวจ 200 คนและแต่ละคนมีโอกาส 30% ที่บอกว่าพวกเขาสนับสนุนพรรคม่วงแน่นอนว่าฉันคาดหวังว่า 0.3 x 200 = 60 คนจะพูดว่า "ใช่" ดังนั้นสูตรดูถูกต้อง หัก "ชัดเจน" เป็นวิธีจัดการกับความแปรปรวน $\mathbb{E}(X_1+X_2+\ldots+X_n)=\mathbb{E}(X_1)+\mathbb{E}(X_2)+\ldots+\mathbb{E}(X_n)$ $n$ $p$ $\mathbb{E}(X)=np$ $np$

มีเป็นกฎที่บอกว่า แต่ฉันสามารถ เพียงใช้มันถ้าตัวแปรสุ่มของฉันมีความเป็นอิสระของแต่ละอื่น ๆ งั้นลองทำสมมุติฐานนั้นและตามตรรกะที่คล้ายกันก่อนที่ฉันจะเห็น

V a r (X_{1} + X_{2} + \dots + X_{n}) = V a r (X_{1}) + V a r (X_{2}) + \dots + V a r (X_{n})

$Var(X_1+X_2+\ldots+X_n)=Var(X_1)+Var(X_2)+\ldots+Var(X_n)$

)

หากตัวแปร

คือผลรวมของ

อิสระทดลอง Bernoulli ด้วยโอกาสที่จะประสบความสำเร็จที่เหมือนกันของ

แล้วเราบอกว่า

มีการกระจายทวินาม

)

เราเพิ่งแสดงให้เห็นว่าค่าเฉลี่ยของการแจกแจงทวินามเช่น

และความแปรปรวนคือ

V a r (X) = n p (1 - p)

$Var(X)=np(1-p)$

X

$X$

n

$n$

p

$p$

X

$X$

X \sim B i n o m i a l (n, p)

$X \sim Binomial(n,p)$

n p

$np$

)

n p (1 - p)

$np(1-p)$

ปัญหาดั้งเดิมของเราคือวิธีประมาณค่าจากตัวอย่าง วิธีที่เหมาะสมในการกำหนดประมาณการของเราคือ nตัวอย่างเช่น 64 จากตัวอย่าง 200 คนของเราพูดว่า "ใช่" เราคาดว่า 64/200 = 0.32 = 32% ของคนบอกว่าพวกเขาสนับสนุนพรรคม่วง คุณจะเห็นว่าคือ "ลดขนาดลง" รุ่นจำนวนรวมของเราใช่ผู้มีสิทธิเลือกตั้งXนั่นหมายความว่ามันยังคงเป็นตัวแปรสุ่ม แต่ไม่เป็นไปตามการแจกแจงทวินามอีกต่อไป เราสามารถหาค่าเฉลี่ยและความแปรปรวนของมันได้เพราะเมื่อเราปรับขนาดตัวแปรสุ่มด้วยค่าคงที่แล้วมันจะปฏิบัติตามกฎต่อไปนี้: $p$ $\hat{p}=X/n$ $\hat{p}$ $X$ $k$ (เพื่อให้เกล็ดเฉลี่ยโดยปัจจัยเดียวกัน ) และ )สังเกตว่าความแปรปรวนจะลดลงตามได้อย่างไร มันสมเหตุสมผลเมื่อคุณรู้ว่าโดยทั่วไปความแปรปรวนจะถูกวัดในหน่วยสี่เหลี่ยมของหน่วยใดก็ตามที่ตัวแปรนั้นวัดใน: ใช้ไม่ได้ที่นี่ แต่ถ้าตัวแปรสุ่มของเรามีความสูงเป็นเซนติเมตรความแปรปรวนจะเป็นซึ่งมีขนาดแตกต่างกัน - หากคุณเพิ่มความยาวเป็นสองเท่าคุณจะเพิ่มพื้นที่สี่เท่า $\mathbb{E}(kX)=k\mathbb{E}(X)$ $k$ $Var(kX)=k^2 Var(X)$ $k^2$ $cm^2$

นี่คือตัวคูณสเกลของเราคือ . นี้จะช่วยให้เรา $\frac{1}{n}$ Pมันเยี่ยมมาก! โดยเฉลี่ยประมาณการของเราเป็นสิ่งที่ "ควร" จะเป็นจริง (หรือประชากร) น่าจะเป็นที่ผู้มีสิทธิเลือกตั้งสุ่มบอกว่าพวกเขาจะลงคะแนนให้พรรคสีม่วง เรากล่าวว่าประมาณการของเราคือเป็นกลาง แต่ในขณะที่มันถูกต้องโดยเฉลี่ยบางครั้งมันจะเล็กเกินไปและบางครั้งก็สูงเกินไป เราสามารถเห็นความผิดพลาดที่อาจเกิดขึ้นจากการดูความแปรปรวน $\mathbb{E}(\hat{p})=\frac{1}{n}\mathbb{E}(X)=\frac{np}{n}=p$ $\hat{p}$ . ค่าเบี่ยงเบนมาตรฐานเป็นราก $Var(\hat{p})=\frac{1}{n^2}Var(X)=\frac{np(1-p)}{n^2}=\frac{p(1-p)}{n}$ และเพราะมันทำให้เราเข้าใจว่าตัวประมาณของเราจะไม่ดีอย่างไร (มันเป็นรูตค่าเฉลี่ยของความคลาดเคลื่อนกำลังสองได้อย่างมีประสิทธิภาพวิธีการคำนวณข้อผิดพลาดเฉลี่ยที่ปฏิบัติต่อข้อผิดพลาดเชิงบวกและเชิงลบ ) มันเป็นเรื่องปกติที่เรียกว่าข้อผิดพลาดมาตรฐาน กฎง่ายๆที่ใช้งานได้ดีสำหรับตัวอย่างขนาดใหญ่และสามารถจัดการกับการใช้ทฤษฎีการ จำกัด ที่มีชื่อเสียงอย่างเข้มงวดมากขึ้นคือส่วนใหญ่ (ประมาณ 95%) การประมาณจะผิดโดยข้อผิดพลาดมาตรฐานน้อยกว่าสองข้อ $\sqrt{\frac{p(1-p)}{n}}$

เนื่องจากปรากฏในส่วนของเศษส่วนค่าที่สูงขึ้นของ - ตัวอย่างที่ใหญ่กว่า - ทำให้ข้อผิดพลาดมาตรฐานมีขนาดเล็กลง นั่นเป็นข่าวที่ดีราวกับว่าฉันต้องการข้อผิดพลาดมาตรฐานขนาดเล็กฉันแค่ทำให้ขนาดตัวอย่างใหญ่พอ ข่าวร้ายคืออยู่ในสแควร์รูทดังนั้นถ้าฉันเพิ่มขนาดตัวอย่างเป็นสี่เท่าฉันจะลดความผิดพลาดมาตรฐานลงครึ่งหนึ่งเท่านั้น ข้อผิดพลาดมาตรฐานขนาดเล็กมากจะเกี่ยวข้องกับตัวอย่างที่มีขนาดใหญ่มากดังนั้นจึงมีราคาแพง มีปัญหาอื่น: หากฉันต้องการกำหนดเป้าหมายข้อผิดพลาดมาตรฐานที่เจาะจงให้พูด 1% แล้วฉันต้องรู้ค่าจะใช้ในการคำนวณของฉัน ฉันอาจใช้ค่าในอดีตหากฉันมีข้อมูลการสำรวจที่ผ่านมา แต่ฉันต้องการเตรียมพร้อมสำหรับกรณีที่เลวร้ายที่สุดที่เป็นไปได้ ค่าใดของ $n$ $n$ $p$ $p$ เป็นปัญหามากที่สุด? กราฟเป็นคำแนะนำ

กราฟของ sqrt (p (1-p))

ที่เลวร้ายที่สุดกรณี (สูงสุด) ข้อผิดพลาดมาตรฐานจะเกิดขึ้นเมื่อ 0.5เพื่อพิสูจน์ว่าฉันสามารถใช้แคลคูลัสได้ แต่พีชคณิตมัธยมบางแห่งจะใช้กลอุบายตราบใดที่ฉันรู้วิธี " เติมสี่เหลี่ยมให้เสร็จ " $p=0.5$

\sqrt{p (1 - p)} = \sqrt{p - p^{2}} = \sqrt{\frac{1}{4} - (p^{2} - p + \frac{1}{4})} = \sqrt{\frac{1}{4} - (p - \frac{1}{2})^{2}}

$\sqrt{p(1-p)}=\sqrt{p-p^2}=\sqrt{\frac{1}{4}-(p^2-p+\frac{1}{4})}=\sqrt{\frac{1}{4}-(p-\frac{1}{2})^2}$

$p-\frac{1}{2}=0$ $p=\frac{1}{2}$

$\sqrt{\frac{0.25}{n}}=\frac{0.5}{\sqrt{n}} < 0.01$ $\sqrt{n} > 50$ $n > 2500$

$p$ $\frac{\sum{X_i}}{n}$

$p=0.5$ $p=0.7$ $p=0.3$ $\sqrt{p(1-p)}$

กราฟขนาดตัวอย่างที่ต้องการสำหรับข้อผิดพลาดมาตรฐานที่ต้องการที่แตกต่างกัน

— สีเงิน
แหล่งที่มา

มาตราส่วน log10 ในแกน y อาจช่วยได้ที่นี่

— EngrStudent - Reinstate Monica

7

กฎ "อย่างน้อย 30" ได้รับการแก้ไขในการโพสต์อีกครั้งในการตรวจสอบข้าม มันเป็นกฎง่ายๆที่ดีที่สุด

เมื่อคุณนึกถึงตัวอย่างที่ควรจะเป็นตัวแทนของผู้คนหลายล้านคนคุณจะต้องมีตัวอย่างที่มีขนาดใหญ่กว่าแค่ 30 คนโดยสังเขป 30 คนไม่สามารถรวมหนึ่งคนจากแต่ละรัฐได้! จากนั้นคิดว่าคุณต้องการเป็นตัวแทนของพรรครีพับลิกันเดโมแครตและที่ปรึกษาอิสระ (อย่างน้อย) และสำหรับแต่ละคนที่คุณต้องการเป็นตัวแทนกลุ่มอายุที่แตกต่างกันสองประเภทและสำหรับกลุ่มรายได้ที่แตกต่างกันสองประเภท

มีเพียง 30 คนที่โทรหาคุณจะพลาดกลุ่มประชากรจำนวนมากที่คุณต้องการเก็บตัวอย่าง

แก้ไข 2: [ฉันได้ลบย่อหน้าที่ abaumann และ StasK คัดค้าน ฉันยังไม่ได้ชักชวน 100% แต่โดยเฉพาะอย่างยิ่งการโต้แย้งของ StasK ที่ฉันไม่เห็นด้วย] ถ้าคน 30 คนได้รับการคัดเลือกอย่างสมบูรณ์แบบสุ่มจากผู้มีสิทธิ์ลงคะแนนที่มีสิทธิ์ทั้งหมดตัวอย่างจะมีเหตุผล แต่มีขนาดเล็กเกินไปที่จะ ให้คุณแยกแยะว่าคำตอบสำหรับคำถามของคุณจริงหรือเท็จ (ในบรรดาผู้มีสิทธิ์ลงคะแนนที่มีสิทธิ์ทั้งหมด) StasK อธิบายว่ามันจะแย่แค่ไหนในความคิดเห็นที่สามของเขาด้านล่าง

แก้ไข: ในการตอบกลับความคิดเห็นของ sampleize999 มีวิธีการอย่างเป็นทางการในการพิจารณาว่ามีขนาดใหญ่พอเรียกว่า " การวิเคราะห์พลังงาน " ซึ่งอธิบายไว้ที่นี่ด้วย ความคิดเห็นของ abaumann แสดงให้เห็นว่ามีการแลกเปลี่ยนระหว่างความสามารถของคุณในการแยกความแตกต่างและปริมาณของข้อมูลที่คุณต้องใช้เพื่อการปรับปรุงจำนวนหนึ่ง ในขณะที่เขาแสดงให้เห็นว่ามีรากที่สองในการคำนวณซึ่งหมายถึงประโยชน์ (ในแง่ของพลังงานที่เพิ่มขึ้น) เติบโตช้าลงหรือมากขึ้นหรือต้นทุน (ในแง่ของจำนวนตัวอย่างที่คุณต้องการ) เติบโตอย่างรวดเร็วมากขึ้นดังนั้นคุณต้องการ ตัวอย่างเพียงพอ แต่ไม่มาก

— เวย์น
แหล่งที่มา

2

"จุดตัวอย่างทั้งหมด - ความถูกต้องทั้งหมด - คือมันสะท้อนถึงประชากรไม่ใช่แบบสุ่ม" นั่นเป็นความผิดพลาดอย่างชัดแจ้ง! ความถูกต้อง (ในแง่ของลักษณะทั่วไป) เกิดจากตัวอักษรแบบสุ่มของขั้นตอนการสุ่มตัวอย่าง กรณีนี้ค่อนข้างเป็นเพราะคุณสนใจที่จะมีระยะขอบที่น้อยมากคุณต้องมีการประมาณที่แม่นยำโดยจำเป็นต้องมีกลุ่มตัวอย่างที่มีขนาดใหญ่

— abaumann

3

@ บาวมันน์: เท่าที่ฉันเข้าใจในสิ่งต่าง ๆ ไม่มีเวทมนตร์ในการสุ่มตัวอย่าง: มันเป็นวิธีที่มีวัตถุประสงค์มากที่สุดที่เรามีในการสร้างตัวอย่างที่สะท้อนถึงประชากร นั่นเป็นเหตุผลที่เราอาจใช้การสุ่มภายในชั้นหรือใช้การแบ่งชั้นและน้ำหนักเพื่อพยายามชดเชยการสุ่มที่ไม่มากนัก

— เวย์น

2

samplesize: สิ่งนี้มีน้อยหรือไม่มีส่วนเกี่ยวข้องกับการเป็น "ผู้เชี่ยวชาญ" ตัวอย่างเช่นผู้สมัครชิงตำแหน่งประธานาธิบดีสหรัฐเรียกใช้ "การติดตามแบบสำรวจ" ทุกสัปดาห์และทุกวันในระหว่างการรณรงค์และสำรวจเพียง 200-300 คนเท่านั้น ขนาดตัวอย่างเหล่านี้ให้ความสมดุลของค่าใช้จ่ายและข้อมูลที่เพียงพอ ในอีกขั้นหนึ่งการศึกษาที่เกี่ยวข้องกับสุขภาพอย่าง NHANES นั้นลงทะเบียนผู้คนหลายสิบหรือหลายแสนคนเพราะมันเป็นสิ่งที่จำเป็นในการผลิตข้อมูลที่สามารถนำไปใช้งานได้ซึ่งมีมูลค่าสูงเช่นนี้ ในทั้งสองกรณีผู้เชี่ยวชาญกำลังพิจารณาขนาดตัวอย่าง

— whuber

2

ในทางเทคนิคการวางนัยทั่วไปจะใช้ได้ถ้าตัวอย่างเป็นตัวแทนของประชากร แนวคิดคือการมีกลุ่มตัวอย่างแบบสุ่มรับรองว่ากลุ่มตัวอย่างจะเป็นตัวแทน แต่นี่เป็นเรื่องยาก (ไม่จำเป็นว่าจะเป็นไปไม่ได้) ที่จะบรรลุถ้ากลุ่มตัวอย่างนั้นไม่ได้สุ่ม FWIW ไม่มีการสำรวจความคิดเห็นใช้การสุ่มตัวอย่างแบบง่าย

— gung - Reinstate Monica

1

@sashkello มีพื้นกลาง: หนึ่งสามารถใช้ตัวอย่างแบบแบ่งชั้น (โดยหลักตัวเลือกของคุณ # 1) หรือพยายามที่จะ reweight / มาตรฐานตัวอย่างหลังจากนั้น เช่นเดียวกับ Gung ฉันคิดว่าการสำรวจครั้งใหญ่ส่วนใหญ่ทำอะไรที่ซับซ้อนกว่าตัวอย่างแบบสุ่มง่าย ๆ

— Matt Krause

0

มีการโพสต์คำตอบที่ยอดเยี่ยมจำนวนมากแล้ว ฉันขอแนะนำกรอบที่แตกต่างที่ให้การตอบสนองเหมือนกัน แต่สามารถขับสัญชาตญาณเพิ่มเติม

$p$ $p$

$p$ $p \sim Beta(\alpha=1, \beta=1)$ $p$

$p$ $p$ $\delta_y$ $\delta_n$ $p \sim Beta(\alpha=1+\delta_y, \beta=1+\delta_n)$

$n=\delta_y+\delta_n$ $n$ qbeta(0.025, n/2, n/2)

$n=1067$

> qbeta(0.025, 1067/2, 1067/2) [1] 0.470019

ซึ่งเป็นผลลัพธ์ที่เราต้องการ

โดยสรุปผู้ตอบแบบสอบถาม 1,067 คนที่แบ่งระหว่างคำตอบ "ใช่" และ "ไม่" อย่างเท่าเทียมกันจะทำให้เรามั่นใจ 95% ว่าสัดส่วนที่แท้จริงของผู้ตอบแบบสอบถาม "ใช่" อยู่ระหว่าง 47% และ 53%

— mnmn
แหล่งที่มา