สมมติว่าคุณต้องการทราบว่าจะมีคนลงคะแนนให้กับผู้สมัครคนใดเป็นเปอร์เซ็นต์ (เช่นโปรดทราบว่าตามนิยามอยู่ระหว่าง 0 ถึง 100) คุณลิ้มลองผู้มีสิทธิเลือกตั้งที่สุ่มจะหาวิธีที่พวกเขาจะออกเสียงลงคะแนนและการสำรวจของคุณเหล่านี้ผู้มีสิทธิเลือกตั้งจะบอกคุณว่าร้อยละคือพีดังนั้นคุณต้องการสร้างช่วงความมั่นใจสำหรับเปอร์เซ็นต์ที่แท้จริงเธN N Pππยังไม่มีข้อความยังไม่มีข้อความพี
หากคุณสมมติว่าถูกแจกจ่ายตามปกติ (ข้อสันนิษฐานที่อาจหรืออาจไม่เป็นธรรมขึ้นอยู่กับว่า 'ใหญ่'คืออะไร) ดังนั้นช่วงความเชื่อมั่นของคุณสำหรับจะอยู่ในรูปแบบต่อไปนี้:
โดยที่เป็นค่าคงที่ซึ่งขึ้นอยู่กับขอบเขตของความมั่นใจที่คุณต้องการ (เช่น 95% หรือ 99% เป็นต้น)N π C I = [ p - k ∗ s d ( p ) , p + k ∗ s d ( p ) ] kพียังไม่มีข้อความπ
คผม= [ p - k ∗ s d( p ) , p + k ∗ s d ( p ) ]
k
จากมุมมองการสำรวจคุณต้องการความกว้างของช่วงความมั่นใจของคุณเป็น 'ต่ำ' โดยทั่วไปแล้วการสำรวจความคิดเห็นจะทำงานกับขอบของข้อผิดพลาดซึ่งโดยทั่วไปแล้วครึ่งหนึ่งของ CI ในคำอื่น ๆ(P) MoE = k ∗ s d( p )
นี่คือวิธีที่เราจะไปเกี่ยวกับการคำนวณ : ตามคำนิยามโดยที่ถ้าผู้มีสิทธิเลือกตั้งลงคะแนนให้ผู้สมัครและอย่างอื่นp = ∑ X i / N X i = 1 i 0s d( p )p = ∑ Xผม/ NXผม= 1ผม0
เนื่องจากเราสุ่มตัวอย่างผู้ลงคะแนนด้วยการสุ่มเราสามารถสันนิษฐานได้ว่าเป็นตัวแปรสุ่ม iid Bernoulli ดังนั้น
ดังนั้น
ทีนี้เพื่อประเมินระยะขอบของความผิดพลาดที่เราต้องรู้ซึ่งเราไม่ทราบแน่ชัด แต่การตรวจสอบของเศษแสดงให้เห็นว่าเลวร้ายที่สุด 'ประมาณการในแง่ที่ว่าเราได้รับ 'ใหญ่ที่สุด' เบี่ยงเบนมาตรฐานคือเมื่อ0.5 ดังนั้นค่าเบี่ยงเบนมาตรฐานที่แย่ที่สุดที่เป็นไปได้คือ:
Xผม
Va r ( P) = V( ∑ Xผมยังไม่มีข้อความ) = ∑ V( Xผม)ยังไม่มีข้อความ2= Nπ( 1 - π)ยังไม่มีข้อความ2= π( 1 - π)ยังไม่มีข้อความ.
s d( p ) = π∗ ( 1 - π)ยังไม่มีข้อความ---------√
πs d( p )π= 0.5s d( p ) = 0.5 ∗ 0.5 / N---------√= 0.5 / N--√
ดังนั้นคุณจะเห็นว่าระยะขอบของข้อผิดพลาดจะลดลงอย่างมากด้วยดังนั้นคุณไม่จำเป็นต้องมีตัวอย่างขนาดใหญ่มากเพื่อลดระยะขอบของข้อผิดพลาดหรือกล่าวอีกนัยหนึ่งว่าไม่จำเป็นต้องมีขนาดใหญ่มากสำหรับคุณ
ยังไม่มีข้อความยังไม่มีข้อความ
ตัวอย่างเช่นสำหรับช่วงความมั่นใจ 95% (เช่น ) และช่วงความเชื่อมั่นคือ:
เมื่อเราเพิ่มค่าใช้จ่ายในการเลือกตั้งขึ้นไปเป็นเส้นตรง แต่กำไรเพิ่มขึ้นลงแบบทวีคูณ นั่นคือเหตุผลที่ว่าทำไม pollsters มักฝาที่ 1000 ในฐานะที่จะช่วยให้พวกเขามีข้อผิดพลาดที่เหมาะสมของอัตรากำไรขั้นต้นภายใต้สมมติฐานที่เลวร้ายที่สุดของ\% k = 1.96ยังไม่มีข้อความ= 1,000
[ p - 1.96 0.51000----√, p + 1.96 0.5 1000----√] =[p-0.03,p+0.03]
ยังไม่มีข้อความยังไม่มีข้อความπ= 50 %