เหตุใดข้อผิดพลาดมาตรฐานของสัดส่วนสำหรับ n ที่กำหนดซึ่งใหญ่ที่สุดสำหรับ 0.5


10

ความคลาดเคลื่อนมาตรฐานของสัดส่วนจะมากที่สุดเท่าที่จะเป็นไปได้สำหรับ N ที่กำหนดเมื่อสัดส่วนของปัญหาเท่ากับ 0.5 และยิ่งเล็กลงยิ่งอัตราส่วนต่อจาก 0.5 ฉันเห็นได้ว่าเหตุใดจึงเป็นเช่นนี้เมื่อฉันดูสมการสำหรับความคลาดเคลื่อนมาตรฐานของสัดส่วน แต่ฉันไม่สามารถอธิบายสิ่งนี้ได้อีก

มีคำอธิบายนอกเหนือจากคุณสมบัติทางคณิตศาสตร์ของสูตรหรือไม่? ถ้าเป็นเช่นนั้นเหตุใดจึงมีความไม่แน่นอนน้อยลงในสัดส่วนที่ประมาณไว้ (สำหรับ N ที่ระบุ) เมื่อใกล้ถึง 0 หรือ 1

คำตอบ:


8

ความเป็นมาและศัพท์เฉพาะ

เพื่อให้ชัดเจนอย่างสมบูรณ์ในสิ่งที่เรากำลังคุยกันลองสร้างแนวคิดและคำศัพท์ แบบจำลองที่ดีสำหรับสัดส่วนคือโกศไบนารี: ประกอบด้วยลูกบอลที่มีสีเงิน ("สำเร็จ") หรือสีแดงม่วง ("ล้มเหลว") สัดส่วนของลูกบอลเงินในโกศคือ (แต่นี่ไม่ใช่ "สัดส่วน" ที่เราจะพูดถึง) p

โกศนี้มีวิธีการรูปแบบที่ทดลอง Bernoulli เพื่อให้ได้การรับรู้อย่างละเอียดให้ผสมลูกกลมและดึงออกมาอย่างแผ่วเบาโดยสังเกตสีของมัน หากต้องการรับการรับรู้เพิ่มเติมขั้นแรกให้สร้างกล่องขึ้นใหม่โดยส่งลูกบอลที่ถูกดึงออกมาจากนั้นทำซ้ำขั้นตอนตามจำนวนที่กำหนดไว้ล่วงหน้า ลำดับของ X มันเป็นตัวแปรสุ่มที่คุณสมบัติถูกกำหนดโดยและอย่างสมบูรณ์ การกระจายตัวของเรียกว่าทวินามการจัดจำหน่าย (การทดลองหรือ "ตัวอย่าง") สัดส่วนเป็นอัตราส่วนnXnpX(n,p)X/n.

รูป

ตัวเลขเหล่านี้ barplots ของการกระจายความน่าจะเป็นสำหรับสัดส่วนทวินามต่างๆ n สิ่งสำคัญที่สุดคือรูปแบบที่สอดคล้องกันโดยไม่คำนึงถึงซึ่งการแจกแจงจะแคบลง (และแท่งสูงกว่าตามลำดับ) เมื่อเคลื่อนที่จากลงX/nnp1/2

ค่าเบี่ยงเบนมาตรฐานของคือข้อผิดพลาดมาตรฐานของสัดส่วนที่กล่าวถึงในคำถาม สำหรับการใดก็ตามปริมาณนี้จะขึ้นอยู่เฉพาะในหน้าขอเรียกว่า(P) โดยการเปลี่ยนบทบาทของลูก - เรียกคนที่เงิน "ความล้มเหลว" และคนสีแดงม่วง "ความสำเร็จ" - มันเป็นเรื่องง่ายที่จะเห็นว่าP) ดังนั้นสถานการณ์ที่นั่นคือ - ต้องเป็นพิเศษ คำถามเกี่ยวข้องกับวิธีที่แตกต่างกันอย่างไรเมื่อเคลื่อนห่างจากไปสู่ค่าสุดขีดเช่นX/nnpse(p)se(p)=se(1p)p=1pp=1/2se(p)p1/20.

ความรู้และความเข้าใจ

เพราะทุกคนได้รับการแสดงตัวเลขเช่นนี้ในช่วงต้นของการศึกษาของพวกเขาทุกคน "รู้" ความกว้างของแปลง - ซึ่งจะวัดจากลดลง --must เป็นย้ายออกไปจาก1/2แต่ความรู้นั้นเป็นเพียงประสบการณ์จริง ๆในขณะที่คำถามนั้นต้องการความเข้าใจที่ลึกซึ้งยิ่งขึ้น ความเข้าใจดังกล่าวนั้นมาจากการวิเคราะห์อย่างระมัดระวังเกี่ยวกับการแจกแจงแบบทวินามเช่น Abraham de Moivre เมื่อประมาณ 300 ปีที่แล้ว (พวกเขาคล้ายในจิตวิญญาณให้กับผู้ที่ผมนำเสนอในการอภิปรายของทฤษฎีขีด จำกัด กลาง .) ฉันคิดว่าการพิจารณาบางค่อนข้างง่ายอาจพอเพียงที่จะทำให้จุดที่ความกว้างจะต้องกว้างใกล้2/1se(p)p1/2p=1/2

การวิเคราะห์ที่ใช้งานง่ายอย่างง่าย

เป็นที่ชัดเจนว่าเราควรคาดหวังสัดส่วนของความสำเร็จในการทดลองจะใกล้เคียงกับพีข้อผิดพลาดมาตรฐานเกี่ยวข้องกับระยะห่างจากการคาดการณ์นั้นเราอาจคิดว่าผลลัพธ์ที่แท้จริงจะสมเหตุสมผล สมมุติว่าถ้าไม่มีการสูญเสียความสามารถทั่วไปนั้นอยู่ระหว่างถึงแล้วจะต้องเพิ่มจากอย่างไร โดยทั่วไปแล้วรอบของลูกบอลที่วาดในการทดลองคือเงินและ (ดังนั้น) รอบคือสีแดงม่วง ในการรับลูกบอลสีเงินเพิ่มเติมบางส่วนของpX/np01/2X/nppn(1p)npnผลลัพธ์บานเย็นต้องแตกต่างกัน โอกาสนั้นมีโอกาสที่จะดำเนินการในลักษณะนี้ได้อย่างไร คำตอบที่ชัดเจนคือเมื่อมีขนาดเล็กมันไม่น่าเป็นไปได้มากที่เราจะวาดลูกบอลสีเงิน ดังนั้นโอกาสของเราในการวาดลูกบอลสีเงินแทนที่จะเป็นสีแดงม่วงนั้นอยู่ในระดับต่ำเสมอ เราสมควรอาจหวังว่าโชคดีที่บริสุทธิ์เป็นสัดส่วนของผลสีแดงม่วงอาจมีความแตกต่างกัน แต่ดูเหมือนว่าไม่น่าที่อื่น ๆ อีกมากมายกว่าว่าจะมีการเปลี่ยนแปลง ดังนั้นจึงเป็นไปได้ว่าจะไม่แตกต่างกันไปมากขึ้นกว่า n เท่าจะไม่แตกต่างกันไปมากขึ้นกว่าP)ppXp×(1p)nX/np(1p)n/n=p(1p)

ข้อไขเค้าความเรื่อง

ดังนั้นการรวมกันมายากลจะปรากฏขึ้น p(1p) นี้แทบ settles คำถาม: เห็นได้ชัดนี้ยอดปริมาณที่และลดลงเป็นศูนย์ที่หรือ 1 มันให้เหตุผลเชิงสัญชาตญาณและเชิงปริมาณสำหรับการยืนยันว่า "สิ่งหนึ่งที่มากเกินกว่าที่อื่น" หรือความพยายามอื่น ๆ เพื่ออธิบายสิ่งที่เรารู้p=1/2p=0p=1

อย่างไรก็ตามไม่มากค่าที่ถูกต้องมันเป็นเพียงการชี้ทางบอกให้เราทราบว่าปริมาณที่ควรจะมีความสำคัญสำหรับการประเมินการแพร่กระจายของXเราได้เพิกเฉยต่อความจริงที่ว่าโชคก็มีแนวโน้มที่จะต่อต้านเราเช่นเดียวกับลูกบอลสีแดงม่วงบางส่วนที่อาจเป็นเงินได้ลูกบอลสีเงินบางส่วนอาจเป็นสีแดงม่วง การบัญชีสำหรับความเป็นไปได้ทั้งหมดอย่างเข้มงวดอาจซับซ้อน แต่ผลที่สุดคือแทนที่จะใช้เป็นขีด จำกัด ที่สมเหตุสมผลว่าจะเบี่ยงเบนจากความคาดหวังของไปเท่าใดเพื่อให้ได้ผลลัพธ์ที่เป็นไปได้ทั้งหมดที่เรามี การใช้สแควร์รูทp(1p)Xp(1p)nXpn p(1p)n. (สำหรับบัญชีที่มีความระมัดระวังมากขึ้นว่าทำไมโปรดไปที่ ( https://stats.stackexchange.com/a/3904 ) การหารด้วยเราเรียนรู้ว่าการสุ่มสัดส่วนสัดส่วนนั้นควรอยู่ในลำดับของซึ่งเป็นข้อผิดพลาดมาตรฐานของ nnX/np(1p)n/n=p(1p)n,X/n


3

พิจารณาฟังก์ชัน p (1-p) สำหรับ 0 <= p <= 1 การใช้แคลคูลัสคุณจะเห็นว่าที่ p = 1/2 มันคือ 1/4 ซึ่งเป็นค่าสูงสุด หากคุณเห็นว่านี่เป็นทวินามที่เกี่ยวข้องกับค่าเบี่ยงเบนมาตรฐานของการประมาณสัดส่วนซึ่งก็คือ sqrt (p (1-p) / n) ดังนั้น p = 1/2 คือค่าสูงสุด เมื่อ p = 1 หรือ 0 ข้อผิดพลาดมาตรฐานคือ 0 เพราะคุณจะได้รับ 1 หรือ 0 ทั้งหมดตามลำดับ ดังนั้นเมื่อคุณเข้าใกล้ 0 หรือ 1 ข้อโต้แย้งต่อเนื่องบอกว่าข้อผิดพลาดมาตรฐานเข้าหา 0 เมื่อ p เข้าใกล้ 0 หรือ 1 ในความเป็นจริงมันลดความซ้ำซ้อนเมื่อ p เข้าใกล้ 0 หรือ 1 สำหรับขนาดใหญ่ n สัดส่วนที่ประมาณควรใกล้เคียงกับของจริง สัดส่วน.


3
OP ได้กล่าวไว้แล้วว่า "ฉันเห็นได้ว่าทำไมจึงเป็นเช่นนี้เมื่อฉันดูสมการสำหรับความคลาดเคลื่อนมาตรฐานของสัดส่วน" ดังนั้นผมเชื่อว่าพวกเขาจะขอไม่ได้สำหรับการวิเคราะห์ของสูตรแต่สำหรับความเข้าใจที่ลึกซึ้งว่าทำไมสูตร - สิ่งที่มันอาจจะเป็น - จริงๆควรจะได้รับการขยายที่2/1 p(1p)p=1/2
whuber

1
@ เมื่อฉันตอบวิธีที่ฉันทำเพราะฉันเห็นว่าสูตรนั้นเป็นพื้นฐานของความเข้าใจว่าทำไมความแปรปรวนจึงใหญ่ที่สุดที่ p = 1/2 และเล็กมากเมื่อ p อยู่ใกล้ 0 หรือ 1 บางทีอาจจะเป็นการดีที่สุดถ้าจะพูดว่า ไม่มีคำอธิบายที่สมบูรณ์ไร้สูตร
Michael R. Chernick

1

การกระจายแบบทวินามมีแนวโน้มที่จะสมมาตรอย่างคร่าว ๆ (สำหรับขนาดใหญ่มันเป็นเรื่องปกติ )n

เนื่องจากอัตราส่วนจะต้องอยู่ระหว่าง 0 ถึง 1 ความไม่แน่นอนจะถูก จำกัด โดยขอบเขตเหล่านี้ ยกเว้นว่าค่าเฉลี่ยอยู่ตรงกลางขอบเขตหนึ่งในขอบเขตเหล่านี้จะถูก จำกัด มากกว่าอีกสัดส่วนหนึ่ง

สำหรับสมมาตรโค้ง unimodal ระฆังศูนย์กลางที่เพื่อให้พอดีกับช่วงเวลาที่หน่วยครึ่งความกว้างของมันจะต้องน้อยกว่า\,] pmin[p,1p]


ใช่ - แต่ข้อ จำกัด อื่น ๆ จะมีข้อ จำกัด น้อยลง! ทำไมเอฟเฟกต์ทั้งสองจึงไม่ยกเลิก?
whuber

@ เมื่อฉันถูกพิจารณาจากความสมมาตร (เช่นในกรณี "large " แบบง่ายเส้นโค้งรูประฆังแบบสมมาตรจะต้องพอดีกับช่วงเวลาดังนั้นความกว้างครึ่งถูก จำกัด โดยด้านที่เข้มงวดมากขึ้น )nmin[p,1p]
GeoMatt22
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.