ความเป็นมาและศัพท์เฉพาะ
เพื่อให้ชัดเจนอย่างสมบูรณ์ในสิ่งที่เรากำลังคุยกันลองสร้างแนวคิดและคำศัพท์ แบบจำลองที่ดีสำหรับสัดส่วนคือโกศไบนารี: ประกอบด้วยลูกบอลที่มีสีเงิน ("สำเร็จ") หรือสีแดงม่วง ("ล้มเหลว") สัดส่วนของลูกบอลเงินในโกศคือ (แต่นี่ไม่ใช่ "สัดส่วน" ที่เราจะพูดถึง) p
โกศนี้มีวิธีการรูปแบบที่ทดลอง Bernoulli เพื่อให้ได้การรับรู้อย่างละเอียดให้ผสมลูกกลมและดึงออกมาอย่างแผ่วเบาโดยสังเกตสีของมัน หากต้องการรับการรับรู้เพิ่มเติมขั้นแรกให้สร้างกล่องขึ้นใหม่โดยส่งลูกบอลที่ถูกดึงออกมาจากนั้นทำซ้ำขั้นตอนตามจำนวนที่กำหนดไว้ล่วงหน้า ลำดับของ X มันเป็นตัวแปรสุ่มที่คุณสมบัติถูกกำหนดโดยและอย่างสมบูรณ์ การกระจายตัวของเรียกว่าทวินามการจัดจำหน่าย (การทดลองหรือ "ตัวอย่าง") สัดส่วนเป็นอัตราส่วนnXnpX(n,p)X/n.
ตัวเลขเหล่านี้ barplots ของการกระจายความน่าจะเป็นสำหรับสัดส่วนทวินามต่างๆ n สิ่งสำคัญที่สุดคือรูปแบบที่สอดคล้องกันโดยไม่คำนึงถึงซึ่งการแจกแจงจะแคบลง (และแท่งสูงกว่าตามลำดับ) เมื่อเคลื่อนที่จากลงX/nnp1/2
ค่าเบี่ยงเบนมาตรฐานของคือข้อผิดพลาดมาตรฐานของสัดส่วนที่กล่าวถึงในคำถาม สำหรับการใดก็ตามปริมาณนี้จะขึ้นอยู่เฉพาะในหน้าขอเรียกว่า(P) โดยการเปลี่ยนบทบาทของลูก - เรียกคนที่เงิน "ความล้มเหลว" และคนสีแดงม่วง "ความสำเร็จ" - มันเป็นเรื่องง่ายที่จะเห็นว่าP) ดังนั้นสถานการณ์ที่นั่นคือ - ต้องเป็นพิเศษ คำถามเกี่ยวข้องกับวิธีที่แตกต่างกันอย่างไรเมื่อเคลื่อนห่างจากไปสู่ค่าสุดขีดเช่นX/nnpse(p)se(p)=se(1−p)p=1−pp=1/2se(p)p1/20.
ความรู้และความเข้าใจ
เพราะทุกคนได้รับการแสดงตัวเลขเช่นนี้ในช่วงต้นของการศึกษาของพวกเขาทุกคน "รู้" ความกว้างของแปลง - ซึ่งจะวัดจากลดลง --must เป็นย้ายออกไปจาก1/2แต่ความรู้นั้นเป็นเพียงประสบการณ์จริง ๆในขณะที่คำถามนั้นต้องการความเข้าใจที่ลึกซึ้งยิ่งขึ้น ความเข้าใจดังกล่าวนั้นมาจากการวิเคราะห์อย่างระมัดระวังเกี่ยวกับการแจกแจงแบบทวินามเช่น Abraham de Moivre เมื่อประมาณ 300 ปีที่แล้ว (พวกเขาคล้ายในจิตวิญญาณให้กับผู้ที่ผมนำเสนอในการอภิปรายของทฤษฎีขีด จำกัด กลาง .) ฉันคิดว่าการพิจารณาบางค่อนข้างง่ายอาจพอเพียงที่จะทำให้จุดที่ความกว้างจะต้องกว้างใกล้2/1se(p)p1/2p=1/2
การวิเคราะห์ที่ใช้งานง่ายอย่างง่าย
เป็นที่ชัดเจนว่าเราควรคาดหวังสัดส่วนของความสำเร็จในการทดลองจะใกล้เคียงกับพีข้อผิดพลาดมาตรฐานเกี่ยวข้องกับระยะห่างจากการคาดการณ์นั้นเราอาจคิดว่าผลลัพธ์ที่แท้จริงจะสมเหตุสมผล สมมุติว่าถ้าไม่มีการสูญเสียความสามารถทั่วไปนั้นอยู่ระหว่างถึงแล้วจะต้องเพิ่มจากอย่างไร โดยทั่วไปแล้วรอบของลูกบอลที่วาดในการทดลองคือเงินและ (ดังนั้น) รอบคือสีแดงม่วง ในการรับลูกบอลสีเงินเพิ่มเติมบางส่วนของpX/np01/2X/nppn(1−p)npnผลลัพธ์บานเย็นต้องแตกต่างกัน โอกาสนั้นมีโอกาสที่จะดำเนินการในลักษณะนี้ได้อย่างไร คำตอบที่ชัดเจนคือเมื่อมีขนาดเล็กมันไม่น่าเป็นไปได้มากที่เราจะวาดลูกบอลสีเงิน ดังนั้นโอกาสของเราในการวาดลูกบอลสีเงินแทนที่จะเป็นสีแดงม่วงนั้นอยู่ในระดับต่ำเสมอ เราสมควรอาจหวังว่าโชคดีที่บริสุทธิ์เป็นสัดส่วนของผลสีแดงม่วงอาจมีความแตกต่างกัน แต่ดูเหมือนว่าไม่น่าที่อื่น ๆ อีกมากมายกว่าว่าจะมีการเปลี่ยนแปลง ดังนั้นจึงเป็นไปได้ว่าจะไม่แตกต่างกันไปมากขึ้นกว่า n เท่าจะไม่แตกต่างกันไปมากขึ้นกว่าP)ppXp×(1−p)nX/np(1−p)n/n=p(1−p)
ข้อไขเค้าความเรื่อง
ดังนั้นการรวมกันมายากลจะปรากฏขึ้น p(1−p) นี้แทบ settles คำถาม: เห็นได้ชัดนี้ยอดปริมาณที่และลดลงเป็นศูนย์ที่หรือ 1 มันให้เหตุผลเชิงสัญชาตญาณและเชิงปริมาณสำหรับการยืนยันว่า "สิ่งหนึ่งที่มากเกินกว่าที่อื่น" หรือความพยายามอื่น ๆ เพื่ออธิบายสิ่งที่เรารู้p=1/2p=0p=1
อย่างไรก็ตามไม่มากค่าที่ถูกต้องมันเป็นเพียงการชี้ทางบอกให้เราทราบว่าปริมาณที่ควรจะมีความสำคัญสำหรับการประเมินการแพร่กระจายของXเราได้เพิกเฉยต่อความจริงที่ว่าโชคก็มีแนวโน้มที่จะต่อต้านเราเช่นเดียวกับลูกบอลสีแดงม่วงบางส่วนที่อาจเป็นเงินได้ลูกบอลสีเงินบางส่วนอาจเป็นสีแดงม่วง การบัญชีสำหรับความเป็นไปได้ทั้งหมดอย่างเข้มงวดอาจซับซ้อน แต่ผลที่สุดคือแทนที่จะใช้เป็นขีด จำกัด ที่สมเหตุสมผลว่าจะเบี่ยงเบนจากความคาดหวังของไปเท่าใดเพื่อให้ได้ผลลัพธ์ที่เป็นไปได้ทั้งหมดที่เรามี การใช้สแควร์รูทp(1−p)Xp(1−p)nXpn p(1−p)n−−−−−−−−√. (สำหรับบัญชีที่มีความระมัดระวังมากขึ้นว่าทำไมโปรดไปที่ ( https://stats.stackexchange.com/a/3904 ) การหารด้วยเราเรียนรู้ว่าการสุ่มสัดส่วนสัดส่วนนั้นควรอยู่ในลำดับของซึ่งเป็นข้อผิดพลาดมาตรฐานของ nnX/np(1−p)n−−−−−−−−√/n=p(1−p)n−−−−−√,X/n