มีคำอธิบายที่เข้าใจง่ายสำหรับทฤษฎีบทขีด จำกัด กลางคืออะไร?


144

ในบริบทที่แตกต่างกันเราเรียกใช้ทฤษฎีขีด จำกัด กลางเพื่อพิสูจน์ว่าวิธีการทางสถิติใดก็ตามที่เราต้องการนำมาใช้ (เช่นประมาณการแจกแจงทวินามโดยการแจกแจงแบบปกติ) ฉันเข้าใจรายละเอียดทางเทคนิคว่าทำไมทฤษฎีบทถึงเป็นจริง แต่ตอนนี้เพิ่งเกิดขึ้นกับฉันที่ฉันไม่เข้าใจสัญชาตญาณเบื้องหลังทฤษฎีขีด จำกัด กลาง

ดังนั้นสัญชาตญาณที่อยู่เบื้องหลังทฤษฎีบทขีด จำกัด กลางคืออะไร?

คำอธิบายของคนธรรมดาจะเหมาะ หากต้องการรายละเอียดทางเทคนิคโปรดสันนิษฐานว่าฉันเข้าใจแนวคิดของ pdf, cdf, ตัวแปรสุ่ม ฯลฯ แต่ไม่มีความรู้เกี่ยวกับแนวคิดคอนเวอร์เจนซ์ฟังก์ชั่นลักษณะหรือสิ่งใดที่เกี่ยวข้องกับทฤษฎีการวัด


8
คำถามที่ดีแม้ว่าปฏิกิริยาของฉันในทันที แต่ได้รับการสนับสนุนจากประสบการณ์ที่ จำกัด ของฉันในการสอนเรื่องนี้คือ CLT ไม่ได้เป็นที่เข้าใจได้ง่ายสำหรับคนส่วนใหญ่ ถ้ามีอะไรมันตอบโต้ได้ง่าย!
onestop

2
@onestop สาธุ! การจ้องมองที่การแจกแจงทวินามด้วยp = 1/2 เมื่อ n เพิ่มขึ้นแสดงว่า CLT ซ่อนอยู่ - แต่สัญชาตญาณของการหลบหนีมันได้หลบหนีฉันอยู่เสมอ
ronaf

2
คำถามที่คล้ายกันกับแนวคิดที่ดีบางอย่าง: stats.stackexchange.com/questions/643/…

1
ไม่ใช่คำอธิบาย แต่การจำลองนี้สามารถช่วยให้เข้าใจได้
David Lane

คำตอบ:


119

ฉันขอโทษล่วงหน้าสำหรับความยาวของโพสต์นี้: มันเป็นความกังวลใจบางอย่างที่ฉันปล่อยให้มันออกมาในที่สาธารณะเพราะต้องใช้เวลาและความสนใจในการอ่านผ่านและไม่ต้องสงสัยเลยว่ามีข้อผิดพลาดเกี่ยวกับการพิมพ์ แต่ที่นี่มีไว้สำหรับผู้ที่สนใจในหัวข้อที่น่าสนใจที่เสนอโดยหวังว่าจะช่วยให้คุณระบุหนึ่งหรือหลายส่วนของ CLT เพื่ออธิบายรายละเอียดเพิ่มเติมในการตอบสนองของคุณเอง


ความพยายามส่วนใหญ่ใน "การอธิบาย" CLT เป็นภาพประกอบหรือเพียงการกล่าวซ้ำซึ่งยืนยันว่าเป็นจริง คำอธิบายที่ถูกต้องและถูกต้องจริง ๆ จะต้องอธิบายสิ่งต่าง ๆ มากมาย

ก่อนที่จะดูเพิ่มเติมให้ชัดเจนเกี่ยวกับสิ่งที่ CLT พูด อย่างที่คุณรู้มีรุ่นที่แตกต่างกันไปในรุ่นทั่วไป บริบททั่วไปคือลำดับของตัวแปรสุ่มซึ่งเป็นฟังก์ชันบางชนิดในพื้นที่ความน่าจะเป็นทั่วไป สำหรับคำอธิบายที่ใช้งานง่ายที่เก็บอย่างจริงจังฉันคิดว่ามันเป็นประโยชน์ที่จะคิดว่าช่องว่างน่าจะเป็นกล่องที่มีวัตถุที่แตกต่าง ไม่สำคัญว่าวัตถุพวกนั้นคืออะไร แต่ฉันจะเรียกพวกเขาว่า "ตั๋ว" เราสร้าง "การสังเกต" หนึ่งกล่องโดยการผสมตั๋วให้ละเอียดและวาดออกมาหนึ่งกล่อง ตั๋วนั้นถือเป็นการสังเกตการณ์ หลังจากบันทึกเพื่อการวิเคราะห์ในภายหลังเราจะคืนตั๋วไปยังกล่องเพื่อให้เนื้อหาไม่เปลี่ยนแปลง "ตัวแปรสุ่ม" โดยทั่วไปคือตัวเลขที่เขียนในแต่ละตั๋ว

ในปี 1733 Abraham de Moivreพิจารณากรณีของกล่องเดียวที่ตัวเลขในตั๋วเป็นเพียงศูนย์และคน ("การทดลอง Bernoulli") กับบางส่วนของตัวเลขในปัจจุบัน เขาคิดทำร่างกายอิสระสังเกตยอมลำดับของค่าซึ่งทั้งหมดเป็นศูนย์หรือหนึ่ง ผลรวมของค่าเหล่านั้นเป็นแบบสุ่มเพราะเงื่อนไขในจำนวนเงินที่มี ดังนั้นหากเราสามารถทำซ้ำขั้นตอนนี้ได้หลายครั้งผลรวมต่างๆ (จำนวนเต็มตั้งแต่ถึง ) จะปรากฏขึ้นพร้อมความถี่ต่าง ๆ - สัดส่วนของผลรวม (ดูฮิสโทแกรมด้านล่าง)x 1 , x 2 , , x n y n = x 1 + x 2 + + x n 0 nnx1,x2,,xnyn=x1+x2++xn0n

ทีนี้ใคร ๆ ก็คาดหวัง - และมันก็เป็นความจริง - สำหรับค่ามากที่ของความถี่ทั้งหมดจะค่อนข้างเล็ก ถ้าเราจะให้เป็นตัวหนา (หรือโง่) เป็นความพยายามที่จะ "เอาขีด จำกัด" หรือ "ให้ไป " เราจะสรุปได้อย่างถูกต้องว่าความถี่ทั้งหมดลดลงเหลือ0แต่ถ้าเราวาดฮิสโตแกรมของความถี่โดยไม่สนใจว่าแกนของมันมีป้ายกำกับเราจะเห็นว่าฮิสโทแกรมของขนาดใหญ่ทั้งหมดเริ่มเหมือนกัน: ในบางกรณีฮิสโทแกรมเหล่านี้เข้าใกล้ขีด จำกัดแม้ว่าความถี่ พวกเขาทั้งหมดไปที่ศูนย์n 0 nnn0n

histograms

ฮิสโทแกรมเหล่านี้แสดงผลลัพธ์ของการทำซ้ำขั้นตอนการรับหลายครั้ง คือ "จำนวนการทดลอง" ในชื่อเรื่อง nynn

ความเข้าใจที่นี่คือการวาดกราฟแรกและป้ายแกนในภายหลัง ด้วยขนาดใหญ่ฮิสโตแกรมจะครอบคลุมช่วงของค่าขนาดใหญ่ที่อยู่กึ่งกลางรอบ (บนแกนนอน) และช่วงเวลาเล็ก ๆ ของค่าที่หายไป (บนแกนตั้ง) เนื่องจากความถี่แต่ละตัวมีขนาดค่อนข้างเล็ก การทำให้เส้นโค้งนี้เหมาะสมกับพื้นที่การพล็อตจึงจำเป็นต้องมีทั้งการเลื่อนและการลดขนาดของฮิสโตแกรม คำอธิบายทางคณิตศาสตร์ของสิ่งนี้คือสำหรับแต่ละเราสามารถเลือกค่ากลาง (ไม่จำเป็นต้องไม่ซ้ำกัน!) เพื่อจัดตำแหน่งฮิสโตแกรมและค่าสเกลบางค่าn / 2 n m n s n y n z n = ( y n - m n ) / s nnn/2nmnsn(ไม่จำเป็นต้องไม่ซ้ำกัน!) เพื่อให้พอดีกับแกน ซึ่งสามารถทำได้โดยการเปลี่ยนทางคณิตศาสตร์เพื่อs_nynzn=(ynmn)/sn

โปรดจำไว้ว่าฮิสโตแกรมแสดงความถี่โดยพื้นที่ระหว่างมันกับแกนนอน ความมั่นคงในที่สุด histograms เหล่านี้สำหรับค่ามากดังนั้นจึงควรที่ระบุไว้ในแง่ของพื้นที่ n ดังนั้นเลือกช่วงเวลาใด ๆ ของค่าที่คุณชอบพูดจากถึงและเมื่อเพิ่มขึ้นติดตามพื้นที่ของส่วนของฮิสโตแกรมของที่ครอบคลุมช่วงเวลาในแนวนอน CLT ยืนยันหลาย ๆ สิ่ง:b > a n z n ( a , b ]ab>anzn(a,b]

  1. ไม่ว่าและคืออะไรb abถ้าเราเลือกลำดับและอย่างเหมาะสม (ในวิธีที่ไม่ขึ้นกับหรือเลย) พื้นที่นี้ใกล้ถึงขีด จำกัด เมื่อมีขนาดใหญ่s n a b nmnsnabn

  2. ลำดับและสามารถเลือกได้ในลักษณะที่ขึ้นอยู่กับค่าเฉลี่ยของค่าในกล่องและการวัดการแพร่กระจายของค่าเหล่านั้น - แต่ไม่มีอะไรอื่น - โดยไม่คำนึงถึงสิ่งที่อยู่ในกล่อง ขีด จำกัด จะเท่ากันเสมอ (คุณสมบัติความเป็นสากลนี้น่าทึ่งมาก)s n nmnsnn

  3. โดยเฉพาะพื้นที่ จำกัด นั้นคือพื้นที่ใต้เส้นโค้งระหว่างและ : นี่คือสูตรของฮิสโทแกรม จำกัด สากล aby=exp(z2/2)/2πab

    การวางนัยทั่วไปครั้งแรกของ CLT เพิ่ม

  4. เมื่อกล่องสามารถมีตัวเลขได้นอกเหนือจากศูนย์และจำนวนนั้นข้อสรุปเดียวกันทั้งหมดถือ (โดยมีสัดส่วนของตัวเลขที่มีขนาดใหญ่มากหรือเล็กในกล่องไม่ใช่ "ยอดเยี่ยม" เป็นเกณฑ์ที่มีคำสั่งเชิงปริมาณที่แม่นยำและเรียบง่าย) .

    การวางนัยทั่วไปครั้งต่อไปและอาจเป็นสิ่งที่น่าตื่นตาตื่นใจที่สุดแทนที่ตั๋วแบบกล่องเดี่ยวนี้ด้วยกล่องแบบเรียงลำดับแบบยาวที่สั่งแบบไม่ จำกัด พร้อมตั๋ว แต่ละกล่องสามารถมีตัวเลขที่แตกต่างกันในตั๋วในสัดส่วนที่แตกต่างกัน การสังเกตทำโดยการดึงตั๋วจากกล่องแรกมาจากกล่องที่สองเป็นต้นx 2x1x2

  5. ข้อสรุปเดียวกันถือไว้โดยเนื้อหาของกล่องคือ "ไม่แตกต่างกันมาก" (มีหลายอย่างแม่นยำ แต่แตกต่างกันการกำหนดลักษณะเชิงปริมาณของสิ่งที่ "ไม่แตกต่างกันเกินไป" มีความหมาย; พวกเขาอนุญาตให้ละติจูดที่น่าอัศจรรย์)

อย่างน้อยห้าคำยืนยันนี้ต้องอธิบายอย่างน้อย ยังมีอีก. แง่มุมที่น่าสนใจหลายประการของการตั้งค่านั้นมีความหมายโดยนัยในข้อความทั้งหมด ตัวอย่างเช่น,

  • สิ่งที่พิเศษเกี่ยวกับผลรวมคืออะไร? ทำไมเราไม่มีทฤษฎี จำกัด ศูนย์กลางสำหรับการรวมกันทางคณิตศาสตร์อื่น ๆ ของตัวเลขเช่นผลิตภัณฑ์หรือค่าสูงสุด? (มันจะเปิดออกที่เราทำ แต่พวกเขาจะไม่ได้ค่อนข้างทั่วไปจึงไม่ทำพวกเขามักจะมีโอกาสได้ทำความสะอาดข้อสรุปง่าย ๆ จนกว่าพวกเขาจะสามารถลดลงไป CLT.) ลำดับของและไม่ได้ที่ไม่ซ้ำกัน แต่พวกเขาเกือบจะไม่ซ้ำกัน ในแง่ที่ว่าในที่สุดพวกเขาต้องประมาณความคาดหวังของผลรวมของตั๋วและค่าเบี่ยงเบนมาตรฐานของผลรวมตามลำดับ (ซึ่งในสองข้อความแรกของ CLT เท่ากับคูณค่าเบี่ยงเบนมาตรฐานของ กล่อง). s n n mnsnnn

    ค่าเบี่ยงเบนมาตรฐานคือการวัดส่วนหนึ่งของการแพร่กระจายของค่า แต่มันไม่ได้หมายความว่ามีเพียงสิ่งเดียวเท่านั้นที่เป็น "ธรรมชาติ" ที่สุดในอดีตหรือในหลาย ๆ แอปพลิเคชัน (คนจำนวนมากจะเลือกสิ่งที่ต้องการค่าเบี่ยงเบนสัมบูรณ์แบบมัธยฐานจากค่ามัธยฐานเป็นต้น)

  • เหตุใด SD จึงปรากฏในวิธีที่จำเป็นเช่นนี้?

  • ลองพิจารณาสูตรของฮิสโตแกรมที่ จำกัด : ใครจะคิดว่ามันจะอยู่ในรูปแบบนี้? มันบอกว่าลอการิทึมของความหนาแน่นของความน่าจะเป็นเป็นฟังก์ชันกำลังสอง ทำไม? มีคำอธิบายที่ใช้งานง่ายหรือชัดเจนและน่าสนใจสำหรับเรื่องนี้หรือไม่?


ฉันขอสารภาพว่าฉันไม่สามารถบรรลุเป้าหมายสูงสุดในการจัดหาคำตอบที่ง่ายพอที่จะตอบสนองความท้าทายและความเรียบง่ายของศรีคานต์ได้ แต่ฉันได้ร่างภาพพื้นหลังนี้ด้วยความหวังว่าคนอื่น ๆ อาจได้รับแรงบันดาลใจ ผมคิดว่าการสาธิตที่ดีที่สุดจะต้องพึ่งพาการวิเคราะห์เบื้องต้นของวิธีการที่ค่าระหว่างและสามารถเกิดขึ้นได้ในการจัดตั้งรวมx_n กลับไปที่รุ่น CLT กล่องเดียวกรณีของการกระจายแบบสมมาตรนั้นง่ายต่อการจัดการ: ค่ามัธยฐานเท่ากับค่าเฉลี่ยดังนั้นจึงมีโอกาส 50% ที่จะน้อยกว่าค่าเฉลี่ยของกล่องและโอกาส 50% ที่β n = b s n + m n x 1 + x 2 + + x n x ฉันx ฉัน nαn=asn+mnβn=bsn+mnx1+x2++xnxixiจะมากกว่าค่าเฉลี่ย ยิ่งกว่านั้นเมื่อมีขนาดใหญ่พอค่าเบี่ยงเบนในเชิงบวกจากค่าเฉลี่ยควรชดเชยความเบี่ยงเบนเชิงลบในค่าเฉลี่ย (สิ่งนี้ต้องมีเหตุผลอย่างระมัดระวังไม่ใช่แค่โบกมือ) ดังนั้นเราควรจะต้องกังวลเกี่ยวกับการนับจำนวนการเบี่ยงเบนเชิงบวกและเชิงลบและมีความกังวลรองเกี่ยวกับขนาดของมันn (ในทุกสิ่งที่ฉันเขียนที่นี่อาจเป็นประโยชน์มากที่สุดในการให้สัญชาตญาณว่าเหตุใด CLT จึงใช้งานได้จริง ๆ แล้วสมมติฐานทางเทคนิคที่จำเป็นในการทำให้ภาพรวมของ CLT เป็นจริงนั้น การเบี่ยงเบนขนาดใหญ่ที่หายากจะทำให้เสียสมดุลมากพอที่จะป้องกันไม่ให้ฮิสโตแกรมที่ จำกัด เกิดขึ้น)

นี่แสดงให้เห็นว่าในระดับหนึ่งแล้วทำไมการวางนัยทั่วไปครั้งแรกของ CLT จึงไม่ได้เปิดเผยอะไรเลยที่ไม่ได้อยู่ในเวอร์ชันทดลองต้นฉบับของ Bernoulli ของ Moivre

ณ จุดนี้ดูเหมือนว่าไม่มีอะไร แต่ทำคณิตศาสตร์เล็กน้อย: เราต้องนับจำนวนวิธีที่ชัดเจนซึ่งจำนวนการเบี่ยงเบนเชิงบวกจากค่าเฉลี่ยอาจแตกต่างจากจำนวนการเบี่ยงเบนเชิงลบโดยค่าที่กำหนดไว้ล่วงหน้าที่เห็นได้ชัดเป็นหนึ่งในn แต่เนื่องจากข้อผิดพลาดเล็กน้อยที่หายไปจะหายไปภายในขีด จำกัด เราจึงไม่ต้องนับอย่างแม่นยำ เราเพียงต้องการประมาณค่า ด้วยเหตุนี้จึงพอเพียงที่จะรู้ว่าk - n , - n + 2 , , n - 2 , nkkn,n+2,,n2,n

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(นั่นเป็นผลเบื้องต้นอย่างสมบูรณ์แบบดังนั้นฉันจะไม่รำคาญที่จะเขียนข้ออ้าง) ตอนนี้เราประมาณขายส่ง ความถี่สูงสุดเกิดขึ้นเมื่อใกล้เคียงกับมากที่สุดเท่าที่จะเป็นไปได้เช่นกัน ลองเขียน 2 จากนั้นสัมพันธ์กับความถี่สูงสุดความถี่ของส่วนเบี่ยงเบนบวก ( ) ถูกประเมินโดยผลิตภัณฑ์n / 2 m = n / 2 m + j + 1 j 0kn/2m=n/2m+j+1j0

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

135 ปีก่อนที่เดอโมไอร์จะเขียน John Napier ได้ประดิษฐ์ลอการิทึมเพื่อทำให้การคูณง่ายขึ้นดังนั้นเราจึงใช้ประโยชน์จากสิ่งนี้ การใช้การประมาณ

log(1x1+x)2x,

เราพบว่าบันทึกของความถี่สัมพัทธ์นั้นประมาณ

2/(m+1)4/(m+1)2j/(m+1)=j(j+1)m+1j2m.

เนื่องจากข้อผิดพลาดที่สะสมเป็นสัดส่วนกับนี้ควรจะทำงานที่จัดไว้ให้ดีเป็นญาติขนาดเล็กเพื่อ 3 ซึ่งครอบคลุมช่วงของค่ามากกว่าที่ต้องการ (มันเพียงพอสำหรับการประมาณเพื่อทำงานกับเฉพาะในคำสั่งของซึ่ง asymptotically น้อยกว่ามากj 4 m 3 j j j4/m3j4m3jjม. 3 / 4mm3/4


เห็นได้ชัดว่าการวิเคราะห์ประเภทนี้มากขึ้นควรนำเสนอเหตุผลในการยืนยันอื่น ๆ ใน CLT แต่ฉันหมดเวลาพื้นที่และพลังงานและฉันอาจสูญเสีย 90% ของผู้ที่เริ่มอ่านบทความนี้ นี้ประมาณเรียบง่าย แต่แสดงให้เห็นว่าเดอ Moivre อาจเดิมได้สงสัยว่ามีการกระจายการ จำกัด สากลว่าลอการิทึมของการเป็นฟังก์ชันกำลังสองและขนาดที่เหมาะสมปัจจัยต้องเป็นสัดส่วนกับ (เพราะ )snnj2/m=2j2/n=2(j/n)2 เป็นการยากที่จะจินตนาการว่าความสัมพันธ์เชิงปริมาณที่สำคัญนี้สามารถอธิบายได้โดยไม่ต้องใช้ข้อมูลทางคณิตศาสตร์และการใช้เหตุผลบางอย่าง อะไรที่น้อยกว่าจะทำให้รูปร่างที่แม่นยำของเส้นโค้งที่ จำกัด เป็นปริศนาที่สมบูรณ์


5
+1 ฉันต้องใช้เวลาสักครู่ในการแยกย่อยคำตอบของคุณ ฉันยอมรับว่าการขอสัญชาติญาณสำหรับ CLT ภายใต้ข้อ จำกัด ที่ฉันกำหนดอาจเป็นไปไม่ได้เกือบ

2
ขอบคุณที่สละเวลาเขียนสิ่งนี้มันเป็นงานแสดงนิทรรศการที่เป็นประโยชน์ที่สุดของ CLT ที่ฉันเคยเห็นซึ่งสามารถเข้าถึงได้ทางคณิตศาสตร์
jeremy radcliff

1
ใช่ค่อนข้างหนาแน่น .... คำถามมากมาย ฮิสโตแกรมแรกมี 2 แท่งอย่างไร (มีการทดลองเพียง 1 ครั้ง!); ฉันจะเพิกเฉยได้ไหม และการประชุมมักจะหลีกเลี่ยงช่องว่างแนวนอนระหว่างแท่งกราฟแท่งใช่ไหม? (เพราะอย่างที่คุณบอกว่าพื้นที่มีความสำคัญและพื้นที่นั้นจะถูกคำนวณในโดเมนต่อเนื่อง (เช่นไม่มีช่องว่าง) หรือไม่ ดังนั้นฉันจะเพิกเฉยต่อช่องว่างเช่นกัน ... ? แม้ฉันจะมีช่องว่างเมื่อฉันพยายามทำความเข้าใจครั้งแรก :)
ถั่วแดง

1
@TheRed ขอบคุณสำหรับคำถามของคุณ ฉันได้แก้ไขส่วนแรกของโพสต์นี้เพื่อให้ประเด็นเหล่านี้ชัดเจนขึ้นเล็กน้อย
whuber

4
อ๊ะใช่ฉันสับสน "จำนวนครั้งที่ทดลอง = =" ข้อสังเกต "" กับ "จำนวนครั้ง (ขั้นตอนทั้งหมดนี้) ซ้ำ" ดังนั้นหากตั๋วมีเพียงค่าของสองค่า0 หรือ 1และคุณจะสังเกตหนึ่งตั๋วที่ผลรวมของค่าตั๋วเหล่านั้นเท่านั้นที่สามารถเป็นหนึ่งในสองสิ่ง: 0 หรือ 1 ดังนั้นฮิสโตแกรมแรกของคุณจึงมีสองแท่ง ยิ่งไปกว่านั้นแถบเหล่านี้มีความสูงประมาณเท่ากันเนื่องจากเราคาดว่า 0 และ 1 จะเกิดขึ้นในสัดส่วนที่เท่ากัน n
ถั่วแดง

27

แอนิเมชั่นที่อร่อยที่สุดที่ฉันรู้: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

8 ชั้นแนวนอนของหมุดที่เว้นระยะเท่า ๆ กันแต่ละชั้นที่ถูกส่ายจะส่งผลให้เกิดอุปสรรคแบบ "ปาจิงโกะ / พินบอล" สำหรับลูกบอลที่หล่นผ่านหมุดเหล่านี้  ลูกบอลแต่ละลูกจะตกลงมาที่ด้านล่างและเมื่อลูกบอลสูงขึ้นความสูงของพวกมันจะเข้าใกล้เส้นโค้งของเกาส์เซียน  สิ่งนี้แสดงให้เห็นว่าผลรวมของเหตุการณ์สุ่มแบบอิสระจำนวนมาก (เลเยอร์) จะส่งผลให้เกิดการแจกแจงแบบเกาส์ (ความสูงของลูกซ้อน)

คำที่ง่ายที่สุดที่ฉันได้อ่าน: http://elonen.iki.fi/articles/centrallimit/index.en.html

หากคุณรวมผลลัพธ์ของการโยนสิบครั้งเหล่านี้สิ่งที่คุณได้รับมีแนวโน้มที่จะใกล้เคียงกับ 30-40 มากกว่าสูงสุด 60 (ทั้งหก) หรือในทางกลับกัน Minumum, 10 (ทั้งหมด)

เหตุผลสำหรับสิ่งนี้คือคุณสามารถรับค่ากลางได้หลายวิธีมากกว่าสุดขั้ว ตัวอย่าง: เมื่อโยนลูกเต๋าสองลูก: 1 + 6 = 2 + 5 = 3 + 4 = 7 แต่มีเพียง 1 + 1 = 2 และเพียง 6 + 6 = 12

นั่นคือ: แม้ว่าคุณจะได้รับหนึ่งในหกหมายเลขที่มีโอกาสเท่ากันในการขว้างหนึ่งตาย แต่ความสุดขั้วนั้นมีโอกาสน้อยกว่าค่ากลางในผลรวมของลูกเต๋าหลายลูก


20

สัญชาตญาณเป็นสิ่งที่ยุ่งยาก มันยิ่งซับซ้อนกว่าด้วยทฤษฎีในมือของเราที่ผูกติดอยู่ด้านหลังของเรา

CLT นั้นเกี่ยวกับผลรวมของการรบกวนเล็ก ๆ น้อย ๆ ที่เป็นอิสระ "ผลรวม" ในแง่ของค่าเฉลี่ยตัวอย่าง "จิ๋ว" ในแง่ของความแปรปรวนอัน จำกัด (ของประชากร) และ "การรบกวน" ในแง่ของการบวก / ลบรอบค่ากลาง (ประชากร)

สำหรับฉันอุปกรณ์ที่ดึงดูดความสนใจมากที่สุดคือสัญชาตญาณคือ quincunx หรือ 'Galton box' ดู Wikipedia (สำหรับ 'bean machine'?) ความคิดคือการกลิ้งลูกบอลเล็ก ๆ ตัวเล็ก ๆ ลงไปที่หน้ากระดานที่ประดับด้วยตาข่าย ของหมุดที่เว้นระยะเท่ากัน เมื่อถึงทางลูกบอลจะเบี่ยงไปทางซ้ายและขวา (... สุ่มโดยอิสระ) และรวบรวมที่ด้านล่าง เมื่อเวลาผ่านไปเราจะเห็นเนินดินรูประฆังสวยอยู่ตรงหน้า

CLT พูดในสิ่งเดียวกัน มันเป็นคำอธิบายทางคณิตศาสตร์ของปรากฏการณ์นี้ (ที่แม่นยำยิ่งขึ้น quincunx เป็นหลักฐานทางกายภาพสำหรับการประมาณแบบปกติกับการแจกแจงทวินาม) CLT พูดอย่างหลวม ๆ บอกว่าตราบใดที่ประชากรของเราไม่ได้ทำงานผิดปกติมากเกินไป (นั่นคือถ้าหางของ PDF นั้นบางพอแล้ว) จากนั้นค่าเฉลี่ยตัวอย่าง (ปรับขนาดอย่างเหมาะสม) จะทำงานเหมือนลูกบอลเล็ก ๆ quincunx: บางครั้งมันก็ตกไปทางซ้ายบางครั้งมันก็ตกไปทางขวา แต่ส่วนใหญ่แล้วมันจะตกลงไปทางตรงกลางในรูประฆังที่สวยงาม

พระบาทสมเด็จพระเจ้าอยู่หัวของ CLT (สำหรับฉัน) คือรูปทรงของประชากรพื้นฐานไม่เกี่ยวข้อง รูปร่างมีบทบาทตราบเท่าที่มันมอบหมายระยะเวลาที่เราต้องรอ (ในแง่ของขนาดตัวอย่าง)


17

S=X1+X2++Xn

มี CLT หลายเวอร์ชันบางรุ่นแข็งแกร่งกว่ารุ่นอื่นบางรุ่นมีเงื่อนไขที่ผ่อนคลายเช่นการพึ่งพาในระดับปานกลางระหว่างข้อกำหนดและ / หรือการแจกแจงที่ไม่เหมือนกันสำหรับข้อกำหนด ในที่ง่ายต่อการพิสูจน์รุ่น CLT หลักฐานมักจะขึ้นอยู่กับฟังก์ชั่นช่วงเวลา (หรือ Laplace-Stieltjes เปลี่ยนหรืออื่น ๆ ที่เหมาะสมเปลี่ยนของความหนาแน่น) ของผลรวมSการเขียนสิ่งนี้เป็นการขยายตัวของเทย์เลอร์และการรักษาเฉพาะคำศัพท์ที่โดดเด่นที่สุดทำให้คุณมีฟังก์ชันสร้างช่วงเวลาของการแจกแจงแบบปกติ ดังนั้นสำหรับฉันเป็นการส่วนตัวบรรทัดฐานคือสิ่งที่ตามมาจากสมการจำนวนมากและฉันไม่สามารถให้สัญชาตญาณอะไรได้มากกว่านั้นS

ควรสังเกตว่าการกระจายตัวของผลรวมไม่ปกติถูกแจกจ่ายจริง ๆและ CLT ไม่ได้อ้างว่ามันจะเป็นเช่นนั้น ถ้าเป็นจำนวน จำกัด ยังคงมีระยะห่างจากการแจกแจงแบบปกติและถ้าทั้งค่าเฉลี่ยและความแปรปรวนก็ไม่มีที่สิ้นสุดเช่นกัน ในกรณีหลังคุณสามารถหาค่าเฉลี่ยของผลรวมอนันต์ แต่จากนั้นคุณจะได้จำนวนที่กำหนดโดยไม่มีการแปรปรวนใด ๆ เลยซึ่งแทบจะไม่มีป้ายกำกับว่า "กระจายทั่วไป"nn=

นี่อาจเป็นปัญหากับการใช้งานจริงของ CLT โดยปกติหากคุณสนใจกระจายใกล้กับศูนย์กลาง CLT ทำงานได้ดี อย่างไรก็ตามการลู่เข้าสู่ภาวะปกตินั้นไม่เหมือนกันทุกที่และยิ่งคุณอยู่ห่างจากศูนย์กลางมากเท่าไรคุณก็ยิ่งต้องการคำศัพท์ที่เหมาะสมมากขึ้นเท่านั้นS/n

ด้วย "ความศักดิ์สิทธิ์" ทั้งหมดของทฤษฎีขีด จำกัด กลางในสถิติข้อ จำกัด ของมันมักถูกมองข้ามได้ง่ายเกินไป ด้านล่างฉันให้สองสไลด์จากหลักสูตรของฉันทำให้จุดที่ CLT ล้มเหลวอย่างมากในส่วนท้ายในกรณีที่ใช้งานได้จริง น่าเสียดายที่ผู้คนจำนวนมากใช้ CLT เป็นพิเศษในการประมาณความน่าจะเป็นแบบหางหรืออย่างอื่น

ป้อนคำอธิบายรูปภาพที่นี่ ป้อนคำอธิบายรูปภาพที่นี่


5
นี่คือวัสดุที่ดีและคำแนะนำที่ชาญฉลาด ฉันไม่สามารถลงคะแนนได้โชคไม่ดีเนื่องจากการยืนยันใน "ปกตินี้เป็นสิ่งประดิษฐ์ทางคณิตศาสตร์และฉันคิดว่ามันไม่มีประโยชน์ที่จะค้นหาความจริงที่ลึกซึ้งยิ่งขึ้น ดูเหมือนว่าพวกเขาแนะนำว่า (1) เราไม่ควรพึ่งพาคณิตศาสตร์เพื่อช่วยเราในเชิงทฤษฎีและ (2) ไม่มีจุดที่จะเข้าใจคณิตศาสตร์ในตอนแรก ฉันหวังว่าโพสต์อื่น ๆ ในหัวข้อนี้จะไปไกลเกินกว่าที่จะพิสูจน์หักล้างคำยืนยันที่สอง ประการแรกคือความไม่สอดคล้องกันของตนเองจึงแทบไม่มีการวิเคราะห์เพิ่มเติม
whuber

2
@whuber คุณพูดถูกฉันอยู่นอกลีกบางที ฉันจะแก้ไข
StijnDeVuyst

3
ขอบคุณสำหรับการพิจารณาส่วนที่มีปัญหาและ +1 ที่เหลือสำหรับการพิจารณาอีกครั้ง
whuber

7

คำตอบนี้หวังที่จะให้ความหมายที่เข้าใจง่ายของทฤษฎีบทขีด จำกัด กลางโดยใช้เทคนิคแคลคูลัสอย่างง่าย (เทย์เลอร์ส่วนขยายของลำดับ 3) นี่คือโครงร่าง:

  1. สิ่งที่ CLT พูด
  2. หลักฐานที่ใช้งานง่ายของ CLT โดยใช้แคลคูลัสอย่างง่าย
  3. ทำไมการกระจายปกติ?

เราจะพูดถึงการแจกแจงแบบปกติตอนท้ายสุด เพราะความจริงที่ว่าการแจกแจงแบบปกติในที่สุดก็เกิดขึ้นไม่ได้มีสัญชาตญาณมากนัก

1. ทฤษฎีบทขีด จำกัด กลางพูดว่าอะไร? CLT หลายรุ่น

มีรุ่น euivalent หลายรุ่นของ CLT คำสั่งในตำราเรียนของ CLT กล่าวว่าสำหรับจริงและลำดับของตัวแปรสุ่มอิสระใด ๆด้วยค่าศูนย์และค่าความแปรปรวน 1, เพื่อให้เข้าใจถึงสิ่งที่เป็นสากลและใช้งานง่ายเกี่ยวกับ CLT ขอให้ลืมข้อ จำกัด สักครู่ ข้อความข้างต้นบอกว่าถ้า และเป็นสองลำดับของตัวแปรสุ่มอิสระแต่ละตัวมีค่าศูนย์และค่าแปรปรวน 1 แล้ว xX1,,Xn

P(X1++Xnnx)n+xet2/22πdt.
X1.,,XnZ1,,Zn
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
สำหรับตัวบ่งชี้ฟังก์ชันของรูปแบบสำหรับการแก้ไขจริง , จอแสดงผลก่อนหน้านี้แสดงถึงความจริงที่ว่าขีด จำกัด นั้นเหมือนกันไม่ว่าจะมีการแจกแจงโดยเฉพาะของและโดยมีเงื่อนไขว่าตัวแปรสุ่มมีความเป็นอิสระด้วยค่าเฉลี่ยศูนย์ความแปรปรวนอย่างใดอย่างหนึ่งfx
f(t)={1 if t<x0 if tx.
X1,,XnZ1,,Zn

CLT เวอร์ชันอื่นบางเวอร์ชันระบุถึงคลาสของฟังก์ชัน Lipschtiz ที่ล้อมรอบด้วย 1; บางรุ่นอื่น ๆ ของ CLT กล่าวถึงระดับของการทำงานที่ราบรื่นกับอนุพันธ์ขอบเขตของการสั่งซื้อkพิจารณาสองลำดับและข้างต้นและสำหรับบางฟังก์ชั่นผลลัพธ์การคอนเวอร์เจนซ์ (CONV)kX1,,XnZ1,,Znf

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

มันเป็นไปได้ที่จะสร้างความเท่าเทียมกัน ("ถ้าเพียง แต่ถ้า") ระหว่างคำสั่งต่อไปนี้:

  1. (CONV) ข้างต้นถือสำหรับทุกฟังก์ชั่นตัวบ่งชี้ของรูปแบบสำหรับและสำหรับบางจริงคงxff(t)=1t<xf(t)=0txx
  2. (CONV) ถือหุ้นทุกฟังก์ชั่น Lipschitz boundedRf:RR
  3. (CONV) สำหรับทุกฟังก์ชั่นที่ราบรื่น (เช่น ) พร้อมการรองรับที่กะทัดรัดC
  4. (CONV) เก็บไว้สำหรับทุกฟังก์ชั่นสามครั้งอย่างต่อเนื่อง differentiable กับ1fsupxR|f(x)|1

คะแนนทั้งสี่ด้านบนบอกว่าการบรรจบกันนั้นมีไว้สำหรับฟังก์ชั่นใหญ่ ๆ เราสามารถอ่านผู้อ่านถึงบทที่ 7 หน้า 77 ของหนังสือเดวิดพอลลาร์ดคู่มือผู้ใช้ในการวัดความน่าจะเป็นเชิงทฤษฎีซึ่งคำตอบนี้ได้รับแรงบันดาลใจอย่างสูง

สมมติฐานของเราสำหรับคำตอบที่เหลืออยู่นี้ ...

เราจะสมมติว่าสำหรับค่าคงที่ซึ่งตรงกับจุดที่ 4 ด้านบน นอกจากนี้เรายังจะสมมติว่าตัวแปรสุ่มมีขอบเขต จำกัด ช่วงเวลาที่สาม:และ มี จำกัดsupxR|f(x)|CC>0E[|Xi|3]E[|Zi|3]

2. ค่าของเป็นสากล: ไม่ขึ้นอยู่กับการกระจายของE[f(X1++Xnn)]X1,...,Xn

ขอให้เราแสดงให้เห็นว่าปริมาณนี้เป็นสากล (มากถึงข้อผิดพลาดเล็ก ๆ ) ในแง่ที่ว่ามันไม่ได้ขึ้นอยู่กับการรวบรวมตัวแปรสุ่มแบบอิสระที่มีให้ ใช้และสองลำดับของตัวแปรสุ่มอิสระโดยแต่ละค่าเฉลี่ย 0 และความแปรปรวน 1 และช่วงเวลาที่สามที่แน่นอนX1,,XnZ1,,Zn

แนวคิดคือการแทนที่ด้วยในปริมาณหนึ่งและควบคุมความแตกต่างด้วยแคลคูลัสพื้นฐาน (ฉันเชื่อว่าเป็นเพราะ Lindeberg) โดยการขยายตัวของเทย์เลอร์หากและดังนั้น โดยที่และXiZiW=Z1++Zn1h(x)=f(x/n)

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
MnMnเป็นจุดกึ่งกลางที่กำหนดโดยทฤษฎีบทค่าเฉลี่ย การรับความคาดหวังของทั้งสองบรรทัดคำสั่ง zeroth เหมือนกันเงื่อนไขการสั่งซื้อครั้งแรกมีค่าเท่ากันเพราะโดยความเป็นอิสระของและ ,และคล้ายกันสำหรับบรรทัดที่สอง คำสั่งที่สองนั้นเหมือนกันโดยอิสระ คำเดียวที่เหลืออยู่คือคำสั่งที่สามและโดยความคาดหวังความแตกต่างระหว่างสองบรรทัดนั้นมากที่สุด นี่เป็นขอบเขตบนอนุพันธ์ที่สามของ''' ตัวส่วนปรากฏขึ้นเนื่องจากXnWE[Xnh(W)]=E[Xn]E[h(W)]=0

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3h(t)=f(t/n)/(n)3 3 โดยความเป็นอิสระการมีส่วนร่วมของในผลรวมนั้นไม่มีความหมายเพราะสามารถแทนที่ด้วยโดยไม่เกิดข้อผิดพลาดที่ใหญ่กว่าจอแสดงผลด้านบน!XnZn

ตอนนี้เรายังคงคำแนะนำเพื่อแทนที่โดย{n-1} ถ้าดังนั้น โดยความเป็นอิสระของและและโดยความเป็นอิสระของและXn1Zn1W~=Z1+Z2++Zn2+Xn

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
Zn1W~Xn1W~ศูนย์อีกครั้ง, เงื่อนไขการสั่งซื้อครั้งแรกและครั้งที่สองมีค่าเท่ากันในทั้งคู่ ความแตกต่างของความคาดหวังระหว่างสองบรรทัดนั้นมากที่สุด เราให้ทำซ้ำจนกว่าเราจะแทนที่ทั้งหมด 's กับ ' s โดยการเพิ่มข้อผิดพลาดที่ทำในแต่ละขั้นตอนเราได้รับ ตาม

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
nเพิ่มขึ้นทางด้านขวามือจะมีขนาดเล็กตามอำเภอใจถ้าช่วงเวลาที่สามหรือตัวแปรสุ่มมี จำกัด (สมมติว่าเป็นกรณี) ซึ่งหมายความว่าการคาดการณ์ทางด้านซ้ายกลายเป็นพลใกล้ ๆ กันไม่ว่าหากการกระจายของอยู่ไกลจากที่Z_1โดยเป็นอิสระมีส่วนร่วมของแต่ละในผลรวมเป็นความหมายเพราะมันจะถูกแทนที่ด้วยโดยไม่เกิดข้อผิดพลาดที่มีขนาดใหญ่กว่า3) และแทนที่ทั้งหมด 's โดย ' s ไม่เปลี่ยนแปลงปริมาณมากกว่าn)X1,,XnZ1,,ZnXiZiO(1/(n)3)XiZiO(1/n)

ความคาดหวังเป็นสากลจึงไม่ขึ้นอยู่กับการกระจายของX_1ในทางตรงกันข้ามความเป็นอิสระและมีความสำคัญสูงสุดสำหรับขอบเขตด้านบนE[f(X1++Xnn)]X1,,XnE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1

3. ทำไมการกระจายปกติ?

เราได้เห็นแล้วว่าความคาดหวังจะเหมือนกันไม่ว่าการกระจายของจะเป็นเท่าข้อผิดพลาดเล็ก ๆ ของการสั่งซื้อn)E[f(X1++Xnn)]XiO(1/n)

แต่สำหรับการใช้งานมันจะมีประโยชน์ในการคำนวณปริมาณ นอกจากนี้ยังจะเป็นประโยชน์ที่จะได้รับการแสดงออกที่เรียบง่ายสำหรับปริมาณนี้ขวา]E[f(X1++Xnn)]

เนื่องจากปริมาณนี้เท่ากันสำหรับคอลเลกชันใด ๆเราสามารถเลือกหนึ่งคอลเล็กชันที่เจาะจงเช่นการแจกจ่ายง่ายต่อการคำนวณหรือจดจำได้ง่ายX1,,Xn(X1++Xn)/n

สำหรับการแจกแจงปกติมันเกิดขึ้นว่าปริมาณนี้กลายเป็นเรื่องง่ายมาก แน่นอนถ้าคือ iidดังนั้นมีการกระจายและมันก็ไม่ได้ขึ้นอยู่กับ ! ดังนั้นถ้าดังนั้น และด้วยเหตุผลข้างต้นสำหรับคอลเลกชันของตัวแปรสุ่มอิสระกับจากนั้นN(0,1)Z1,,ZnN(0,1)Z1++ZnnN(0,1)nZN(0,1)X1,

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

คุณดูเหมือนจะอ้างกฎหมายเป็นจำนวนมากแทนที่จะเป็น CLT
whuber

1
ฉันไม่แน่ใจว่าทำไมคุณถึงพูดแบบนี้ @whuber ข้างต้นให้หลักฐานที่ใช้งานง่ายว่ามาบรรจบกับโดยที่สำหรับฟังก์ชั่นระดับใหญ่ . นี่คือ CLT E[f(Z)]ZN(0,1)fE[f((X1+...+Xn)/n)]E[f(Z)]ZN(0,1)f
jlewk

2
ฉันเห็นสิ่งที่คุณหมายถึง สิ่งที่ทำให้ฉันหยุดชั่วคราวก็คือการยืนยันของคุณเกี่ยวข้องกับความคาดหวังเท่านั้นและไม่กระจายในขณะที่ CLT ดึงข้อสรุปเกี่ยวกับการ จำกัด การกระจาย ความเท่าเทียมกันระหว่างคนทั้งสองอาจไม่ปรากฏชัดในหลาย ๆ คนทันที ฉันขอแนะนำให้คุณให้การเชื่อมต่อที่ชัดเจนระหว่างคำสั่งของคุณและคำสั่งปกติของ CLT ในแง่ของการ จำกัด การกระจาย? (+1 ตามวิธี: ขอขอบคุณสำหรับการชี้แจงข้อโต้แย้งนี้)
whuber

1

ฉันยอมแพ้กับความพยายามที่จะเกิดขึ้นกับรุ่นที่ใช้งานง่ายและมากับการจำลองบางอย่าง ฉันมีสิ่งหนึ่งที่แสดงการจำลองของ Quincunx และบางอย่างที่ทำสิ่งต่าง ๆ เช่นแสดงให้เห็นว่าการแจกแจงเวลาตอบสนองดิบที่เบ้จะกลายเป็นเรื่องปกติถ้าคุณรวบรวม RT ต่อวิชามากพอ ฉันคิดว่าพวกเขาช่วย แต่พวกเขากำลังใหม่ในชั้นเรียนของฉันในปีนี้และฉันยังไม่ได้ให้คะแนนการทดสอบครั้งแรก

สิ่งหนึ่งที่ฉันคิดว่าดีคือความสามารถในการแสดงกฎหมายจำนวนมากเช่นกัน ฉันสามารถแสดงให้เห็นว่าสิ่งต่าง ๆ มีขนาดตัวอย่างขนาดเล็กอย่างไรจากนั้นแสดงให้เห็นว่าพวกมันมีความเสถียรกับขนาดใหญ่เพียงใด ฉันทำการสาธิตจำนวนมากอื่น ๆ เช่นกัน ฉันสามารถแสดงการโต้ตอบใน Quincunx ระหว่างจำนวนของกระบวนการสุ่มและจำนวนตัวอย่าง

(ปรากฎว่าไม่สามารถใช้ชอล์คหรือกระดานไวท์บอร์ดในชั้นเรียนของฉันได้อาจเป็นพร)


สวัสดีจอห์น: ดีใจที่ได้พบคุณกลับมาพร้อมโพสต์นี้หลังจากผ่านไปเกือบเก้าปี! มันจะน่าสนใจที่จะอ่านเกี่ยวกับประสบการณ์ที่คุณมีในขณะเดียวกันกับการใช้แบบจำลองเพื่อสอนแนวคิดของ CLT และ LLNs
whuber

ฉันหยุดการสอนในชั้นเรียนหนึ่งปีต่อมา แต่ผู้สอนคนต่อมาหยิบแนวคิดการจำลองขึ้นมา ในความเป็นจริงเขาถือมันไกลออกไปมากและได้พัฒนาแอพพลิเคชั่นเงา ๆ และให้นักเรียนเล่นกับสถานการณ์จำลองสำหรับสิ่งต่าง ๆ ในชั้นเรียน 250 คน ใกล้เท่าที่ฉันสามารถบอกได้จากการสอนชั้นสูงนักเรียนดูเหมือนจะได้รับมากจากมัน ความแตกต่างระหว่างนักเรียนของเขากับผู้ที่มาจากชั้นเรียนของผู้ป้อนเท่ากันจะสังเกตได้ชัดเจน (แต่แน่นอนว่ามีตัวแปรที่ไม่สามารถควบคุมได้มากมาย)
John

ขอบคุณ John เป็นเรื่องแปลกมากที่จะได้รับข้อมูลย้อนกลับเกี่ยวกับผลการเรียนของนักเรียนหลังจากเรียนจบฉันพบว่าข้อมูลที่น่าสนใจมีอยู่ จำกัด
whuber

-8

เมื่อคุณเพิ่มฮิสโตแกรมจำนวนมากของการแจกแจงแบบสุ่มเข้าด้วยกันคุณจะต้องรักษารูปร่างการแจกแจงแบบปกติเพราะฮิสโทแกรมแต่ละอันนั้นมีรูปร่างนั้นอยู่แล้วหรือคุณได้รูปร่างนั้นมาเนื่องจากความผันผวนในฮิสโทแกรมแต่ละรายการนั้น จำนวนฮิสโตแกรม ฮิสโตแกรมของการแจกแจงแบบสุ่มของตัวแปรหนึ่งมีการแจกแจงแบบประมาณโดยวิธีที่ผู้คนเริ่มเรียกการแจกแจงแบบปกติเพราะมันเป็นเรื่องธรรมดามาก

นี่ไม่ใช่เรื่องราวทั้งหมด แต่ฉันคิดว่ามันเป็นสัญชาตญาณตามที่ได้รับ


2
คำอธิบายของคุณเกี่ยวกับ "การแจกแจงแบบปกติ" ฟังดูเหมือนเป็นเลขชี้กำลังแบบทวีคูณซึ่งไม่ได้อยู่ในระยะไกลเหมือนการแจกแจงแบบเกาส์ปกติ ฮิสโตแกรมของการโยนเหรียญไม่มีแท่งที่ลดลงเท่าในแต่ละขั้นตอน! นั่นแสดงให้เห็นว่าอาจมีปัญหาบางอย่างแฝงตัวอยู่ในคำอธิบายนี้ซึ่งได้รับการตีพิมพ์โดยการอุทธรณ์ไปที่ "ปรีชา" 2
whuber

5
คำตอบนี้ส่วนใหญ่ไร้สาระ ไม่มีการโยนเหรียญที่ยุติธรรมจำนวนหนึ่งจะส่งผลให้มีการแจกแจงจำนวนหัวที่มีความน่าจะเป็น ; แน่นอนว่าไม่ได้เป็นฟังก์ชั่นมวลความน่าจะเป็น! หรือที่ไม่จำนวนของหัวในแถวมีอะไรจะทำอย่างไรกับคำถาม 18,14,12,14,18
Dilip Sarwate
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.