มีตัวอย่างของตัวแปรที่กระจายตามปกติที่ * ไม่ * เนื่องจากทฤษฎีบทกลาง จำกัด หรือไม่


11

การแจกแจงแบบปกติดูเหมือนจะไม่ง่ายจนกว่าคุณจะเรียนรู้ CLT ซึ่งจะอธิบายว่าทำไมมันจึงแพร่หลายในชีวิตจริง แต่มันไม่เคยเกิดขึ้นในฐานะการกระจาย "ธรรมชาติ" สำหรับปริมาณบางอย่าง?


4
ทฤษฎีทางกายภาพของการแพร่กระจายในระดับที่ใช้ได้กับระบบใด ๆ ทำนายการแจกแจงแบบปกติของปริมาณ (เช่นอุณหภูมิหรือความเข้มข้น) ที่เกิดขึ้น ณ จุดหนึ่ง อันที่จริงมีหลายระบบที่กระจายตัว (ราคาตัวเลือกการขนส่งอนุภาคในสื่อที่เป็นเนื้อเดียวกัน ฯลฯ ) แสดงให้เห็นว่าตัวอย่างมากมายที่สมมติว่าไม่มีใครไร้เดียงสาว่าสมมติว่าการแจกแจงแบบปกติจะต้องมีค่าใหญ่หรือเล็กอย่างไม่สมจริง - นั่นจะเป็นความเข้าใจผิดของทฤษฎีทางกายภาพทั้งหมด
whuber

2
การแจกแจงแบบปกติดูเหมือนจะไม่ได้ใช้งานง่ายจนกว่าคุณจะรู้ว่ามันเพิ่มเอนโทรปีให้มากที่สุดภายใต้ข้อ จำกัด ของความแปรปรวนคงที่
leonbloy

คำตอบ:


11

ในระดับหนึ่งฉันคิดว่านี่อาจเป็นประเด็นทางปรัชญามากเท่ากับสถิติ

ปรากฏการณ์ที่เกิดขึ้นตามธรรมชาติจำนวนมากมีการกระจายตามปกติประมาณ เราสามารถโต้แย้งได้ว่าสาเหตุสำคัญของสิ่งนั้นอาจเป็นอะไรที่คล้ายกับ CLT หรือไม่:

  • ความสูงของคนอาจถูกพิจารณาว่าเป็นผลรวมของสาเหตุขนาดเล็กจำนวนมาก (อาจเป็นอิสระไม่น่าจะเหมือนกันกระจาย): ความยาวของกระดูกต่าง ๆ หรือผลลัพธ์ของการแสดงออกของยีนต่าง ๆ หรือผลลัพธ์ของอิทธิพลอาหารมากมายหรือการรวมกันทั้งหมดข้างต้น .

  • คะแนนการทดสอบอาจถูกพิจารณาว่าเป็นผลรวมของคะแนนสำหรับคำถามทดสอบแต่ละข้อ (อาจมีการกระจายตัวเหมือนกันและไม่น่าเป็นอิสระอย่างสิ้นเชิง)

  • ระยะทางที่อนุภาคเคลื่อนที่ในมิติเดียวซึ่งเป็นผลมาจากการเคลื่อนที่แบบบราวเนียนในของเหลว: การเคลื่อนที่อาจพิจารณาอย่างเป็นนามธรรมว่าเป็นการเดินแบบสุ่มซึ่งเกิดจากการสุ่มของ IID ที่ถูกสุ่มโดยโมเลกุล

(0,2π).ซึ่งคุณสามารถ google.] อย่างไรก็ตามพิกัด x และ y ปกติอาจถูกพิจารณาว่าเป็นผลรวมของความไม่ถูกต้องเล็ก ๆ จำนวนมากในการกำหนดเป้าหมายซึ่งอาจแสดงให้เห็นถึงกลไกที่เกี่ยวข้องกับ CLT ในพื้นหลัง

ในแง่ประวัติศาสตร์การใช้การแจกแจงแบบปกติ (เกาส์เซียน) แทนการแจกแจงแบบทวีคูณ (Laplace) เพื่อสังเกตแบบจำลองทางดาราศาสตร์อาจเป็นส่วนหนึ่งเนื่องจาก CLT ในวันแรก ๆ ของการทำแบบจำลองข้อผิดพลาดของการสังเกตดังกล่าวมีการถกเถียงกันระหว่าง Gauss และ Laplaceซึ่งแต่ละคนโต้เถียงกันถึงการกระจายตัวที่เขาโปรดปราน ด้วยเหตุผลต่าง ๆ แบบปกติได้รับรางวัล เราสามารถยืนยันได้ว่าเหตุผลหนึ่งที่ทำให้ความสำเร็จในท้ายที่สุดของการแจกแจงปกติคือความสะดวกสบายทางคณิตศาสตร์ตามข้อ จำกัด ปกติของ CLT เรื่องนี้ดูเหมือนจะเป็นจริงแม้ว่ามันจะไม่ชัดเจนว่าครอบครัวของการแจกแจงแบบไหนดีกว่า (ถึงตอนนี้ยังมีนักดาราศาสตร์ที่รู้สึกว่า"การสังเกตที่ดีที่สุด"สร้างขึ้นโดยนักดาราศาสตร์ผู้พิถีพิถันที่ได้รับการยกย่องว่ามีคุณค่าที่ดีกว่าค่าเฉลี่ยของการสังเกตการณ์หลายครั้งโดยผู้สังเกตการณ์ที่มีความสามารถน้อยกว่า ผลก็คือพวกเขาไม่ต้องการการแทรกแซงจากนักสถิติเลย)


อ๋อ ยังคงแก้ไขข้อผิดพลาด ขอบคุณที่สังเกตเห็นอันนี้ ข้อผิดพลาดเดียวกันใน 'คะแนนการทดสอบ' ได้รับการแก้ไขเช่นกัน
BruceET

-3

ตัวแปรที่เกิดขึ้นตามธรรมชาติจำนวนมากมักจะกระจายตัว ความสูงของมนุษย์? ขนาดของอาณานิคมสัตว์หรือไม่


1
@Happy จริง ๆ แล้วไม่มีตัวอย่างที่ให้ไว้ที่นี่เพราะการแจกแจงแบบปกติคือ -infinity ถึง + infinity และตัวอย่างที่ให้มาไม่เคยเป็นศูนย์หรือน้อยกว่า ในแต่ละกรณีการแจกแจงแบบปกติอาจเป็นการประมาณค่าที่มีประโยชน์ แต่ไม่ใช่ถ้าคุณสนใจที่ส่วนท้ายของการแจกแจง
JeremyC

2
ความสูงของมนุษย์เป็นผลมาจากผลรวมของยีนอิสระ (โดยประมาณ) ดังนั้นพวกเขาจึงเป็นเพราะ CLT
gardenhead

2
@ArtemMavrin: การได้ความสูงติดลบน่าจะเป็น 8+ ส่วนเบี่ยงเบนมาตรฐาน หากหนึ่งในวัตถุที่ประมาณปกติจะไม่ถูกต้องเพราะมันเป็นสถานที่ศูนย์มวลความน่าจะเกิน 8 SD ของคุณอาจรวมทั้งยังบ่นว่าอย่างแท้จริงคุ้มค่าการกระจายปกติไม่ลงตัวกับความน่าจะเป็นที่ 1 ยังวัดทั้งหมดของเรามีตัวเลขเหตุผล
หน้าผา AB

1
@ArtemMavrin: ดีถ้าคำถามคือสิ่งที่กระจายตามปกติอย่างแน่นอนคำตอบนั้นง่าย: ไม่มี rnorm(1)ไม่ได้ เช่นเดียวกันกับการแจกแจงทั้งหมดยกเว้น Multinomial
หน้าผา AB

2
n
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.