การแจกแจงแบบปกติดูเหมือนจะไม่ง่ายจนกว่าคุณจะเรียนรู้ CLT ซึ่งจะอธิบายว่าทำไมมันจึงแพร่หลายในชีวิตจริง แต่มันไม่เคยเกิดขึ้นในฐานะการกระจาย "ธรรมชาติ" สำหรับปริมาณบางอย่าง?
การแจกแจงแบบปกติดูเหมือนจะไม่ง่ายจนกว่าคุณจะเรียนรู้ CLT ซึ่งจะอธิบายว่าทำไมมันจึงแพร่หลายในชีวิตจริง แต่มันไม่เคยเกิดขึ้นในฐานะการกระจาย "ธรรมชาติ" สำหรับปริมาณบางอย่าง?
คำตอบ:
ในระดับหนึ่งฉันคิดว่านี่อาจเป็นประเด็นทางปรัชญามากเท่ากับสถิติ
ปรากฏการณ์ที่เกิดขึ้นตามธรรมชาติจำนวนมากมีการกระจายตามปกติประมาณ เราสามารถโต้แย้งได้ว่าสาเหตุสำคัญของสิ่งนั้นอาจเป็นอะไรที่คล้ายกับ CLT หรือไม่:
ความสูงของคนอาจถูกพิจารณาว่าเป็นผลรวมของสาเหตุขนาดเล็กจำนวนมาก (อาจเป็นอิสระไม่น่าจะเหมือนกันกระจาย): ความยาวของกระดูกต่าง ๆ หรือผลลัพธ์ของการแสดงออกของยีนต่าง ๆ หรือผลลัพธ์ของอิทธิพลอาหารมากมายหรือการรวมกันทั้งหมดข้างต้น .
คะแนนการทดสอบอาจถูกพิจารณาว่าเป็นผลรวมของคะแนนสำหรับคำถามทดสอบแต่ละข้อ (อาจมีการกระจายตัวเหมือนกันและไม่น่าเป็นอิสระอย่างสิ้นเชิง)
ระยะทางที่อนุภาคเคลื่อนที่ในมิติเดียวซึ่งเป็นผลมาจากการเคลื่อนที่แบบบราวเนียนในของเหลว: การเคลื่อนที่อาจพิจารณาอย่างเป็นนามธรรมว่าเป็นการเดินแบบสุ่มซึ่งเกิดจากการสุ่มของ IID ที่ถูกสุ่มโดยโมเลกุล
ซึ่งคุณสามารถ google.] อย่างไรก็ตามพิกัด x และ y ปกติอาจถูกพิจารณาว่าเป็นผลรวมของความไม่ถูกต้องเล็ก ๆ จำนวนมากในการกำหนดเป้าหมายซึ่งอาจแสดงให้เห็นถึงกลไกที่เกี่ยวข้องกับ CLT ในพื้นหลัง
ในแง่ประวัติศาสตร์การใช้การแจกแจงแบบปกติ (เกาส์เซียน) แทนการแจกแจงแบบทวีคูณ (Laplace) เพื่อสังเกตแบบจำลองทางดาราศาสตร์อาจเป็นส่วนหนึ่งเนื่องจาก CLT ในวันแรก ๆ ของการทำแบบจำลองข้อผิดพลาดของการสังเกตดังกล่าวมีการถกเถียงกันระหว่าง Gauss และ Laplaceซึ่งแต่ละคนโต้เถียงกันถึงการกระจายตัวที่เขาโปรดปราน ด้วยเหตุผลต่าง ๆ แบบปกติได้รับรางวัล เราสามารถยืนยันได้ว่าเหตุผลหนึ่งที่ทำให้ความสำเร็จในท้ายที่สุดของการแจกแจงปกติคือความสะดวกสบายทางคณิตศาสตร์ตามข้อ จำกัด ปกติของ CLT เรื่องนี้ดูเหมือนจะเป็นจริงแม้ว่ามันจะไม่ชัดเจนว่าครอบครัวของการแจกแจงแบบไหนดีกว่า (ถึงตอนนี้ยังมีนักดาราศาสตร์ที่รู้สึกว่า"การสังเกตที่ดีที่สุด"สร้างขึ้นโดยนักดาราศาสตร์ผู้พิถีพิถันที่ได้รับการยกย่องว่ามีคุณค่าที่ดีกว่าค่าเฉลี่ยของการสังเกตการณ์หลายครั้งโดยผู้สังเกตการณ์ที่มีความสามารถน้อยกว่า ผลก็คือพวกเขาไม่ต้องการการแทรกแซงจากนักสถิติเลย)
ตัวแปรที่เกิดขึ้นตามธรรมชาติจำนวนมากมักจะกระจายตัว ความสูงของมนุษย์? ขนาดของอาณานิคมสัตว์หรือไม่
rnorm(1)
ไม่ได้ เช่นเดียวกันกับการแจกแจงทั้งหมดยกเว้น Multinomial