นักวิทยาศาสตร์ได้คำนวณรูปร่างของฟังก์ชันความหนาแน่นของความน่าจะเป็นกระจายแบบปกติได้อย่างไร


36

นี่อาจเป็นคำถามสมัครเล่น แต่ฉันสนใจว่านักวิทยาศาสตร์เกิดขึ้นได้อย่างไรกับรูปร่างของฟังก์ชันความหนาแน่นของความน่าจะเป็นการแจกแจงแบบปกติ โดยทั่วไปสิ่งที่ฉันเป็นคนนั้นอาจจะง่ายกว่าที่ฟังก์ชันความน่าจะเป็นของข้อมูลที่แจกแจงแบบปกติมีรูปร่างของรูปสามเหลี่ยมหน้าจั่วแทนที่จะเป็นรูปโค้งและคุณจะพิสูจน์ให้คนฟังก์ชั่นว่าความหนาแน่นของความน่าจะเป็นของ ข้อมูลที่กระจายตามปกติทั้งหมดมีรูปทรงระฆังหรือไม่ โดยการทดลอง? หรือโดยการคำนวณทางคณิตศาสตร์

ท้ายที่สุดแล้วเราจะพิจารณาข้อมูลที่กระจายไปตามปกติอย่างไร? ข้อมูลที่ตามหลังรูปแบบความน่าจะเป็นของการแจกแจงแบบปกติหรืออย่างอื่น?

โดยทั่วไปคำถามของฉันคือทำไมฟังก์ชั่นความหนาแน่นของความน่าจะเป็นการแจกแจงปกติมีรูปร่างเป็นรูปทรงระฆัง และนักวิทยาศาสตร์ได้จำแนกสถานการณ์จริงที่สามารถใช้การแจกแจงแบบปกติโดยการทดลองหรือการศึกษาธรรมชาติของข้อมูลต่าง ๆ ได้อย่างไร


ดังนั้นฉันจึงพบว่าลิงก์นี้มีประโยชน์จริง ๆ ในการอธิบายการได้มาของรูปแบบการทำงานของเส้นโค้งการแจกแจงแบบปกติและจึงตอบคำถามว่า อย่างน้อยก็มีเหตุผลสำหรับฉัน


2
ลองดูคำถามนี้ - ไม่จริงที่จะอ้างว่ามีเพียงการแจกแจงแบบปกติเท่านั้นคือ "รูประฆัง"
Silverfish

11
การแจกแจงแบบปกติมีคุณสมบัติทางสถิติที่สำคัญอย่างยิ่งซึ่งทำให้มันเป็นวัตถุพิเศษของการศึกษาและยังหมายความว่ามันมักจะเกิดขึ้น "ตามธรรมชาติ" เช่นเป็นกรณี จำกัด ของการแจกแจงแบบอื่น ดูโดยเฉพาะในทฤษฎีขีด จำกัด กลาง อย่างไรก็ตามมันไม่ได้เป็นเพียงการกระจายตัวที่ยอดเขาอยู่ตรงกลางและมีหางทั้งสองด้าน ผู้คนมักจะคิดว่าข้อมูลดังกล่าวเป็นเรื่องปกติเพราะฮิสโตแกรม "ดูเป็นรูประฆัง" แต่คำตอบที่เชื่อมโยงของฉันแสดงให้เห็นว่ามีการแจกแจงผู้สมัครอื่น ๆ อีกมากมายสำหรับชุดข้อมูลดังกล่าว
Silverfish

4
โปรดทราบว่านักสถิติไม่ได้ค้นพบการแจกแจงแบบปกติโดยดูที่ชุดข้อมูลจำนวนมากและการตระหนักถึงความหนาแน่นของฟังก์ชั่นนี้เป็นแบบอย่างที่ดีสำหรับหลาย ๆ คน ในขณะที่คุณสงสัยในคำถามของคุณมีกระบวนการตรวจสอบทางคณิตศาสตร์ของปัญหาบางอย่างในทฤษฎีความน่าจะเป็นซึ่งการแจกแจงแบบปกติ "ปรากฏออกมา" เป็นคำตอบ นี้เป็นอย่างดีเช่นการอธิบายในคำตอบนี้ที่นี่
Silverfish

3
และโดยทั่วไปถ้ามีคนขอให้ฉันอธิบายให้พวกเขาว่าทำไมการกระจายตัวแบบปกติ "ปกติ" ฉันต้องอธิบายให้พวกเขาทราบถึงประวัติของการกระจายตัวแบบปกติที่มีความยาวและซับซ้อนในตัวเองโดยเริ่มจากการกระจายตัวแบบทวินามเป็นต้น พิสูจน์ทฤษฎีบทขีด จำกัด กลางและแสดงให้เห็นว่าการแจกแจงแบบปกติสามารถนำไปใช้ในการศึกษาสถานการณ์ต่างๆในชีวิตจริงได้
ahra

5
คุณสามารถเห็นรูปร่างของการแจกแจงแบบปกติโดยใช้หนึ่งในอุปกรณ์ที่ดีที่เรียกว่ากระดาน Galton ที่จริงแล้วนั่นคือการกระจายตัวแบบทวินาม แต่คุณก็รู้ว่าทฤษฎีการ จำกัด ศูนย์กลาง
Federico Poloni

คำตอบ:


21

" วิวัฒนาการของการแจกแจงแบบปกติ " โดย SAUL STAHL เป็นแหล่งข้อมูลที่ดีที่สุดในการตอบคำถามทั้งหมดในโพสต์ของคุณ ฉันจะอ่านอีกสองสามจุดเพื่อความสะดวกของคุณเท่านั้นเพราะคุณจะพบกับการสนทนาอย่างละเอียดภายในบทความ

นี่อาจเป็นคำถามสมัครเล่น

ไม่มันเป็นคำถามที่น่าสนใจสำหรับทุกคนที่ใช้สถิติเพราะนี่ไม่ได้กล่าวถึงรายละเอียดในหลักสูตรมาตรฐาน

โดยทั่วไปสิ่งที่ฉันเป็นคนนั้นอาจจะง่ายกว่าที่ฟังก์ชันความน่าจะเป็นของข้อมูลที่แจกแจงแบบปกติมีรูปร่างของรูปสามเหลี่ยมหน้าจั่วแทนที่จะเป็นรูปโค้งและคุณจะพิสูจน์ให้คนฟังก์ชั่นว่าความหนาแน่นของความน่าจะเป็นของ ข้อมูลที่กระจายตามปกติทั้งหมดมีรูปทรงระฆังหรือไม่

ดูรูปนี้จากกระดาษ มันแสดงให้เห็นถึงเส้นโค้งข้อผิดพลาดที่ Simpson เกิดขึ้นก่อนที่จะค้นพบ Gaussian (Normal) เพื่อวิเคราะห์ข้อมูลการทดลอง ดังนั้นสัญชาตญาณของคุณคือจุดที่

ป้อนคำอธิบายรูปภาพที่นี่

โดยการทดลอง?

ใช่นั่นคือสาเหตุที่พวกเขาถูกเรียกว่า "เส้นโค้งข้อผิดพลาด" การทดลองเป็นการวัดทางดาราศาสตร์ นักดาราศาสตร์ต่อสู้กับข้อผิดพลาดในการวัดมานานหลายศตวรรษ

หรือโดยการคำนวณทางคณิตศาสตร์

อีกครั้งใช่! เรื่องสั้นเรื่องยาว: การวิเคราะห์ข้อผิดพลาดในข้อมูลทางดาราศาสตร์ทำให้เกาส์ต้องเผชิญกับการแจกแจงของเขา นี่คือสมมติฐานที่เขาใช้:

ป้อนคำอธิบายรูปภาพที่นี่

โดยวิธีการ Laplace ใช้วิธีที่แตกต่างกันไม่กี่และยังมาพร้อมกับการกระจายของเขาด้วยในขณะที่ทำงานกับข้อมูลทางดาราศาสตร์:

ป้อนคำอธิบายรูปภาพที่นี่

สำหรับสาเหตุที่การแจกแจงปกติแสดงในการทดลองว่าเป็นข้อผิดพลาดในการวัดนี่เป็นคำอธิบายโดยทั่วไปที่นักฟิสิกส์ "มือหยัก" ใช้เพื่อให้ (อ้างจาก Gerhard Bohm, Günter Zech, สถิติเบื้องต้นและการวิเคราะห์ข้อมูลสำหรับนักฟิสิกส์หน้า 85):

สัญญาณการทดลองจำนวนมากปฏิบัติตามการกระจายตัวแบบปกติที่ดีมาก นี่เป็นเพราะความจริงที่ว่าพวกเขาประกอบด้วยผลรวมของการมีส่วนร่วมจำนวนมากและเป็นผลมาจากทฤษฎีบทขีด จำกัด กลาง


2
การอ้างอิง Stahl ตอบคำถามต้นฉบับมากจากมุมที่มันถูกวางจาก - เป็นการค้นหาที่ดีจริงๆ
Silverfish

44

คุณดูเหมือนจะคิดในคำถามของคุณว่าแนวคิดของการแจกแจงแบบปกติอยู่ก่อนที่จะมีการแจกแจงและผู้คนพยายามที่จะเข้าใจว่ามันคืออะไร ยังไม่ชัดเจนสำหรับฉันว่ามันจะทำงานอย่างไร [แก้ไข: มีอย่างน้อยหนึ่งความรู้สึกที่เราอาจพิจารณาว่ามี "ค้นหาการแจกจ่าย" แต่ไม่ใช่ "การค้นหาการแจกแจงที่อธิบายปรากฏการณ์มากมาย"]

กรณีนี้ไม่ได้; การกระจายเป็นที่รู้จักกันก่อนที่จะถูกเรียกว่าการกระจายปกติ

คุณจะพิสูจน์ให้คน ๆ นั้นฟังก์ชั่นอย่างไรว่าความหนาแน่นของความน่าจะเป็นของข้อมูลที่แจกแจงแบบปกติทั้งหมดมีรูปทรงระฆัง

ฟังก์ชั่นการแจกแจงแบบปกติคือสิ่งที่มีสิ่งที่เรียกว่า "รูปทรงระฆัง" - การแจกแจงแบบปกติทั้งหมดจะมี "รูปร่าง" ที่เหมือนกัน

ข้อมูลสามารถกระจาย "รูประฆัง" ได้มากขึ้นหรือน้อยลง แต่นั่นไม่ได้ทำให้เป็นเรื่องปกติ การแจกแจงแบบไม่ปกติจำนวนมากมีลักษณะคล้าย "รูประฆัง"

การกระจายตัวของประชากรจริงที่ดึงมาจากข้อมูลนั้นไม่น่าจะเป็นเรื่องปกติ แต่บางครั้งมันก็เป็นการประมาณที่สมเหตุสมผล

นี่เป็นเรื่องจริงของการแจกแจงเกือบทั้งหมดที่เราใช้กับสิ่งต่าง ๆ ในโลกแห่งความจริง - เป็นแบบจำลองไม่ใช่ข้อเท็จจริงเกี่ยวกับโลก [เป็นตัวอย่างถ้าเรากำหนดสมมติฐานบางอย่าง (สำหรับกระบวนการปัวซง) เราสามารถหาการแจกแจงปัวซง - การกระจายที่ใช้กันอย่างแพร่หลาย แต่สมมติฐานเหล่านั้นเคยพอใจแน่นอนหรือไม่? โดยทั่วไปแล้วสิ่งที่ดีที่สุดที่เราสามารถพูดได้ (ในสถานการณ์ที่เหมาะสม) คือพวกเขาเกือบเป็นจริง]

จริง ๆ แล้วเราพิจารณาข้อมูลที่กระจายแบบทั่วไปอย่างไร ข้อมูลที่ตามหลังรูปแบบความน่าจะเป็นของการแจกแจงแบบปกติหรืออย่างอื่น?

ใช่เพื่อกระจายตามปกติจริง ๆแล้วประชากรที่ดึงตัวอย่างมาจะต้องมีการแจกแจงที่มีรูปแบบการทำงานที่แน่นอนของการแจกแจงปกติ เป็นผลให้ประชากรที่ จำกัด ใด ๆ ไม่สามารถเป็นปกติได้ ตัวแปรที่จำเป็นต้องมีขอบเขตไม่สามารถเป็นปกติได้ (ตัวอย่างเช่นเวลาที่ใช้สำหรับภารกิจเฉพาะความยาวของสิ่งต่าง ๆ ไม่สามารถเป็นลบได้ดังนั้นจึงไม่สามารถกระจายได้ตามปกติ)

มันอาจจะเป็นเรื่องที่เข้าใจง่ายกว่าฟังก์ชั่นความน่าจะเป็นของข้อมูลที่แจกแจงแบบปกติมีรูปร่างของสามเหลี่ยมหน้าจั่ว

ฉันไม่เห็นว่าทำไมสิ่งนี้จึงง่ายกว่า มันง่ายกว่าอย่างแน่นอน

เมื่อมีการพัฒนาแบบจำลองสำหรับการแจกแจงความผิดพลาดครั้งแรก (โดยเฉพาะสำหรับดาราศาสตร์ในช่วงแรก ๆ ) นักคณิตศาสตร์ได้พิจารณาความหลากหลายของรูปทรงที่สัมพันธ์กับการแจกแจงข้อผิดพลาด (รวมถึงจุดแรกคือการกระจายสามเหลี่ยม) กว่าปรีชา) ที่ใช้ Laplace มองไปที่การแจกแจงแบบเอ็กซ์โพเนนเชียลและการแจกแจงแบบปกติ ในทำนองเดียวกัน Gauss ใช้คณิตศาสตร์เพื่อให้ได้มาในเวลาเดียวกัน แต่ในความสัมพันธ์กับชุดของการพิจารณาที่แตกต่างกว่า Laplace ได้

ในแง่ที่แคบที่ Laplace และ Gauss กำลังพิจารณา "การแจกแจงข้อผิดพลาด" เราอาจคิดว่าเป็น "การค้นหาการแจกแจง" อย่างน้อยก็สักครั้ง ทั้งสองอ้างถึงคุณสมบัติบางอย่างสำหรับการแจกแจงข้อผิดพลาดที่พวกเขาถือว่าสำคัญ (Laplace พิจารณาลำดับของเกณฑ์ที่แตกต่างกันไปตามเวลา) นำไปสู่การแจกแจงที่แตกต่างกัน

โดยทั่วไปคำถามของฉันคือทำไมฟังก์ชั่นความหนาแน่นของความน่าจะเป็นการแจกแจงปกติมีรูปร่างเป็นรูปทรงระฆัง

รูปแบบการทำงานของสิ่งที่เรียกว่าฟังก์ชั่นความหนาแน่นปกติให้รูปร่างนั้น พิจารณามาตรฐานปกติ (สำหรับความเรียบง่ายปกติทุก ๆ คนมีรูปร่างเหมือนกันแตกต่างกันตามขนาดและตำแหน่ง):

Z(Z)=kอี-12Z2;-<Z<

k

x

ในขณะที่บางคนมองว่าการกระจายตัวแบบปกตินั้นเป็น "ปกติ" แต่ก็มีเฉพาะในบางสถานการณ์ที่คุณมักจะมองว่าเป็นการประมาณ


การค้นพบของการแจกแจงมักจะให้เครดิตกับเดอโมเวร (เป็นการประมาณค่ากับทวินาม) เขาได้รับแบบฟอร์มการทำงานเมื่อพยายามประมาณค่าสัมประสิทธิ์ทวินาม (/ ความน่าจะเป็นแบบทวินาม) เพื่อการคำนวณที่น่าเบื่ออย่างอื่น แต่ - ในขณะที่เขาทำรูปแบบของการแจกแจงแบบปกติได้อย่างมีประสิทธิภาพ - เขาดูเหมือนจะไม่คิดเกี่ยวกับ การกระจายความน่าจะเป็นถึงแม้ว่าผู้เขียนบางคนแนะนำให้เขาทำ จำเป็นต้องมีการตีความจำนวนหนึ่งดังนั้นจึงมีขอบเขตสำหรับความแตกต่างในการตีความนั้น

เกาส์และลาปลาซทำงานในช่วงต้นปี 1800; Gauss เขียนเกี่ยวกับเรื่องนี้ใน 1809 (เกี่ยวข้องกับการกระจายที่หมายถึง MLE ของศูนย์) และ Laplace ใน 1,810, เป็นการประมาณการกระจายจำนวนสุ่มตัวแปรสมมาตร. สิบปีต่อมา Laplace ให้ทฤษฎีบทขีด จำกัด กลางแบบต้นสำหรับการแยกและสำหรับตัวแปรต่อเนื่อง

ชื่อต้นสำหรับการจัดจำหน่ายรวมถึงกฎหมายของข้อผิดพลาดที่กฎหมายของความถี่ของข้อผิดพลาดและมันก็ยังเป็นชื่อหลังจากที่ทั้งสอง Laplace และ Gauss บางครั้งร่วมกัน

คำว่า "ปกติ" ถูกนำมาใช้เพื่ออธิบายการกระจายอย่างอิสระโดยนักเขียนสามคนที่แตกต่างกันในยุค 1870 (Peirce, Lexis และ Galton) เป็นครั้งแรกในปี 1873 และอีกสองคนในปี 1877 นี่เป็นเวลากว่าหกสิบปี Laplace และมากกว่าสองเท่านับตั้งแต่การประมาณของ Moivre การใช้งานของ Galton อาจมีอิทธิพลมากที่สุด แต่เขาใช้คำว่า "ปกติ" ในความสัมพันธ์กับมันเพียงครั้งเดียวในการทำงาน 1877 (ส่วนใหญ่เรียกมันว่า "กฎแห่งการเบี่ยงเบน")

อย่างไรก็ตามในยุค 1880 Galton ใช้คำคุณศัพท์ "ปกติ" ที่เกี่ยวข้องกับการกระจายหลายครั้ง (เช่น "เส้นโค้งปกติ" ในปี 1889) และเขาก็มีอิทธิพลอย่างมากต่อนักสถิติต่อมาในสหราชอาณาจักร (โดยเฉพาะคาร์ลเพียร์สัน ) เขาไม่ได้พูดว่าทำไมเขาถึงใช้คำว่า "ปกติ" ในลักษณะนี้ แต่น่าจะหมายถึงมันในแง่ของ "ปกติ" หรือ "ปกติ"

การใช้วลีแรกอย่างชัดเจนว่า "การแจกแจงแบบปกติ" ปรากฏโดย Karl Pearson; เขาใช้มันอย่างแน่นอนในปี 1894 แม้ว่าเขาจะอ้างว่าเคยใช้มันมานานก่อนหน้า (คำกล่าวอ้างที่ฉันจะดูด้วยความระมัดระวัง)


อ้างอิง:

มิลเลอร์เจฟฟ์
"การใช้คำศัพท์คณิตศาสตร์ที่เก่าแก่ที่สุด:"
การแจกแจงแบบปกติ (รายการโดย John Aldrich)
http://jeff560.tripod.com/n.html

Stahl, Saul (2006),
"วิวัฒนาการของการแจกแจงแบบปกติ",
นิตยสารคณิตศาสตร์ , ฉบับที่ 79, ฉบับที่ 2 (เมษายน), pp 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf

การแจกแจงแบบปกติ, (2016, 1 สิงหาคม)
ในวิกิพีเดียสารานุกรมเสรี
สืบค้น 12:02, 3 สิงหาคม 2016, จาก
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History

Hald, A (2007),
"De Moivre's Normal Approximation to Binomial, 2276, และลักษณะทั่วไป",
ใน: ประวัติความเป็นมาของการอนุมานเชิงสถิติเชิงสถิติจากเบอร์นูลลีถึงชาวประมง, ค.ศ. 1713–1935; หน้า 17-24

[คุณอาจสังเกตเห็นความแตกต่างอย่างมากระหว่างแหล่งข้อมูลเหล่านี้ที่เกี่ยวข้องกับบัญชีของพวกเขาของ de Moivre]


ขอบคุณสำหรับคำตอบในเชิงลึก! ฉันได้ดูเพิ่มเติมว่ารูปร่างของการแจกแจงแบบปกติได้รับมาอย่างไรและฉันพบเอกสารหลักสูตรนี้แล้วncssm.edu/math/Talks/PDFS/normal.pdfและฉันมีปัญหาในการทำความเข้าใจว่าเราจะสามารถสรุปได้อย่างไร ข้อผิดพลาดไม่ได้ขึ้นอยู่กับการวางแนวของระบบพิกัด (ข้อสันนิษฐานที่ช่วยให้ได้ข้อสรุปที่สำคัญในภายหลัง) เมื่อฉันคิดว่าข้อสันนิษฐานดังกล่าวจะเก็บตัวอย่างของลูกดอก แต่ไม่ใช่ในตัวอย่างของข้อผิดพลาดจากการทดลองโดยไม่ตั้งใจ .
ahra

จริงๆแล้ววิธีปาเป้าทั้งหมดทำให้ฉันสับสนเพราะฉันกำลังศึกษาการแจกแจงแบบปกติในบริบทของข้อผิดพลาดจากการทดลองโดยไม่ตั้งใจ ฉันเดาว่าวิธีปาเป้าถือว่าคุณสามารถสร้างข้อผิดพลาดอิสระในสองมิติซึ่งใช้ได้ในบริบทที่ใช้ แต่ไม่ชัดเจนสำหรับฉันว่ามันจะแปลอะไรในบริบทของข้อผิดพลาดในการทดลองที่คุณมีตัวแปรตามและตัวแปรอิสระ ซึ่งหมายความว่าคุณสามารถสร้างข้อผิดพลาดได้ในมิติเดียวเท่านั้น
ahra

1
ใช้การอ้างอิงที่ยอดเยี่ยม +1
Aaron Hall

2
ฉันคิดว่าควรจะพูดถึง "ทฤษฎีขีด จำกัด กลาง" ที่นี่ที่ใดที่หนึ่งเนื่องจาก OP ดูเหมือนว่า (อย่างน้อยก็ในบางส่วน) ที่จะถามว่าทำไมการกระจายเฉพาะนี้จึงแพร่หลาย
เกม

1
@joc ฉันไม่เห็นคำถามที่ถามเกี่ยวกับความชุกหรือแม้แต่การแนะนำคำถามเกี่ยวกับมัน อย่างไรก็ตามฉันพูดคุยเกี่ยวกับงานของ de Moivre เกี่ยวกับทวินามและงานของ Laplace เกี่ยวกับการประมาณค่าปกติสำหรับผลรวมของตัวแปรสุ่มแบบสมมาตร ... ซึ่งเกี่ยวข้องกับคำถามโดยตรงมากกว่า อย่างไรก็ตามฉันจะเพิ่มประโยคที่เกี่ยวข้องกับงานของ Laplace เกี่ยวกับปัญหา (แม้ว่ามันจะไม่ถูกเรียกว่าสำหรับศตวรรษอื่น)
Glen_b

11

การแจกแจง "ปกติ" ถูกกำหนดให้เป็นการแจกจ่ายแบบนั้น

คำถามคือทำไมเราคาดหวังว่าการแจกแจงแบบนี้จะเป็นเรื่องธรรมดาและทำไมมันจึงถูกใช้เพื่อการประมาณค่าแม้ว่าข้อมูลจริงจะไม่เป็นไปตามการกระจายนั้น (ข้อมูลจริงมักจะพบว่ามี "ไขมันหาง" เช่นค่าที่อยู่ห่างจากค่าเฉลี่ยนั้นเป็นเรื่องธรรมดามากกว่าการแจกแจงแบบปกติที่จะทำนาย)

เพื่อบอกอีกวิธีหนึ่งแล้วอะไรคือความพิเศษของการกระจายตัวแบบปกติ?

ปกติมีคุณสมบัติทางสถิติ "ดี" จำนวนมาก (ดูตัวอย่างเช่นhttps://en.wikipedia.org/wiki/Central_limit_theorem ) แต่ IMO ที่เกี่ยวข้องมากที่สุดคือความจริงที่ว่าเป็นฟังก์ชัน "เอนโทรปีสูงสุด" สำหรับการแจกจ่ายใด ๆ ที่มี ค่าเฉลี่ยและความแปรปรวนที่ระบุ https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

เพื่อแสดงสิ่งนี้ในภาษาธรรมดาถ้าคุณได้รับเฉพาะค่าเฉลี่ย (จุดศูนย์กลาง) และความแปรปรวน (ความกว้าง) ของการแจกแจงและคุณไม่คิดว่าจะมีอะไรเกี่ยวข้องกับมันคุณจะถูกบังคับให้วาดการแจกแจงแบบปกติ สิ่งอื่นใดต้องการข้อมูลเพิ่มเติม (ในแง่ของทฤษฎีสารสนเทศของแชนนอน ) เช่นความเบ้เพื่อพิจารณา

หลักการของเอนโทรปีสูงสุดได้รับการแนะนำโดย ET Jaynes เป็นวิธีในการกำหนดนักบวชที่สมเหตุสมผลในการอนุมานแบบเบย์และฉันคิดว่าเขาเป็นคนแรกที่ดึงดูดความสนใจไปยังสถานที่นี้

ดูสิ่งนี้สำหรับการอภิปรายเพิ่มเติม: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/documents/tutorials/Gaussian-distribution.pdf


6
"ในคำอื่น ๆ หากคุณได้รับเฉพาะค่าเฉลี่ย (จุดศูนย์กลาง) และความแปรปรวน (ความกว้าง) ของการแจกแจงและคุณไม่คิดว่าจะมีอะไรเกี่ยวข้องกับมันคุณจะถูกบังคับให้วาดการแจกแจงแบบปกติ" ฉันเดาว่าขึ้นอยู่กับความหมายของคำว่า "ถูกบังคับ" คุณอาจถูกบังคับ ฉันจะไม่เป็น สิ่งที่คุณอธิบายคือความเท่าเทียมทางศีลธรรมของการ "ถูกบังคับ" เพื่อให้ฟังก์ชั่นเป็นเส้นตรงเมื่อคุณไม่ทราบรูปแบบของมันหรือตัวแปรสุ่มนั้นมีความเป็นอิสระเมื่อคุณไม่รู้จักการพึ่งพาที่แน่นอน ฉันไม่ได้ไม่ใช่และจะไม่ถูกบังคับให้ตั้งสมมติฐานใด ๆ เหล่านี้
Mark L. Stone

5
@ Neil ฉันเชื่อว่าส่วนหนึ่งของประเด็นของ Mark อาจเป็นเพราะการให้เหตุผลไม่ใช่การบังคับ
whuber

5
@ Neil ไกลจากมัน! ก่อนอื่นคุณต้องสมมติว่าหลักการของเอนโทรปีสูงสุดนั้นมีประโยชน์และเหมาะสมกับปัญหาทางสถิติของคุณ ต่อไปคุณจะต้องแน่ใจอย่างแน่นอนไม่มีอะไรอื่นที่คุณสามารถสันนิษฐานได้เกี่ยวกับการกระจาย ทั้งสองอย่างนั้นมีปัญหา (ในปัญหาทางสถิติส่วนใหญ่ที่ฉันพบ - นอกขอบเขตของฟิสิกส์ทฤษฎี - อดีตไม่จริงและฉันไม่เคยเห็นปัญหาโลกแห่งความจริงที่หลังเป็นกรณี)
whuber

1
@Neil Mark และ whuber ฉันได้พยายามอธิบายย่อหน้านั้น ฉันคิดว่า "ไม่ต้องคิดอะไรอย่างอื่นเลย" เป็นคำอธิบายภาษาปกติที่สมเหตุสมผลว่าหลักการของเอนโทรปีสูงสุดกำลังพยายามทำอะไร แน่นอนว่าเป็นภาษาธรรมดาที่คุณสามารถตีความได้อย่างแตกต่าง นั่นคือเหตุผลที่เราต้องการคณิตศาสตร์ ข้อความที่แม่นยำยิ่งขึ้นคือเราไม่ได้เพิ่มข้อมูลใด ๆ ในแง่ของแชนนอน ลิงก์อธิบายเพิ่มเติม
gareth

1
@gareth การกระจายที่เหมือนกันใน reals ทั้งหมด (ซึ่งฉันคิดว่าคุณหมายถึงในความคิดเห็นล่าสุดของคุณ) จะเป็นการกระจายที่ไม่เหมาะสมอย่างมาก การเรียกร้องค่าเอนโทรปีสูงสุดของคุณในฐานะคนขับของคุณไปสู่การแจกแจงแบบปกตินั้นเป็นข้อสันนิษฐานที่สำคัญ เหตุใดจึงมีพลังมากกว่าการคาดเดาอย่างอื่นเช่นช่วงต่ำสุด
Henry

3

การแจกแจงแบบปกติ (หรือที่รู้จักกันว่า "การกระจายแบบเกาส์เซียน ") มีรากฐานทางคณิตศาสตร์ที่มั่นคง ทฤษฎีขีด จำกัด กลางกล่าวว่าถ้าคุณมีชุด จำกัด ของ n ที่เป็นอิสระและกระจายกันตัวแปรสุ่มที่มีความหมายที่เฉพาะเจาะจงและความแปรปรวนของและคุณใช้เวลาเฉลี่ยของตัวแปรสุ่มผู้กระจายของผลที่จะมาบรรจบกันเพื่อกระจายเสียนเป็น n ไปที่อินฟินิตี้ ไม่มีการคาดเดาที่นี่เนื่องจากการคำนวณทางคณิตศาสตร์นำไปสู่ฟังก์ชันการแจกแจงเฉพาะนี้และไม่มีสิ่งอื่นใด

ในการทำให้สิ่งนี้เป็นเงื่อนไขที่จับต้องได้มากขึ้นให้พิจารณาตัวแปรสุ่มเดียวเช่นการพลิกเหรียญที่ยุติธรรม (2 ผลลัพธ์ที่เป็นไปได้เท่า ๆ กัน) อัตราต่อรองของการได้รับผลลัพธ์เฉพาะคือ 1/2 สำหรับหัวและ 1/2 สำหรับก้อย

หากคุณเพิ่มจำนวนเหรียญและติดตามจำนวนหัวทั้งหมดที่ได้รับในแต่ละการทดลองคุณจะได้รับการแจกแจงแบบทวินามซึ่งมีรูประฆังประมาณคร่าวๆ เพียงกราฟที่มีจำนวนหัวตามแกน x และจำนวนครั้งที่คุณพลิกหัวนั้นตามแกน y

ยิ่งคุณใช้เหรียญมากเท่าไหร่และยิ่งคุณพลิกเหรียญได้มากเท่าไหร่กราฟที่อยู่ใกล้ยิ่งมากขึ้นก็จะดูเหมือนกราฟเกาส์เกาส์ นั่นคือสิ่งที่ทฤษฎีขีด จำกัด กลางยืนยัน

สิ่งที่น่าทึ่งก็คือทฤษฎีบทไม่ได้ขึ้นอยู่กับการกระจายตัวของตัวแปรสุ่มเพียงตราบเท่าที่ตัวแปรสุ่มแต่ละตัวมีการแจกแจงแบบเดียวกัน แนวคิดหลักอย่างหนึ่งในทฤษฎีบทคือคุณกำลังเพิ่มหรือหาค่าตัวแปรสุ่มโดยเฉลี่ย แนวคิดที่สำคัญอีกข้อหนึ่งคือทฤษฎีบทนี้อธิบายถึงขีด จำกัดทางคณิตศาสตร์ในขณะที่จำนวนตัวแปรสุ่มมีขนาดใหญ่ขึ้นเรื่อย ๆ ยิ่งคุณใช้ตัวแปรมากเท่าไหร่การแจกแจงก็จะเข้าใกล้การแจกแจงแบบปกติ

ฉันขอแนะนำให้คุณเข้าเรียนคณิตศาสตร์สถิติหากคุณต้องการดูว่านักคณิตศาสตร์ระบุว่าการกระจายปกติเป็นฟังก์ชันที่ถูกต้องทางคณิตศาสตร์สำหรับเส้นโค้งระฆัง


ขอขอบคุณสำหรับการสนับสนุนของคุณ. มันจะถูกต้องถ้าคุณต้องอธิบายว่าการกระจายของผลรวม (หรือค่าเฉลี่ย) จะต้องเป็นมาตรฐาน มิฉะนั้นการกระจายตัวของผลรวมไม่ใกล้ถึงขีด จำกัด และการกระจายของค่าเฉลี่ยเข้าใกล้คงที่ แต่โพสต์นี้จะตอบคำถามที่ถูกวางอย่างไร (เป็นที่ยอมรับมีคำถามมากมายที่ถูกโพสต์และพวกเขาทั้งหมดสับสนและคลุมเครือ แต่ดูเหมือนพวกเขาจะถามว่าสูตรสำหรับ Gaussian PDF ถูกค้นพบหรือได้มา)
whuber

2

มีบางคำตอบที่ยอดเยี่ยมในหัวข้อนี้ ฉันอดไม่ได้ที่จะรู้สึกว่า OP ไม่ได้ถามคำถามเดียวกันกับที่ทุกคนต้องการที่จะตอบ อย่างไรก็ตามฉันได้รับเพราะใกล้เคียงกับการเป็นหนึ่งในคำถามที่น่าตื่นเต้นที่สุดที่จะตอบ - ฉันพบจริงเพราะฉันหวังว่าบางคนมีคำถาม "เราจะรู้ PDF ปกติเป็น PDF ได้อย่างไร" และฉันค้นหามัน แต่ฉันคิดว่าคำตอบสำหรับคำถามอาจแสดงให้เห็นที่มาของการแจกแจงแบบปกติ

nnnพีnพี(1-พี)n

nพี0nพี=1

n=10พี=0.5n=100พี=0.5n

ถ้าฉันทิ้ง 100 เหรียญลงบนพื้นในตอนนี้และนับจำนวนที่ฉันได้รับฉันอาจนับ 0 หัวหรือฉันอาจนับ 100 หัวได้ แต่ฉันมีแนวโน้มที่จะนับตัวเลขในที่ใดที่หนึ่งมากกว่า คุณเห็นหรือไม่ว่าทำไมฮิสโตแกรมนี้จึงควรเป็นรูประฆัง


+1 - อย่างไรก็ตามโปรดทราบว่าฉันพูดคุยเกี่ยวกับเด Moivre ในหลายส่วนของคำตอบของฉัน คุณอาจพบบันทึกสุดท้ายในคำตอบของฉันเกี่ยวกับความคลาดเคลื่อนในการอ้างอิงที่น่าสนใจ - จริง ๆ แล้วมันคุ้มค่าที่จะดูว่าเดอโมอิฟเขียนอะไรเพื่อดูขอบเขตของลักษณะงานของเขาที่แตกต่างกัน การอภิปรายเฉพาะเกี่ยวกับสาเหตุที่ com binomial มีการประมาณที่ดีโดย cdf ปกติภายใต้เงื่อนไขที่เหมาะสมถูกกล่าวถึงในเหตุใดรูประฆังคู่จึงกระจายตัว
Glen_b

1

จะกล่าวถึง Maxwell-Herschel ที่มาของการกระจายปกติหลายตัวแปรอิสระจากสองสมมติฐาน:

  1. การกระจายไม่ได้รับผลกระทบจากการหมุนของเวกเตอร์

  2. ส่วนประกอบของเวกเตอร์มีความเป็นอิสระ

นี่คือคำอธิบายโดยเจย์เนส

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.