เมื่อสอนสถิติให้ใช้ "ปกติ" หรือ "เกาส์เซียน"?


42

ฉันใช้ "การกระจายแบบเกาส์" เป็นส่วนใหญ่ในหนังสือของฉัน แต่มีคนแนะนำว่าฉันเปลี่ยนเป็น "การกระจายแบบปกติ" ฉันทามติใดที่คำว่าจะใช้สำหรับผู้เริ่มต้น

แน่นอนว่าคำทั้งสองนี้เป็นคำพ้องความหมายดังนั้นนี่ไม่ใช่คำถามเกี่ยวกับเนื้อหา แต่เป็นเรื่องที่ใช้กันอย่างแพร่หลาย และแน่นอนฉันใช้ทั้งสองคำ แต่สิ่งที่ควรใช้เป็นส่วนใหญ่?


1
มีส่วนตัวอย่าง / บทตัวอย่างของหนังสือของคุณที่อื่นบ้างไหม? ฉันได้ยินสิ่งดีๆเกี่ยวกับมัน
Glen_b

2
@Glen_b คุณลักษณะ "ดูภายใน" ของ amazon.com ให้คุณดูตัวอย่างหนังสือ นอกจากนี้ยังมีสามบทที่มีอยู่ที่นี่: สัญชาตญาณของเรา /
ผู้เชี่ยวชาญ

6
ปัญหาของการ "ซึ่งระยะเป็นมากขึ้นที่ใช้กันทั่วไป" ได้อย่างง่ายดายสามารถ addressed แม้ว่าหยาบ: ค้นหาของ "เกาส์" จัดจำหน่ายของ Google มีประมาณ 2/3 ของความนิยมของการค้นหาสำหรับ "การกระจายปกติ." อัตราส่วนจะแตกต่างกันเล็กน้อยใน Google Scholar ซึ่งตอนนี้ "การกระจายแบบเกาส์" มีจำนวนการเข้าชมครึ่งหนึ่งของ "การกระจายแบบปกติ" (แต่เพียงหนึ่งในสี่เมื่อไม่รวม "การผกผัน") ผลลัพธ์เหล่านี้แนะนำ (1) "ปกติ" ได้รับความนิยมมากกว่า แต่ (2) "เกาส์เซียน" ได้รับการยอมรับอย่างกว้างขวาง การดูผลลัพธ์แสดงให้เห็นว่าวลีเช่น "asymptotically normal" อาจใช้เวลานานกว่าจะถูกแทนที่ถ้าเคย
whuber

2
ในส่วนขยายของ @whuber ฉันคิดว่ายังมีความแตกต่างระหว่างสาขา: "Gaussian" ดูเหมือนจะค่อนข้างเด่นกว่าในทางวิทยาศาสตร์ในขณะที่ "ปกติ" ดูเหมือนจะเป็นคำปกติในด้านสังคมศาสตร์ ...
abaumann

1
ลอง "ผิดปกติ": P
Mehrdad

คำตอบ:


47

แม้ว่าฉันมักจะพูดว่า 'ปกติ' บ่อยกว่า (เนื่องจากเป็นสิ่งที่ฉันได้รับการสอนเมื่อเรียนรู้ครั้งแรก) ฉันคิดว่า "เกาส์เซียน" เป็นตัวเลือกที่ดีกว่าตราบใดที่นักเรียน / ผู้อ่านคุ้นเคยกับคำศัพท์ทั้งสอง:

  • ปกติไม่ปกติโดยเฉพาะดังนั้นชื่อตัวเองทำให้เข้าใจผิด แน่นอนว่ามันมีบทบาทสำคัญ (อย่างน้อยก็ไม่ได้เพราะ CLT) แต่ข้อมูลที่สังเกตได้มักไม่ค่อยใกล้เคียงกับแบบเกาส์มากกว่าที่บางครั้งก็แนะนำ

  • คำว่า (และคำที่เกี่ยวข้องเช่น "normalize") มีความหมายหลายอย่างที่เกี่ยวข้องในสถิติ (เช่น "orthonormal Basis" เป็นต้น) ถ้ามีคนบอกว่า "ฉันทำให้กลุ่มตัวอย่างของฉันเป็นปกติ" ฉันไม่สามารถบอกได้อย่างแน่นอนว่าพวกเขาเปลี่ยนไปเป็นค่าปกติคำนวณคะแนน z คำนวณขนาดเวกเตอร์เป็นความยาวหน่วยความยาวหรือความเป็นไปได้อื่น ๆ หากเรามีแนวโน้มที่จะเรียกการแจกแจงแบบ "เกาส์เซียน" อย่างน้อยตัวเลือกแรกจะถูกกำจัดออกไปและสิ่งที่อธิบายเพิ่มเติมจะแทนที่มันn

  • อย่างน้อยเกาส์มีการอ้างสิทธิ์ในการจัดจำหน่ายอย่างสมเหตุสมผล


3
+1 สำหรับบิต "ตราบใดที่นักเรียน / ผู้อ่านมีความคุ้นเคยกับทั้งสองคำศัพท์" ฉันคิดว่ามันจะเป็นความเสียหายให้กับนักเรียนที่จะสอนเพียง "เกาส์เซียน" เพียงเพราะ "ปกติ" เป็นที่แพร่หลายมาก
Patrick Coulombe

6
ฉันเห็นด้วยที่เราต้องสอนทั้งคู่ ถ้าเราเริ่มต้นจากศูนย์และรู้ว่าเรารู้อะไรตอนนี้เราจะไม่ยอมให้ "ปกติ" ปรากฎเพราะ (1) คำนี้มีการใช้งานมากเกินไป (2) ปกติ (เกาส์เซียน) ไม่ปกติ (ปกติหรือคาดไว้) ของข้อมูล "เกาส์เซียน" เป็นทางเลือกที่ธรรมดาที่สุดแม้ว่าจะมีประวัติศาสตร์มาก่อนเกาส์ ET Jaynes แนะนำ "ศูนย์กลาง" ซึ่งเป็นความคิดที่น่าขำ แต่มันไม่ได้ติดอยู่ (ฉันจำข้อโต้แย้งที่มีพื้นฐานมาจากทฤษฎีขีด จำกัด กลาง)
นิคค็อกซ์

สำหรับ bullet # 2 เมื่อพูดถึงวิทยาศาสตร์และคณิตศาสตร์ในวงกว้างนั้นไม่จำเป็นต้องชัดเจนว่า " ปกติ " หรือ " เกาส์ " เป็นเรื่องธรรมดามากกว่า ;-)
พระคาร์ดินัล

@ cardinal - ฉันค่อนข้างเห็นด้วยกับคำแนะนำที่มีแนวโน้มที่จะเอนตัวไปทาง "เกาส์เซียน" ในพื้นที่เหล่านั้นมากขึ้น - และฉันจะเพิ่มวิศวกรรมเช่นกัน
Glen_b

1
@Glen_b: เห็นด้วย (ในรูปแบบจิตของฉันฉันรวมวิศวกรรมภายใต้ร่มทั่วไปของวิทยาศาสตร์แม้ว่านั่นอาจจะค่อนข้างนอกอะแฮ่มธรรมดา) :-)
cardinal

36

ฉันจะใช้ Gaussian

ปัญหาหนึ่งที่ผู้คนต้องเรียนรู้สถิติคือเราใช้คำภาษาอังกฤษทุกวันเพื่อหมายถึงสิ่งต่าง ๆ (พลังความสำคัญการกระจาย ฯลฯ ) เท่าที่เราสามารถลดสิ่งนี้เราควร "ปกติ" มีความหมายมากมาย


2
ปีเตอร์: ฉันเห็นด้วย นั่นคือเหตุผลที่ฉันใช้ "เกาส์เซียน" มาตลอด แต่ความคิดเห็นจากผู้ตรวจสอบเกี่ยวกับรุ่นใหม่ (กระชับ) ผลักดัน "ปกติ"
Harvey Motulsky

25

ข้อโต้แย้งหนึ่งที่เห็นว่าเป็นเรื่องปกติคือสัญกรณ์สำหรับการแจกแจงซึ่งหมายถึง "ปกติ" ฉันไม่ได้เห็นทุกคนเสนอการเปลี่ยนแปลงนี้เพื่อ2)N(μ,σ2)NG(μ,σ2)


1
Gน่าจะขัดแย้งกับ Gamma เช่นกันซึ่งควรเขียนแทนแต่น่าเสียดายที่ฟังก์ชั่นชื่อเดียวกัน ทางเลือกที่อาจจะหรือซึ่งก็จะสอดคล้องกับและ abbrevation บ่อยของเพื่อbinomแต่ที่จริงฉันชอบสัญกรณ์เพราะฉันเขียนมันอย่างต่อเนื่องและมันเป็นจดหมายง่าย ๆ ที่จะเขียนลวก ๆ ΓGaussGaussianBernoullibinomialbinomN
shadowtalker

นั่นเป็นประเด็นที่ยุติธรรมแม้ว่าหากมีการนำเสนอทั้งสองคำการใช้ก็สามารถนำมาใช้ได้ N
Glen_b

8
ให้ ;-)GN(μ,σ2)
Stéphane Laurent

1
@ StéphaneLaurent: ฉันเดาว่าประเด็นของฉันคือถ้าคุณหลีกเลี่ยงคำว่า "ปกติ" นักเรียนอาจมีช่วงเวลาที่ยากลำบากในการจดจำสิ่งที่หมายถึงเนื่องจากมันจะไม่เป็นความจำอีกต่อไป N(μ,σ2)
Nate Eldredge

10

ในภาษาเยอรมันมักถูกเรียกว่าGaußsche Normalverteilungดังนั้นจึงแทบเป็นไปไม่ได้ที่จะขัดแย้งกันได้ง่าย

มันจะเหมาะสมสำหรับคุณที่จะรวมGaussianและปกติ ?


8
อาจgnormalจะใช้ภาษาอังกฤษก็ได้!
Dilip Sarwate

2
@DilipSarwate 𝅘𝅥𝅮ฉันเป็นคนมีความรู้ไม่ปรกติ, คนที่ไม่คุ้นเคยและคนที่ไม่รู้จัก𝅘𝅥𝅮 (ขอโทษที่ส่งสาร Flanders and Swann)
hobbs

9

ตามสารานุกรมวุลแฟรม :

ในขณะที่นักสถิติและนักคณิตศาสตร์ใช้คำว่า "การแจกแจงแบบปกติ" อย่างสม่ำเสมอสำหรับการแจกแจงครั้งนี้นักฟิสิกส์บางครั้งเรียกมันว่าการกระจายแบบเกาส์เซียนและเนื่องจากรูปร่างโค้งวูบวาบของมันนักวิทยาศาสตร์สังคมเรียกมันว่า

ฉันยอมรับว่า "ปกติ" นั้นง่ายต่อการทำให้งงงวย - แต่ฉันสงสัยว่าหนังสือสถิติมักจะใช้ "ปกติ"


+1 สำหรับคำตอบที่อธิบายมากกว่าที่กำหนด จริง ๆ แล้วฉันเห็นด้วยกับคำตอบอื่น ๆ ที่ Gaussian เป็นที่นิยมไม่ว่าฟิลด์ใด แต่เป็นข้อมูลที่เริ่มต้นจากบริบทของสิ่งที่แพร่หลายในการใช้งานที่มีอยู่
..

สำหรับวลี "เส้นโค้งระฆัง" ฉันจะหลีกเลี่ยงได้ทั้งหมดในทุกสภาพแวดล้อม มันมีหวือหวาชนชั้นสูงอันเป็นผลมาจากหนังสือที่น่าอับอายด้วยชื่อเดียวกันและนักเรียนคนใดของคุณที่รู้ตัวว่ามีแนวโน้มที่จะถูกเบี่ยงเบนความสนใจจากมันและเชื่อมโยงสิ่งที่คุณพูดกับทฤษฎีไร้สาระเกี่ยวกับเชื้อชาติเหนือกว่า ตัวแบบยืนอยู่ในตัวของมันเอง
..

@R. คำอธิบายใช่ แต่คำอธิบายนั้นขัดแย้งโดยตรงกับคำตอบที่นี่ซึ่งระบุว่าส่วนสำคัญของนักสถิติและนักคณิตศาสตร์ใช้คำว่า "เกาส์เซียน" อย่างมีนัยสำคัญ
David Richerby

อีกเหตุผลหนึ่งที่ไม่ใช้คำว่า "เส้นโค้งระฆัง" เพื่อแสดงถึง (ฟังก์ชันความหนาแน่นของ) การแจกแจงแบบเกาส์ / ปกติคือมีการแจกแจงจำนวนมากซึ่งฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) มีลักษณะคล้ายกับเส้นโค้งระฆัง แม้แต่ไฟล์ PDF ของการกระจาย Cauchy ก็ดูเหมือนเส้นโค้งระฆัง!
Mico

+1 สำหรับการอธิบายคำที่เกี่ยวข้องในสาขาวิชาที่แตกต่างกัน ขอบคุณ!
ผู้ที่กระตือรือร้น

7

ฉันต้องการชี้ให้เห็นว่า S. Stigler ใช้การกระจายแบบปกติ / Gauss / Laplace-Gauss เพื่อพิสูจน์ 'กฎของ eponymy ของ Stigler' ที่เผยแพร่ในสถิติบนโต๊ะ (บางหน้ามีอยู่ในbooks.google )

โดยเฉพาะอย่างยิ่งที่น่าสนใจและเกี่ยวข้องกับคำถามนี้คือในหน้า 287-288 มีตารางการใช้งานในอดีตของ 'ปกติ' กับ 'เกาส์' กับ 'Laplace' และดูเหมือนว่าการใช้งานในช่วงหลายปีที่ผ่านมาเปลี่ยนจาก 2:15 เพื่อ ปกติใน 1816-1884 ถึง 8:14 (1888-1917) ถึง 5:17 (1919-1939) ถึง 9:10 (1947-1976)

ดังนั้นการใช้ 'ปกติ' กับ 'เกาส์' จึงมีความเท่าเทียมกันมากขึ้น หรือถ้าคุณเชื่อว่าเทรนด์จะดำเนินต่อไป 'เกาส์' จะเอาชนะ 'ปกติ' ใน 50-100 ปี


5

คำตอบที่ฉันยังไม่เห็นในคำตอบที่ดีทั้งหมด:

ฉันส่วนใหญ่ใช้ "ปกติ" ด้วยเหตุผลของความคุ้นเคยก่อนหน้านี้ แต่ฉันชอบที่จะใช้ประโยชน์เพื่อเน้นความหมายทางเทคนิคของมัน: "... หากข้อมูลมีการแจกจ่ายตามปกติ ... " (ฉันไม่รู้ว่าฉันคัดลอกการฝึกนี้จาก ที่อื่นหรือ (อีกครั้ง) คิดค้นมันเอง)


5

สิ่งที่ใช้ขึ้นอยู่กับระดับของสถิติที่กำลังสอน น่าเสียดายที่ประสบการณ์การสอนของฉันระบุว่านักเรียนระดับปริญญาตรีส่วนใหญ่ไม่เข้าใจแนวคิดเรื่องการกระจายความน่าจะเป็นอย่างเต็มที่ อย่างไรก็ตามพวกเขาทุกคนต้องเข้ามามีส่วนร่วมกับ CLT และวิธีคิดเกี่ยวกับความไม่แน่นอน สำหรับชั้นเรียนระดับปริญญาตรีปกติดีกว่าเพราะไม่ได้เพิ่มความวิตกกังวลของคำที่ไม่คุ้นเคยใหม่ สำหรับนักศึกษาระดับบัณฑิตศึกษา Gaussian เป็นที่ต้องการเนื่องจากความสับสนดังกล่าวข้างต้นทั้งหมดเกี่ยวกับการทำให้เป็นมาตรฐานและบริบททางประวัติศาสตร์ที่ให้ไว้ ฉันสอนวิชาวิจัยระดับปริญญาตรีที่ต้องใช้วิชาสถิติที่กำหนดเงื่อนไขสองวิชาและหนังสือระดับปริญญาตรีทั้งหมดที่ฉันเห็นว่าใช้ในช่วง 30 ปีที่ผ่านมาได้ใช้ Normal


1
"นักศึกษาระดับปริญญาตรีส่วนใหญ่ไม่เข้าใจแนวคิดของการแจกแจงความน่าจะเป็นอย่างเต็มที่" +1
Code-Guru

4

ชื่อnormalนี้มาจากการสังเกตบางอย่างที่ข้อผิดพลาดทำงานได้ตามปกติ คุณจะพบรายละเอียดเพิ่มเติมที่นี่ poissonถ้านั่นคือเหตุผลที่จะเรียกการกระจายนี้การกระจายปกติก็อาจสร้างความสับสนใหม่เช่นการกระจายปกติสำหรับการนับจำนวนของการเกิดอุบัติเหตุคือ ฉันเชื่อว่าเราควรก้าวไปข้างหน้าและเริ่มเรียกมันว่าGaussianแทน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.