ต้นกำเนิดของเกณฑ์“ 5


33

รายงานข่าวกล่าวว่าเซิร์นจะมีการประกาศในวันพรุ่งนี้ว่าฮิกส์โบซอนได้รับการตรวจทดลอง 5 หลักฐาน อ้างอิงจากบทความ:σ

5 เท่ากับโอกาส 99.99994% ที่ข้อมูลที่เครื่องตรวจจับ CMS และ ATLAS กำลังเห็นไม่ใช่แค่เสียงสุ่ม - และมีโอกาส 0.00006% ที่พวกเขาได้รับการกระพริบ 5 σเป็นความมั่นใจที่จำเป็นสำหรับบางสิ่งบางอย่างที่จะระบุว่าเป็น“ การค้นพบทางวิทยาศาสตร์” อย่างเป็นทางการσσ

สิ่งนี้ไม่ได้เข้มงวดมากนัก แต่ดูเหมือนว่านักฟิสิกส์ใช้วิธีการทางสถิติแบบ "การทดสอบสมมติฐาน" มาตรฐานโดยตั้งค่าเป็น0.0000006ซึ่งสอดคล้องกับz = 5 (แบบสองด้าน)? หรือมีความหมายอื่น ๆ บ้าง?α0.0000006z=5

แน่นอนว่าในทางวิทยาศาสตร์ส่วนใหญ่การตั้งค่าอัลฟ่าเป็น 0.05 จะทำเป็นประจำ นี่จะเทียบเท่ากับหลักฐาน"two- " ถึงแม้ว่าฉันไม่เคยได้ยินชื่อนี้มาก่อน มีสาขาอื่น ๆ (นอกเหนือจากฟิสิกส์ของอนุภาค) ที่คำจำกัดความที่เข้มงวดกว่าของอัลฟ่าเป็นมาตรฐานหรือไม่? ใครทราบข้อมูลอ้างอิงสำหรับวิธีการที่ห้าσกฎได้รับการยอมรับจากฟิสิกส์ของอนุภาค?σσ

ปรับปรุง:ฉันถามคำถามนี้ด้วยเหตุผลง่ายๆ หนังสือของฉันชีวสถิติที่ใช้งานง่าย (เช่นหนังสือสถิติส่วนใหญ่) มีส่วนที่อธิบายว่ากฎ "P <0.05" ตามปกติคืออะไร ฉันต้องการเพิ่มตัวอย่างของเขตข้อมูลทางวิทยาศาสตร์ที่จำเป็นต้องใช้ค่าที่น้อยกว่า (มาก!) ของแต่ถ้าตัวอย่างมีความซับซ้อนมากขึ้นด้วยการใช้วิธีการแบบเบย์ (ตามความเห็นด้านล่างแนะนำ) มันก็จะไม่ฉลาดหรือจะต้องมีคำอธิบายมากขึ้นα


2
เคยได้ยินเรื่อง"Six Sigma"บ้างไหม?
Daniel R Hicks

ในการควบคุมคุณภาพซิกม่าซิกม่าได้รับการพิจารณาว่าเป็นสิ่งที่แดเนียลแนะนำด้วยคำถาม / คำพูดของเขา ความน่าจะเป็นที่ถูกปฏิเสธเหล่านี้ทั้งหมดจะทำการสุ่มตัวอย่างจากการแจกแจงแบบปกติและความน่าจะเป็นท้ายอาจมีขนาดใหญ่กว่าสำหรับการแจกแจงแบบอื่น การใช้สุดขั้วเช่นซิกม่า 5 หรือ 6 จะมีประโยชน์ในกรณีพิเศษเท่านั้น ในทางปฏิบัติขนาดของกลุ่มตัวอย่างและความแปรปรวนของข้อมูลทำให้อนุมานเกินกว่า 2 หรือ 3 sigma เป็นไปไม่ได้
Michael R. Chernick

1
โดยทั่วไปนักฟิสิกส์อนุภาคส่วนใหญ่รู้สึกสบายใจกับแนวคิดแบบเบย์เมื่อทำการคำนวณพารามิเตอร์ดังนั้นพวกเขาจึงเป็น " แน่นอนจากข้อมูลและนักบวชว่าสัญญาณของฮิกส์ไม่เป็นศูนย์" ซึ่งแตกต่างจากการบอกว่ามี เป็นเพียง "โอกาสร้อยละ 0.01 ของสัญญาณที่เป็นสัญญาณรบกวนแบบสุ่ม" (มีความผันผวนแบบไม่สุ่มเกิดขึ้นจากระบบของระบบด้วย!) [1]: physics.stackexchange.com/questions/8752/…X%
Néstor

3
@ Néstor: ฉันกำลังดูการถ่ายทอดสดของงานแถลงข่าว Higgs ในตอนนี้และไม่มีใครพูดถึงการตีความแบบเบย์ ใช้ "ค่า p" และ "ระดับนัยสำคัญ" แต่มีเพียงเบส์เซียนที่เข้าใจผิดอย่างน่ากลัวเท่านั้นที่จะตีความสิ่งเหล่านั้นว่าเป็นความน่าจะเป็นที่สัญญาณจะส่งเสียงดัง ฉันคิดว่าข้อความในเครื่องหมายคำพูดในคำถามของ OP เป็นการตีความที่ผิด ๆ ว่าค่า p คืออะไร
MånsT

1
BTW ฉันไม่บล็อกโพสต์ในบล็อกของฉันเกี่ยวกับปัญหานี้: randomastronomy.wordpress.com
Néstor

คำตอบ:


13

ในการใช้งานสถิติส่วนใหญ่มีเกาลัดเก่าเกี่ยวกับ 'ทุกรุ่นผิดบางอันมีประโยชน์' ในกรณีนี้เราคาดหวังเพียงแบบจำลองที่จะแสดงในระดับที่กำหนดเนื่องจากเรากำลังอธิบายกระบวนการที่ซับซ้อนอย่างไม่น่าเชื่อโดยใช้แบบจำลองง่าย ๆ

ฟิสิกส์แตกต่างกันมากดังนั้นสัญชาตญาณที่พัฒนาจากแบบจำลองทางสถิติจึงไม่เหมาะสม ในฟิสิกส์โดยเฉพาะอย่างยิ่งฟิสิกส์ของอนุภาคที่เกี่ยวข้องโดยตรงกับกฎทางฟิสิกส์พื้นฐานโมเดลควรจะเป็นคำอธิบายที่แท้จริงของความเป็นจริง การออกเดินทางจากสิ่งที่ตัวแบบทำนายต้องอธิบายได้อย่างสมบูรณ์โดยเสียงรบกวนจากการทดลองไม่ใช่ข้อ จำกัด ของตัวแบบ ซึ่งหมายความว่าหากแบบจำลองนั้นดีและถูกต้องและเครื่องมือทดลองเข้าใจความสำคัญทางสถิติควรสูงมากดังนั้นจึงมีการตั้งค่าแถบสูง

อีกเหตุผลหนึ่งคือประวัติศาสตร์ชุมชนฟิสิกส์อนุภาคได้ถูกเผาไหม้ในอดีตโดย 'การค้นพบ' ที่ระดับนัยสำคัญต่ำกว่าซึ่งถูกเพิกถอนในภายหลัง


1
คุณเห็นด้วยหรือไม่ว่าฟิสิกส์ใช้การทดสอบสมมติฐานทางสถิติมาตรฐานกับอัลฟาที่ต่ำมาก (ในกรณีนี้) หรือพวกเขาใช้วิธีการแบบเบย์บางอย่างตามที่ Nestor กล่าวในความคิดเห็นข้างต้น
Harvey Motulsky

2
ความเข้าใจของฉันจากการพูดคุยกับผู้คนที่ฉันรู้จักซึ่งทำงานกับ ATLAS คือการวิเคราะห์นั้นเป็นแบบเบย์ทั้งหมด อย่างไรก็ตามพวกเขาเป็นคนระดับต่ำกว่า (เช่นคนที่ทำงานจริง) มันจะไม่ทำให้ฉันประหลาดใจถ้ามีบางคนที่พูดขึ้นหัวขึ้นโซ่มีความเข้าใจในการตีความ ที่ถูกกล่าวว่าการนำเสนอผล LHC ค่อนข้างยากจนและไม่ได้เจอ Bayesian มากอย่างที่คนอื่น ๆ สังเกต
Bogdanovist

2
ฉันคิดเสมอว่าฟิสิกส์ของอนุภาคโดยเฉพาะจัดการกับเหตุการณ์หลายพันล้านครั้งดังนั้นคุณต้องตั้งบาร์ให้สูงมาก
Wayne

11

ประวัติและที่มา

อ้างอิงจาก Robert D Cousins 11และ Tommaso Dorigo 2ต้นกำเนิดของ5 σเกณฑ์แหล่งกำเนิดอยู่ในการทำงานของฟิสิกส์อนุภาคในช่วงต้นของยุค 60s เมื่อ histograms จำนวนมากของการทดลองการกระเจิงถูกตรวจสอบและค้นหายอด / กระแทกที่อาจบ่งชี้บางอนุภาคที่เพิ่งค้นพบ . เกณฑ์เป็นกฎคร่าวๆที่จะอธิบายการเปรียบเทียบหลายรายการที่กำลังเกิดขึ้น25σ

ผู้เขียนทั้งสองอ้างถึงบทความ 1968 จาก Rosenfeld 33ซึ่งเกี่ยวข้องกับคำถามหรือไม่ว่ามีที่อยู่ห่างไกลออกซอนและ baryons ซึ่งหลาย4σผลกระทบที่วัด บทความตอบคำถามในเชิงลบโดยอ้างว่าจำนวนการเรียกร้องที่ตีพิมพ์สอดคล้องกับจำนวนความผันผวนที่คาดหวังทางสถิติ พร้อมด้วยอีกหลายคำนวณสนับสนุนเรื่องนี้บทความการส่งเสริมการใช้งานของ5σระดับ:

แจสัน: "ก่อนที่เราจะไปสำรวจไกลออกสเปกตรัมมวลที่กระแทกได้รับรายงานใน (Kππ)3/2,(πρ)เราควรจะตัดสินใจเลือกสิ่งที่แรกที่เกณฑ์ของความสำคัญกับความต้องการในปี 1968 ผมต้องการ เพื่อแสดงให้คุณเห็นว่าถึงแม้นักทดลองอาจจะควรทราบถึง3σกระทบนักทฤษฎีและนักปรากฏการณ์วิทยาจะทำดีกว่าที่จะรอจนกว่าผลกระทบจะถึง>4σ "

และหลังจากนั้นในบทความ (เน้นเป็นของฉัน)

แจสัน: "แล้วที่จะทำซ้ำคำเตือนของฉันที่จุดเริ่มต้นของส่วนนี้เราจะสร้างอย่างน้อย 100 000 กระแทกที่อาจเกิดขึ้นต่อปีและควรคาดหวังว่าหลาย4σและหลายร้อย3σความผันผวนจะเกิดอะไรขึ้นไปทางทฤษฎีหรือ phenomenologist. คุณธรรมคือง่ายรอ5σผลกระทบ ".

ทอมมาโซดูเหมือนว่าจะระมัดระวังในการระบุว่ามันเริ่มต้นด้วยบทความ Rosenfeld

ทอมมาโซ: "อย่างไรก็ตามเราควรทราบว่าบทความนั้นเขียนในปี 1968 แต่เกณฑ์ที่เข้มงวดของส่วนเบี่ยงเบนมาตรฐานห้าข้อสำหรับการอ้างสิทธิ์ในการค้นพบไม่ได้นำมาใช้ในอายุเจ็ดสิบและแปดสิบตัวอย่างเช่นไม่มีการใช้เกณฑ์ห้าซิกม่า สำหรับการค้นพบ W และ Z bosons ซึ่งได้รับ Rubbia และ Van der Meer รางวัลโนเบลในสาขาฟิสิกส์ในปี 1984 "

แต่ในยุค 80 การใช้5σถูกแพร่กระจายออกไป ตัวอย่างเช่นนักดาราศาสตร์ Steve Schneider 4กล่าวถึงในปี 1989 ว่ามันเป็นสิ่งที่ถูกสอน (เน้นที่เหมืองตามคำพูดด้านล่าง):4

ชไนเดอ: "บ่อยครั้งที่ระดับความเชื่อมั่นของ 95% หรือ 99% จะถูกยกมาเพื่อให้ข้อมูลไม่ตรงกันเห็นได้ชัด แต่จำนวนนี้เพียงสองหรือสาม sigmas สถิติ. ฉันถูกสอนไม่ให้เชื่ออะไรที่น้อยกว่าห้าซิกซึ่งถ้าคุณคิด เกี่ยวกับมันเป็นข้อกำหนดที่เข้มงวดอย่างไร้เหตุผล --- บางอย่างเช่นระดับความมั่นใจ 99.9999% แต่แน่นอนว่ามีการใช้ขีด จำกัด ดังกล่าวเนื่องจากขนาดที่แท้จริงของซิกมานั้นแทบจะไม่เคยรู้จักมาก่อนมีตัวแปรอิสระมากมายในดาราศาสตร์ที่เราสามารถทำได้ ควบคุมหรือไม่รู้เรื่อง "

4σ5σ5

Franklin: ในปี 2003 เกณฑ์ 5 ส่วนเบี่ยงเบนมาตรฐานสำหรับ "การสังเกต" ดูเหมือนว่าจะมีผลบังคับใช้

...

สมาชิกของการทำงานร่วมกันของ BaBar จำได้ว่าในเวลานี้เกณฑ์ 5-sigma ออกมาเป็นแนวทางโดยบรรณาธิการของจดหมายทบทวนทางกายภาพ


การใช้งานที่ทันสมัย

5σ67

Z=55σ2.87×107

5σระดับที่กำหนดในขณะนี้ถึง 4 เหตุผล:

  • 5σ3σ4σเช่นเมื่อเร็ว ๆ นี้750 GeV diphoton ส่วนเกิน )

  • 5σ

  • σσσ6σอย่างมีนัยสำคัญ.)

  • 5σ

5σ8,912


สาขาอื่น ๆ

เป็นที่น่าสนใจที่จะทราบว่าสาขาวิทยาศาสตร์อื่น ๆ จำนวนมากไม่มีเกณฑ์ที่คล้ายกันหรืออย่างใดจัดการกับปัญหา ฉันคิดว่าสิ่งนี้สมเหตุสมผลในกรณีของการทดลองกับมนุษย์ที่มีราคาแพงมาก (หรือเป็นไปไม่ได้) ในการขยายการทดลองที่ให้ความสำคัญกับ. 05 หรือ. 01

1011


  1. Cousins, RD (2017) Jeffreys – Lindley บุคคลที่ผิดธรรมดาและเกณฑ์การค้นพบในสาขาฟิสิกส์พลังงานสูง ซินธี, 194 (2), 395-432ลิงค์ arxiv

  2. Dorigo, T. (2013) Demystifying The Five-Sigma Criterion, จาก science20.com 2019-03-07

  3. Rosenfeld, AH (1968) มีซอนหรือ baryons ที่อยู่ไกลออกไปไหม?แหล่งที่มาของเว็บ: ทุนการศึกษา

  4. Burbidge, G. , Roberts, M. , Schneider, S. , Sharp, N. , & Tifft, W. (1990, November) อภิปราย: ปัญหาที่เกี่ยวข้องกับ Redshift ในเอกสารเผยแพร่การประชุมขององค์การนาซ่า (ฉบับที่ 3098, หน้า 462) เชื่อมโยงไปยังสำเนาบน harvard.edu

  5. Franklin, A. (2013) มาตรฐานการเลื่อน: การทดลองในฟิสิกส์ของอนุภาคในศตวรรษที่ยี่สิบ มหาวิทยาลัยพิตส์เบิร์กกด

  6. 5 sigma หมายถึงอะไร? จาก physics.org 2019-03-07

  7. Beringer, J. , Arguin, JF, Barnett, RM, Copic, K. , Dahl, O. , เจ้าบ่าว, DE, ... & Yao, WM (2012) ทบทวนฟิสิกส์ของอนุภาค การทบทวนทางกายภาพ D-Particles, Fields, Gravitation and Cosmology, 86 (1), 010001 (ตอนที่ 36.2.2 การทดสอบความสำคัญ, หน้า 394,ลิงค์ aps.org )

  8. Lyons, L. (2013) การค้นพบความสำคัญของ 5 ซิกมา พิมพ์ arXiv arXiv: 1310.1284ลิงค์ arxiv

  9. Lyons, L. (2014) ปัญหาทางสถิติในการค้นหาฟิสิกส์ใหม่ พิมพ์ arXivลิงค์ arxiv

  10. Baker, M. (2015) กว่าครึ่งของการศึกษาทางจิตวิทยาล้มเหลวในการทำซ้ำการทดสอบ ข่าวธรรมชาติ จาก nature.com 2019-03-07

  11. Horton, R. (2015) ออฟไลน์: ยา 5 sigma คืออะไร? The Lancet, 385 (9976), 1380. จาก thelancet.com 2019-03-07


4

ด้วยเหตุผลที่แตกต่างอย่างสิ้นเชิงจากสาขาฟิสิกส์มีสาขาอื่นที่มีตัวอักษรเข้มงวดมากขึ้นเมื่อพวกเขามีส่วนร่วมในการทดสอบสมมติฐาน พันธุศาสตร์ระบาดวิทยาอยู่ในหมู่พวกเขาโดยเฉพาะอย่างยิ่งเมื่อพวกเขาใช้ "GWAS" (Genome-Wide Association Study) เพื่อดูเครื่องหมายทางพันธุกรรมที่หลากหลายสำหรับโรค

เนื่องจากการศึกษา GWAS เป็นการออกกำลังกายครั้งใหญ่ในการทดสอบสมมุติฐานหลายครั้งเทคนิคการวิเคราะห์ที่ล้ำสมัยจึงถูกสร้างขึ้นด้วยอัลฟาที่เข้มงวดกว่า 0.05 เทคนิคการศึกษาแบบ "คัดกรองผู้สมัคร" อื่น ๆ ที่ตามมาหลังจากการศึกษาเกี่ยวกับฟังก์ชั่นของจีโนมน่าจะทำเช่นเดียวกัน


2
เหล่านี้เป็นเพียงท้องถิ่นเล็ก ๆ αs GWAS ยังคงเป็นประเภทข้อผิดพลาดโดยรวมของฉันที่ 5% สำหรับการอ้างสิทธิ์ความสำเร็จที่ไม่มีในความเป็นจริง
Horst Grünbusch

3

ระดับนี้สูงมากเพื่อหลีกเลี่ยงการประกาศข่าวก่อนเวลาอันควรที่จะหลอกลวงในภายหลัง สำหรับการอภิปรายเพิ่มเติมเกี่ยวกับเรื่องนี้ดู

https://physics.stackexchange.com/questions/8752/standard-deviation-in-particle-physics?rq=1

https://physics.stackexchange.com/questions/31126/how-many-sigma-did-the-discovery-of-the-w-boson-have

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.