ฉันมาจากสังคมศาสตร์โดยที่ p <0.05 เป็นบรรทัดฐานค่อนข้างมากโดยที่ p <0.1 และ p <0.01 ก็ปรากฏขึ้นด้วย แต่ฉันสงสัยว่า: สาขาวิชาใดถ้ามีให้ใช้ค่า p ต่ำกว่าเป็นเรื่องธรรมดา มาตรฐาน?
ฉันมาจากสังคมศาสตร์โดยที่ p <0.05 เป็นบรรทัดฐานค่อนข้างมากโดยที่ p <0.1 และ p <0.01 ก็ปรากฏขึ้นด้วย แต่ฉันสงสัยว่า: สาขาวิชาใดถ้ามีให้ใช้ค่า p ต่ำกว่าเป็นเรื่องธรรมดา มาตรฐาน?
คำตอบ:
ความคิดเห็นของฉันคือว่ามัน (และควร) ไม่ขึ้นอยู่กับสาขาวิชา ตัวอย่างเช่นคุณอาจทำงานในระดับความสำคัญต่ำกว่าถ้าเช่นคุณกำลังพยายามทำซ้ำการศึกษาที่มีผลลัพธ์ทางประวัติศาสตร์หรือเป็นที่ยอมรับ (ฉันสามารถคิดถึงการศึกษาหลายเรื่องเกี่ยวกับStroop effectซึ่งนำไปสู่ ในช่วงไม่กี่ปีที่ผ่านมา) จำนวนนั้นจะต้องพิจารณา "ธรณีประตู" ที่ต่ำกว่าภายในกรอบคลาสสิกของเนย์แมน - เพียร์สันสำหรับการทดสอบสมมติฐาน อย่างไรก็ตามความสำคัญทางสถิติและการปฏิบัติ (หรือเนื้อหาสาระ) เป็นอีกเรื่องหนึ่ง
sidenote "ระบบดาว" ดูเหมือนว่าจะมีคำถามทางวิทยาศาสตร์มาตั้งแต่ต้นยุค 70 แต่เห็นว่าโลกรอบตัว (p <.05) โดยเจโคเฮน ( นักจิตวิทยาอเมริกัน , 1994, 49 (12), 997-1003) แม้ว่าข้อเท็จจริงที่ว่าสิ่งที่เราต้องการรู้มักจะได้รับข้อมูลที่ฉันสังเกตเห็นความน่าจะเป็นที่เป็นจริงคืออะไร อย่างไรก็ตามมีการอภิปรายที่ดีเกี่ยวกับ " Why P = 0.05? " โดย Jerry Dallal
มันอาจจะหายากสำหรับทุกคนที่จะใช้ระดับอัลฟาที่กำหนดไว้ล่วงหน้าต่ำกว่าพูดว่า 0.01 แต่ก็ไม่ได้หาได้ยากนักที่คนอ้างว่าอัลฟาโดยนัยน้อยกว่า 0.01 ในความเชื่อที่ผิดที่ว่าค่า P ที่สังเกตเห็นน้อยกว่า 0.01 เหมือนกับ Neyman-Pearson alpha ที่น้อยกว่า 0.01
ค่า P ของฟิชเชอร์ไม่เหมือนหรือเปลี่ยนได้ด้วยอัตราความผิดพลาดของ Neyman-Pearson ไม่ได้หมายความว่าเว้นแต่จะมีการตัดสินใจใช้เป็นระดับวิกฤตสำหรับความสำคัญเมื่อการออกแบบได้รับการออกแบบ หากคุณใช้อย่างมีนัยสำคัญแล้วหมายความว่ามีความน่าจะเป็นมีการเรียกร้องค่าบวกที่ผิดพลาดα = 0.0023 0.0023 P = 0.05 P = 0.0023 0.05
ฉันไม่คุ้นเคยกับวรรณกรรมนี้มากนัก แต่ฉันเชื่อว่านักฟิสิกส์บางคนใช้เกณฑ์ต่ำกว่ามากในการทดสอบทางสถิติ แต่พวกเขาพูดถึงมันแตกต่างกันเล็กน้อย ตัวอย่างเช่นหากการวัดเป็นสามส่วนเบี่ยงเบนมาตรฐานจากการทำนายเชิงทฤษฎีจะมีการอธิบายว่าเป็นการเบี่ยงเบน“ สามซิกม่า” โดยทั่วไปนี่หมายความว่าพารามิเตอร์ที่น่าสนใจแตกต่างจากค่าที่ทำนายในการทดสอบ az ด้วยα = .01 ซิกมาสองคร่าวเทียบเท่ากับα = .05 (อันที่จริงแล้วมันคือ 1.96 σ) ถ้าฉันไม่เข้าใจผิดระดับความผิดพลาดมาตรฐานในฟิสิกส์คือ 5 sigma ซึ่งจะเป็นα = 5 * 10 ^ -7
นอกจากนี้ในด้านประสาทวิทยาหรือระบาดวิทยาดูเหมือนว่าจะมีมากขึ้นเรื่อย ๆ ที่จะทำการแก้ไขเพื่อเปรียบเทียบหลาย ๆ อย่างเป็นประจำ ระดับความผิดพลาดของการทดสอบแต่ละครั้งจึงต่ำกว่า p <.01
ดังที่บันทึกไว้โดยGaël Laurans เหนือการวิเคราะห์ทางสถิติที่พบปัญหาการเปรียบเทียบหลายครั้งมักจะใช้เกณฑ์ที่อนุรักษ์นิยมมากกว่า อย่างไรก็ตามในสาระสำคัญพวกเขาใช้ 0.05 แต่คูณด้วยจำนวนการทดสอบ เป็นที่ชัดเจนว่ากระบวนการนี้ (การแก้ไข Bonferroni) สามารถนำไปสู่ค่า p ที่น้อยอย่างไม่น่าเชื่อ นั่นเป็นสาเหตุที่ผู้คนในอดีต (ในระบบประสาท) หยุดที่ p <0.001 ปัจจุบันมีการใช้วิธีการอื่น ๆ ของการแก้ไขเปรียบเทียบหลายรายการ (ดูทฤษฎีสนามสุ่มของมาร์คอฟ)