การตรวจสอบสติ: p-value ไปได้น้อยแค่ไหน?


24

ฉันใช้การทดสอบ ranksum เพื่อเปรียบเทียบค่ามัธยฐานของทั้งสองตัวอย่าง (คน ) และได้พบว่าพวกเขามีความแตกต่างอย่างมีนัยสำคัญด้วย: ฉันควรจะสงสัยว่าค่าขนาดเล็กเช่นนี้หรือไม่หรือฉันควรกำหนดให้มีค่าสถิติสูงที่เกี่ยวข้องกับการมีกลุ่มตัวอย่างขนาดใหญ่มาก? มีสิ่งใดที่เป็นค่าต่ำอย่างน่าสงสัยหรือไม่?พีพีn=120000p = 1.12E-207pp


นี้เกือบจะซ้ำstats.stackexchange.com/questions/78839
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


30

P-ค่าบนคอมพิวเตอร์มาตรฐาน (โดยใช้มาตรฐาน IEEE ลอยแม่นยำสอง) จะได้รับที่ต่ำเป็นประมาณ 303 สิ่งเหล่านี้สามารถคำนวณได้อย่างถูกต้องตามกฎหมายเมื่อขนาดผลมีขนาดใหญ่และ / หรือข้อผิดพลาดมาตรฐานต่ำ ค่าของคุณหากคำนวณด้วยการแจกแจงแบบ T หรือแบบปกติจะสอดคล้องกับขนาดเอฟเฟกต์ของข้อผิดพลาดมาตรฐานประมาณ 31 ข้อ โปรดจำไว้ว่าข้อผิดพลาดมาตรฐานมักจะขยายด้วยรากที่สองของnซึ่งสะท้อนถึงความแตกต่างของค่าเบี่ยงเบนมาตรฐานน้อยกว่า 0.09 (สมมติว่าตัวอย่างทั้งหมดเป็นอิสระ) ในแอปพลิเคชันส่วนใหญ่จะไม่มีอะไรน่าสงสัยหรือผิดปกติเกี่ยวกับความแตกต่างดังกล่าว10303n

การตีความค่า p ดังกล่าวเป็นอีกเรื่องหนึ่ง การดูตัวเลขที่มีขนาดเล็กเพียงหรือแม้แต่10 - 10เป็นความน่าจะเป็นที่เกินขอบเขตของเหตุผลเนื่องจากทุกวิธีที่ความเป็นจริงมีแนวโน้มที่จะเบี่ยงเบนจากตัวแบบความน่าจะเป็นที่การคำนวณ p-value นี้ ทางเลือกที่ดีคือการรายงาน p-value เป็นน้อยกว่าเกณฑ์ที่เล็กที่สุดที่คุณรู้สึกแบบมีเหตุผลสามารถสนับสนุน: มักจะอยู่ระหว่าง0.01และ0.00011020710100.010.0001


13
เมื่อฉันรายงาน '' '' ในเอกสารการประชุมผู้ตรวจทานบอกฉันว่าฉันควรเปลี่ยนเป็น '' p < 0.001 '' เพื่อปฏิบัติตามแนวทางของ APA พี<10-26พี<0.001
โทมัสเลวีน

4
@whuber - ระบุไว้อย่างสวยงาม
rolando2

2
(+1) ในบางจุดมีความเป็นไปได้มากกว่าที่รัฐบาลจะพลิกบิตใน RAM ของคุณจากระยะไกลด้วยเทคโนโลยี super spy ...
JMS

4
(+1) คุณสามารถลงไปได้ต่ำกว่าในจุดลอยตัวความแม่นยำสองเท่าของ IEEE แต่รูทีนเชิงตัวเลขของคุณสำหรับการคำนวณค่าp-เกือบจะรับประกันว่าจะล้มลงก่อนหน้านั้น หากคุณไม่ทราบข้อเท็จจริงที่ว่าสมมติฐานการสร้างแบบจำลองของคุณถูกต้องสมบูรณ์แบบ (และเมื่อใด) เมื่อใดค่าp-valueในที่สุดก็จะกลายเป็นการวัดขนาดตัวอย่างเมื่อตัวอย่างมีขนาดใหญ่พอ 5×10324pพี
พระคาร์ดินัล

1
@ Cardinal เราผิดทั้งคู่เกี่ยวกับข้อ จำกัด : นอกเหนือจากค่า denormalized แล้วIEEE ที่เล็กที่สุดคือประมาณซึ่งสอดคล้องกับสิบบิตสำหรับเลขชี้กำลังฐาน -2 10-308
whuber

16

ไม่มีอะไรน่าสงสัย - ค่า p ต่ำมากอย่างเช่นคุณเป็นเรื่องธรรมดาเมื่อขนาดของกลุ่มตัวอย่างมีขนาดใหญ่ ตามที่ระบุไว้โดยทั่วไปค่า p-value ดังกล่าวจะถูกรายงานว่ามีค่าน้อยกว่าเกณฑ์ (เช่น <0.001)

สิ่งหนึ่งที่ต้องระวังคือ p-values ​​จะบอกคุณว่าความแตกต่างของค่ามัธยฐานนั้นมีนัยสำคัญทางสถิติหรือไม่ ไม่ว่าความแตกต่างจะมีความสำคัญเพียงพอในขนาดหรือไม่นั้นเป็นสิ่งที่คุณจะต้องตัดสินใจเช่นสำหรับชุดตัวอย่างขนาดใหญ่ความแตกต่างเล็กน้อยในค่าเฉลี่ย / ค่ามัธยฐานอาจมีนัยสำคัญทางสถิติ แต่อาจไม่ได้มีความหมายมากนัก


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.