p-value 0.04993 เพียงพอที่จะปฏิเสธสมมติฐานว่างได้หรือไม่


20

ใน Wilcoxon ลงชื่ออันดับทดสอบนัยสำคัญทางสถิติเรามาข้ามข้อมูลบางอย่างที่ผลิต -value ของ0.04993ด้วยเกณฑ์ที่ผลลัพธ์นี้เพียงพอที่จะปฏิเสธสมมติฐานว่างหรือว่าปลอดภัยกว่าที่จะบอกว่าการทดสอบนั้นไม่สามารถสรุปได้เพราะถ้าเราปัดค่า p-value เป็นทศนิยม 3 ตำแหน่งจะกลายเป็นหรือไม่พี0.04993พี<0.050.050


24
0.04993 <0.05 ดังนั้นมันลดลง สัญชาตญาณของคุณดีว่าไม่มีค่า P สามารถเชื่อถือได้ในหลายตำแหน่งทศนิยม แต่ถ้าโปรแกรมบอกว่าน้อยกว่า 0.05 คนทั่วไปจะรับมันตามที่ส่ง ปัญหาจริงที่นี่คือการทำเครื่องรางของการทดสอบอย่างมีนัยสำคัญในระดับคงที่เพื่อให้ <0.05 หมายถึง "ของจริง", "เผยแพร่", "ทำให้เกิดความสุข" และในทางตรงกันข้ามหมายความว่า "ภาพลวงตา", "ไม่เผยแพร่" . ข้อความแนะนำตัวที่ดีที่สุดเกี่ยวกับสถิติจะกล่าวถึงในระดับหนึ่ง หนึ่งที่ดีอย่างหนึ่งคือเป็นอิสระ Pisani, Purves, สถิติ นิวยอร์ก: WW Norton ทุกรุ่น
นิคค็อกซ์

8
คุณต้องถามตัวเองว่าการตัดสินใจของคุณจะเป็นอย่างไรถ้าค่า p คือ 0.051 เกิดอะไรขึ้นถ้ามันคือ 0.049 คุณจะตัดสินใจแตกต่างกันอย่างไร ทำไม?
AlefSin

2
ขอบคุณสำหรับความคิดเห็นของคุณ ในกรณีของเราเราไม่ได้ไตร่ตรองว่าข้อมูลนั้นเผยแพร่หรือไม่ ฯลฯ ... เรากำลังพิจารณาทำแถลงการณ์ในกระดาษเกี่ยวกับความสำคัญทางสถิติของผลลัพธ์นี้และเราต้องการให้แน่ใจว่าคำสั่งของเราไม่ถูกต้องหรือไม่ถูกต้อง .
อิสลาม El-Nabarawy

3
การรายงาน P = 0.04993 เป็นสิ่งที่ควรคำนึงถึง เป็นการยากที่จะทำนายความคิดเห็นของผู้ตรวจสอบหรือบรรณาธิการ หากคุณต้องการปัดเศษการระบุระเบียบการปัดเศษที่สอดคล้องกันนั้นเป็นความคิดที่ดีและเป็นที่ยอมรับอย่างกว้างขวางเสมอ บางคนอาจปัดเศษเป็น 3 dp และอาจใช้รูปแบบของการประชุมที่นำแสดงโดยดังนั้นการรายงาน 0.050 (3 dp) และนำแสดงโดยเนื่องจาก <0.05 สอดคล้องกัน
Nick Cox

2
ฉันไม่รู้ ... บางทีเราควรรัน bootstrap สองครั้งและคำนวณช่วงความเชื่อมั่นสำหรับค่า ! ในความซื่อสัตย์ทั้งหมดฉันจะรายงาน: "การค้นพบนี้มีความสำคัญต่อเขตแดน " ณ จุดนี้คุณจะมีขนและทุกคนก็จำได้ว่าในอัตราบวก 1/20 ของการบวกผิดเป็นวิธีการที่สมบูรณ์แบบในการใช้วิทยาศาสตร์ พี0.049<พี<0.050
AdamO

คำตอบ:


21

มีสองประเด็นที่นี่:

1) หากคุณกำลังทำการทดสอบสมมติฐานอย่างเป็นทางการ (และถ้าคุณกำลังทำเท่าที่อ้างถึงค่า p ในหนังสือของฉันที่คุณเป็นอยู่แล้ว) กฎการปฏิเสธอย่างเป็นทางการคืออะไร?

เมื่อเปรียบเทียบสถิติทดสอบค่าที่สำคัญมูลค่าที่สำคัญในภูมิภาคปฏิเสธ ในขณะที่ระเบียบนี้ไม่สำคัญมากเมื่อทุกอย่างต่อเนื่อง แต่จะสำคัญเมื่อการกระจายตัวของสถิติทดสอบไม่ต่อเนื่อง

ตามลําดับเมื่อเปรียบเทียบค่า p และระดับนัยสําคัญกฎคือ:

          ปฏิเสธถ้าพีα

โปรดทราบว่าแม้ว่าคุณจะโค้งมนของคุณ p-value ถึง 0.05 แน่นอนแม้ว่าคุ้มค่าเป็นสิ่ง 0.05, อย่างเป็นทางการคุณควรยังคงปฏิเสธพี

2) ในแง่ของ 'ค่า p ของเราบอกอะไรเรา' จากนั้นสมมติว่าคุณสามารถตีความค่า p เป็น 'หลักฐานต่อโมฆะ' (สมมติว่าความเห็นเกี่ยวกับสิ่งนั้นถูกแบ่งออกเป็นส่วน ๆ ) 0.0499 และ 0.0501 ไม่ใช่ จริง ๆ แล้วพูดสิ่งต่าง ๆ เกี่ยวกับข้อมูล (ขนาดของผลกระทบมีแนวโน้มที่จะเกือบเหมือนกัน)

ข้อเสนอแนะของฉันคือ (1) ปฏิเสธอย่างเป็นทางการและอาจชี้ให้เห็นว่าแม้ว่ามันจะเป็น 0.05 แต่ก็ยังควรถูกปฏิเสธ (2) โปรดทราบว่าไม่มีอะไรพิเศษเป็นพิเศษเกี่ยวกับและใกล้เคียงกับเส้นเขตแดนนั้นมาก - แม้ว่าเกณฑ์ที่มีนัยสำคัญน้อยกว่าเล็กน้อยจะไม่นำไปสู่การปฏิเสธα=0.05


2
แต่อีกครั้งคุณสามารถใช้อาร์กิวเมนต์ที่คล้ายกันมากเพื่อไม่ให้ปฏิเสธค่าว่าง ไม่มีอะไรพิเศษเกี่ยวกับ 0.05 ถ้าคุณเลือก 0.06 เป็นขีด จำกัด ของคุณคุณอาจจะไม่ถามคำถาม แต่สถานการณ์จะไม่แตกต่างกันมาก ... ความหมายชีวิตของผลลัพธ์นี้หรือไม่ ". เช่นถ้าเป็นการทดลองทางชีววิทยาฉันจะมองหานัยสำคัญทางชีวภาพของผลลัพธ์ที่เฉพาะเจาะจงรายงานค่า p ตามที่มันเป็นและค่อนข้างความคิดเห็นเกี่ยวกับชีววิทยา
โก้

@nico นี่เป็นจุดของรายการของฉันแล้ว (2); มันขัดแย้งกับการพึ่งพาอย่างเป็นทางการในวิธีการอย่างเป็นทางการใน (1)
Glen_b

ขอบคุณเกลนและนิโก้ ส่วนนี้ของข้อมูลเป็นข้อมูลรองของการทดลองของเราดังนั้นเราเพิ่งจะรายงานค่าตามที่เป็น ไม่ว่าในกรณีใดฉันกำลังทำเครื่องหมายว่านี่เป็นคำตอบที่ยอมรับได้ ขอขอบคุณอีกครั้งสำหรับทุกคนที่เข้าร่วมพร้อมคำตอบหรือความคิดเห็น
Islam El-Nabarawy

5

มันอยู่ในสายตาของคนดู

αα=0.05

ดังนั้นมันจึงเป็นเรื่องที่ AlefSin แสดงความคิดเห็นมาก่อน ไม่มีคำตอบที่ถูกต้องสำหรับคำถามของคุณ รายงานสิ่งที่คุณได้รับปัดเศษหรือไม่

มีวรรณกรรมมากมายเกี่ยวกับ "ความสำคัญของความสำคัญ"; ดูตัวอย่างกระดาษล่าสุดของหนึ่งในนักสถิติชั้นนำชาวเยอรมัน Walter Krämerเกี่ยวกับ "ลัทธิที่มีนัยสำคัญทางสถิติ - นักเศรษฐศาสตร์ควรทำอะไรและไม่ควรทำเพื่อพูดคุยข้อมูล" Schmollers Jahrbuch 131 , 455-468, 2011


-6

พี=0.05

ปัญหาสำคัญคือวลีนี้: "เราเจอข้อมูลบางอย่าง ... "

พีพี

มีชื่อการเรียงลำดับของการทุจริตทางสถิตินี้คือการขุดลอกข้อมูล ฉันสงสัยเกี่ยวกับการรายงานในบทความว่าเป็นสมมติฐานที่น่าสนใจ มันมีเหตุผลทางกายภาพที่คุณคาดหวังไว้หรือไม่?

อย่างไรก็ตามมีทางออกหนึ่งทาง บางทีคุณอาจจะตัดสินใจเบื้องต้นในการดำเนินการเพียงแค่นี้หนึ่งในการทดสอบเพียงแค่นี้หนึ่งชุดข้อมูล คุณเขียนมันลงในสมุดบันทึกแล็บของคุณต่อหน้าใครบางคนเพื่อให้คุณสามารถพิสูจน์ได้ในภายหลัง จากนั้นคุณก็ทำแบบทดสอบของคุณ

พี=0.05


14
นี่อาจเป็นมากกว่าการเลือกใช้ถ้อยคำที่เจาะจง คุณคิดว่าค่อนข้างมากจากสิ่งที่อาจเป็นเพียงตัวเลือกคำที่ไม่ดี - ไม่ใช่ทุกคนที่นี่ที่มีภาษาอังกฤษเป็นภาษาแรก แน่นอนว่าการเพิ่มขึ้นนั้นน่าจะเป็นปัญหาที่อาจเกิดขึ้นได้ แต่หากจะกล่าวถึงสิ่งต่าง ๆ อย่างหัวล้าน ("ไม่ใช่อย่างแน่นอน") ก็หมายความว่าคุณรู้มากกว่าที่เราจะบอกได้จากสิ่งที่นี่ (นอกจากนี้การอ้างอิงถึง 'สมุดบันทึกสำหรับห้องปฏิบัติการ' หมายถึง OP กำลังทำงานอยู่ในห้องทดลองฉันสงสัยว่าเป็นกรณีนี้อีกครั้งคุณหมายความว่าคุณรู้มากกว่าที่เรามีอยู่ที่นี่)
Glen_b -Reinstate Monica

10
Mike McCoy ขอบคุณสำหรับคำตอบของคุณ แต่ฉันเกรงว่าในกรณีนี้ Glen_b นั้นถูกต้อง ฉันไม่ได้เป็นเจ้าของภาษาอังกฤษและในขณะที่ฉันพยายามเขียนและพูดอย่างคล่องแคล่วตามที่ทักษะของฉันอนุญาตการใช้และความหมายแฝงฉันยังคงหลบหลีก ดังนั้นในกรณีนี้เราไม่ได้ลองทำสิ่งต่าง ๆ จนกว่าเราจะพบสิ่งที่สำคัญ ที่จริงแล้วสิ่งที่เราพยายามพิสูจน์คือไม่มีค่าความผิดพลาดเพิ่มขึ้นอย่างมีนัยสำคัญทางสถิติและในกรณีหนึ่งเราพบว่าข้อผิดพลาดนั้นลดลงจริง ๆ และเมื่อเราทำการทดสอบ W นี่คือจุดที่เราได้ 0.0499 .
Islam El-Nabarawy

1
ไมค์ฉันไม่เห็นปัญหาในการใช้คำพูดของคำถาม และดูเหมือนว่าไม่มีใครเห็นสัญญาณของการสอดแนมข้อมูลการขุดลอกขุดอะไรที่นี่ ... และมันก็อยู่ในสายตาของคนดู ไม่มีข้อเท็จจริงทางคณิตศาสตร์ แต่กฎการตัดสินใจที่เลือกโดยนักสถิติ อ่านสิ่งที่ AlefSin อีกครั้งในจุดที่เขา (2) และฉันเขียน
Skullduggery

3
@ IslamEl-Nabarawy หากคุณต้องการสร้างความเท่าเทียม / ขาดความแตกต่างคุณมีปัญหาอื่น ๆ อีกมากมายกว่าวิธีการตีความค่าใกล้เคียงกับเกณฑ์หรือการดักข้อมูลที่อาจเกิดขึ้น เพียงแค่ค้นหาค่าp-value ที่เกิน. 05 (หรือระดับข้อผิดพลาดใด ๆ ก็ตามที่คุณเลือก) นั้นไม่เพียงพออย่างแน่นอน ค้นหา“ การทดสอบความเท่าเทียม” ที่นี่และที่อื่น ๆ หรือถามคำถามโดยเฉพาะเกี่ยวกับสิ่งนั้นเพราะมันเป็นปัญหาที่แตกต่างอย่างสิ้นเชิง
งานกาล่า

4
"มีวิธีหนึ่งออกไปบางทีคุณอาจเลือกนิรนัยที่จะทดสอบเพียงชุดเดียวในชุดข้อมูลนี้คุณเขียนลงในสมุดบันทึกแล็บของคุณต่อหน้าใครบางคนเพื่อให้คุณสามารถพิสูจน์ได้ในภายหลังจากนั้น คุณทำแบบทดสอบของคุณหากคุณทำสิ่งนี้ผลลัพธ์ของคุณจะถูกต้องที่ระดับ p = 0.05 และคุณสามารถสำรองข้อมูลให้คลางแคลงเหมือนฉันมิฉะนั้นขออภัยมันไม่ใช่ผลลัพธ์ที่มีนัยสำคัญทางสถิติ "พูดคุยเกี่ยวกับความผิดจนกว่าจะพิสูจน์แล้ว ผู้บริสุทธิ์ ดังนั้นในกรณีที่ไม่มีหลักฐานทางนิติเวชที่วินิจฉัยว่าเป็นความไม่ซื่อสัตย์ทางวิชาการ Sheesh
GoF_Logistic
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.