เหตุใดค่า p ต่ำกว่าจึงไม่มีหลักฐานมากขึ้นต่อโมฆะ? ข้อโต้แย้งจาก Johansson 2011


31

Johansson (2011) ใน " ทักทายสิ่งที่เป็นไปไม่ได้: ค่า p, หลักฐานและโอกาส " (ที่นี่ยังเชื่อมโยงไปยังวารสาร ) ระบุว่าค่าต่ำกว่ามักจะถือว่าเป็นหลักฐานที่แข็งแกร่งต่อโมฆะ Johansson หมายความว่าคนจะพิจารณาหลักฐานโมฆะจะแข็งแกร่งถ้าทดสอบทางสถิติของพวกเขาออกมาพี -value ของ0.01 , กว่าถ้าทดสอบทางสถิติของพวกเขาออกมาพี -value ของ0.45 Johansson แสดงเหตุผลสี่ประการที่ทำให้ไม่สามารถใช้ค่าpเป็นหลักฐานต่อโมฆะ:pp0.01p0.45p

  1. ถูกกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่างดังนั้นจึงไม่สามารถระบุหลักฐานสำหรับโมฆะได้p
  2. เป็นเงื่อนไขเพียงอย่างเดียวในสมมติฐานว่างและดังนั้นจึงไม่เหมาะสมที่จะหาหลักฐานเชิงปริมาณเพราะหลักฐานมักจะสัมพันธ์กันในความรู้สึกของการเป็นหลักฐานสำหรับหรือต่อต้านสมมติฐานที่เกี่ยวข้องกับสมมติฐานอื่นp
  3. กำหนดความน่าจะเป็นในการได้มาซึ่งหลักฐาน (ให้เป็นโมฆะ) แทนที่จะเป็นความแข็งแกร่งของหลักฐานp
  4. ขึ้นอยู่กับข้อมูลที่ไม่ได้ตรวจสอบและความตั้งใจส่วนตัวและดังนั้นจึงมีนัยถึงการตีความที่เป็นหลักฐานว่ากำลังของหลักฐานที่สังเกตได้นั้นขึ้นอยู่กับสิ่งที่ไม่ได้เกิดขึ้นและความตั้งใจส่วนตัวp

น่าเสียดายที่ฉันไม่สามารถเข้าใจได้อย่างง่ายจากบทความของ Johansson ให้ฉัน -value ของ0.01แสดงว่ามีโอกาสน้อย null เป็นจริงกว่าP -value ของ0.45 เหตุใดค่าpต่ำกว่าจึงไม่มีหลักฐานที่ดีกว่าต่อโมฆะ? p0.01p0.45p


สวัสดี @luciano! ฉันเห็นว่าคุณยังไม่ได้รับคำตอบใด ๆ ในหัวข้อนี้ คุณต้องการคำตอบประเภทใด คำถามของคุณเกี่ยวกับข้อโต้แย้งของ Johannson โดยเฉพาะหรือโดยทั่วไปเกี่ยวกับค่า p ต่ำกว่าหรือไม่?
อะมีบาพูดว่า Reinstate Monica

ทั้งหมดนี้เกี่ยวกับเฟรมเวิร์กประจำของ Fisher vs Neyman-Pearson ดูข้อมูลเพิ่มเติมในคำตอบนี้โดย @gung
Firebug

คำตอบ:


21

การประเมินข้อโต้แย้งส่วนตัวของฉัน:

  1. pp
  2. p
  3. p
  4. ppppp<.05

pp

sq(x)/p(x)>t(s)tsq(x)/p(x)

q(x)p(x)P(q(X)/p(x)>tobsH0)ptobst(s)P(q(X)/p(x)>t(s)H0)=α


6
+1 สำหรับจุด 3 เพียงอย่างเดียว Cox อธิบายค่า p เป็นค่าสอบเทียบอัตราส่วนความน่าจะเป็น (หรือสถิติการทดสอบอื่น ๆ ) & เป็นมุมมองที่มักถูกลืม
Scortchi - Reinstate Monica

(+1) คำตอบที่ดี @Momo ฉันสงสัยว่าจะสามารถปรับปรุงได้หรือไม่โดยการเพิ่มบางอย่างเช่น "แต่พวกเขาเป็น!" ในฟอนต์ขนาดใหญ่ที่เป็นส่วนหัวของการตอบกลับของคุณเพราะนี่น่าจะเป็นคำตอบของคุณสำหรับคำถามไตเติ้ลของ OP "ทำไม p-values ​​ต่ำกว่าจึงไม่แสดงหลักฐานต่อต้าน null" คุณ debunk อาร์กิวเมนต์ที่กำหนดทั้งหมด แต่ไม่ได้ให้คำตอบสำหรับคำถามชื่ออย่างชัดเจน
อะมีบาพูดว่า Reinstate Monica

1
ฉันค่อนข้างลังเลที่จะทำเช่นนั้นมันเป็นสิ่งที่ละเอียดอ่อนมากและขึ้นอยู่กับสมมติฐานบริบท ฯลฯ ตัวอย่างเช่นคุณอาจแบนออกปฏิเสธว่าข้อความน่าจะเป็นสามารถใช้เป็น "หลักฐาน" และทำให้คำสั่งนั้นถูกต้อง ในมุมมองของชาวประมงมันไม่ได้เป็น นอกจากนี้ฉันจะไม่พูดว่าฉัน debunk ข้อโต้แย้งทั้งหมดฉันคิดว่าฉันให้มุมมองที่แตกต่างและชี้ให้เห็นข้อบกพร่องเชิงตรรกะบางอย่างในการโต้แย้ง ผู้เขียนระบุจุดของเขาได้ดีและพยายามที่จะให้วิธีการแก้ปัญหาที่เกี่ยวข้องซึ่งตัวมันเองอาจถูกมองว่าเป็นปัญหาอย่างเท่าเทียมกัน
Momo

9

เหตุผลที่ข้อโต้แย้งเช่น Johansson ถูกนำกลับมาใช้ใหม่บ่อยครั้งดูเหมือนจะเกี่ยวข้องกับความจริงที่ว่าค่า P เป็นดัชนีของหลักฐานต่อโมฆะ แต่ไม่ใช่การวัดของหลักฐาน หลักฐานมีมิติมากกว่าตัวเลขใด ๆ ที่สามารถวัดได้ดังนั้นจึงมีแง่มุมของความสัมพันธ์ระหว่างค่า P กับหลักฐานที่ผู้คนสามารถพบได้ยาก

ฉันได้ตรวจทานข้อโต้แย้งหลายข้อที่ Johansson ใช้ในบทความที่แสดงความสัมพันธ์ระหว่างค่า P กับค่าความน่าจะเป็นและหลักฐานดังนี้: http://arxiv.org/abs/1311.0081 แต่น่าเสียดายที่กระดาษได้ถูกปฏิเสธถึงสามครั้ง แม้ว่าข้อโต้แย้งและหลักฐานสำหรับพวกเขายังไม่ได้รับการข้องแวะ (ดูเหมือนว่าเป็นเรื่องน่ารังเกียจที่ผู้ตัดสินที่แสดงความคิดเห็นเหมือนของ Johansson ไม่ใช่คนผิด)


+1 @Michael Lew สิ่งที่เกี่ยวกับการเปลี่ยนชื่อ? ถึง P (ee) หรือไม่ไปที่ P (ee) ... ไม่ได้ฟังดูเหมือนเป็นปัญหา เราทุกคนรู้ว่าจะทำอย่างไรในสถานการณ์นั้น = D ล้อเล่นกันอะไรที่ทำให้กระดาษของคุณถูกปฏิเสธ?
ชายชราในทะเล

4

กำลังเพิ่มคำตอบที่ดีของ @ Momo:

1


2
เป็นที่น่าสังเกตว่าหลักฐานนั้นไม่ได้รับผลกระทบจากการทดสอบหลายหลากแม้ว่าการตอบสนองต่อหลักฐานอาจเปลี่ยนแปลงไป หลักฐานในข้อมูลเป็นหลักฐานในข้อมูลและไม่ได้รับผลกระทบจากการคำนวณใด ๆ ที่คุณอาจใช้ในคอมพิวเตอร์ของคุณ 'การแก้ไข' โดยทั่วไปของค่า p สำหรับการทดสอบหลายหลากเกี่ยวข้องกับการรักษาอัตราความผิดพลาดเชิงบวกที่ผิดพลาดไม่ใช่การแก้ไขความสัมพันธ์ระหว่างค่า p และค่าหลักฐานการทดลอง
Michael Lew

1

Johansson กำลังพูดถึงค่า p จากการทดลองสองแบบที่แตกต่างกันหรือไม่? ถ้าเป็นเช่นนั้นการเปรียบเทียบค่า p อาจเป็นการเปรียบเทียบแอปเปิ้ลกับเนื้อแกะ หากการทดสอบ "A" เกี่ยวข้องกับกลุ่มตัวอย่างจำนวนมากแม้ความแตกต่างเล็กน้อยที่ไม่สำคัญอาจมีนัยสำคัญทางสถิติ หากการทดสอบ "B" เกี่ยวข้องกับตัวอย่างเพียงไม่กี่ตัวอย่างความแตกต่างที่สำคัญอาจไม่มีนัยสำคัญทางสถิติ ยิ่งแย่ลง (นั่นคือเหตุผลที่ฉันพูดว่าเนื้อแกะและไม่ใช่ส้ม) เครื่องชั่งอาจเทียบไม่ได้เลย (psi ในหนึ่งและ kwh ในที่อื่น ๆ )


3
ความประทับใจของฉันคือ Johansson ไม่ได้พูดถึงการเปรียบเทียบค่า p จากการทดลองที่แตกต่างกัน เมื่อพิจารณาถึงความคิดเห็นของ & @ Glen_b คุณจะช่วยให้โพสต์ของคุณชัดเจนหรือไม่ Emil? เป็นเรื่องดีที่จะยกประเด็นที่เกี่ยวข้อง ('ฉันคิดว่า J ผิดในบริบท A แต่อาจมีข้อดีในบริบท B') แต่ต้องชัดเจนว่าเป็นสิ่งที่คุณกำลังทำอยู่ หากคุณกำลังถามคำถามหรือแสดงความคิดเห็นโปรดลบโพสต์นี้และทำให้เป็นความคิดเห็น
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.