รองรับมุมมองที่ยึดที่มั่นของค่า p


31

บางครั้งในรายงานฉันมีข้อจำกัดความรับผิดชอบเกี่ยวกับค่า p และสถิติเชิงอนุมานอื่น ๆ ที่ฉันได้ให้ไว้ ฉันบอกว่าเนื่องจากตัวอย่างไม่สุ่มดังนั้นสถิติดังกล่าวจะไม่ใช้อย่างเคร่งครัด ถ้อยคำเฉพาะของฉันมักจะได้รับในเชิงอรรถ:

"ในขณะที่การพูดอย่างเคร่งครัดสถิติเชิงอนุมานใช้ได้เฉพาะในบริบทของการสุ่มตัวอย่างเราปฏิบัติตามการประชุมในการรายงานระดับนัยสำคัญและ / หรือช่วงความเชื่อมั่นเป็นแนวทางที่สะดวกแม้สำหรับตัวอย่างที่ไม่สุ่มดูการอนุมานทางสถิติของ Michael Oakes : พฤติกรรมศาสตร์ (NY: Wiley, 1986)

ในโอกาสสองครั้ง - หนึ่งครั้งสำหรับเอกสารที่ผ่านการตรวจสอบโดยเพื่อนครั้งหนึ่งหรือสองครั้งในการตั้งค่าที่ไม่ใช่เชิงวิชาการ - บรรณาธิการหรือผู้ตรวจสอบคัดค้านข้อจำกัดความรับผิดชอบนี้เรียกมันว่าทำให้สับสนและรู้สึกว่าการค้นพบเชิงอนุมาน (และจะได้รับเสื้อคลุมของผู้มีอำนาจ) มีใครประสบปัญหานี้และหาทางออกที่ดี? ในอีกด้านหนึ่งความเข้าใจของผู้คนเกี่ยวกับค่า p โดยทั่วไปมักจะไม่พอใจแม้แต่ในบริบทของการสุ่มตัวอย่างดังนั้นบางทีมันอาจจะไม่สำคัญกับสิ่งที่เราพูด ในอีกทางหนึ่งการมีส่วนร่วมต่อไปกับความเข้าใจผิดดูเหมือนจะทำให้ส่วนหนึ่งของปัญหา ฉันควรเพิ่มว่าฉันมักจะจัดการกับการศึกษาการสำรวจที่ไม่ได้รับมอบหมายแบบสุ่มและสถานที่ที่การจำลองสถานการณ์ของมอนติคาร์โลมักจะล้มเหลวในการแก้ไขปัญหาของการเป็นตัวแทน


3
ความคิดเห็นเกี่ยวกับผู้ตรวจสอบเป็นเรื่องน่าเศร้าอย่างยิ่งใคร ๆ ก็หวังว่าคนที่อยู่ในตำแหน่งนั้นอย่างน้อยก็จะไม่แสดงความไม่รู้ของตนอย่างเปิดเผยและโดยการทำเช่นนั้นสนับสนุนการตีความวิธีการทางสถิติที่ผิดพลาดต่อไป
richiemorrisroe

8
แก้ไขให้ถูกต้องหากฉันผิด แต่การสุ่มตัวอย่างของการสุ่มตัวอย่างนั้นมีผลต่อระดับที่คุณสามารถสรุปผลการวิจัยได้ ในทางตรงกันข้ามการมอบหมายแบบสุ่มเป็นคุณสมบัติที่สำคัญยิ่งสำหรับการอนุมานเชิงสาเหตุ
Mike Lawrence

3
ไมค์ฉันเห็นด้วยกับคุณ คุณทำสิ่งนี้เพื่อขยายการสนทนาหรือเพื่อแสดงความไม่เห็นด้วยกับสิ่งที่ฉันพูดหรือไม่
rolando2

@richiemorrisroe: ใคร ๆ ก็คงโง่ที่จะคาดหวังว่าผู้วิจารณ์ทุกคน แต่ฉันคิดว่าคน ๆ หนึ่งสามารถหวังได้ในอนาคตที่เราสามารถคาดหวังได้และเราควรกดดันผู้เผยแพร่ให้ทำตามความต้องการและบังคับใช้มากกว่าที่พวกเขาทำในปัจจุบัน .. .Rolando ฉันคิดว่า Mike's เป็นเพียงจุดชี้แจงเพื่อทำให้เข้าใจผิดการสนทนานี้จากปัญหาที่เกี่ยวข้องกับการอนุมานสาเหตุ เห็นได้ชัดว่าบางคนพบว่ามีประโยชน์ แต่ฉันคิดว่ามันชัดเจนเพียงพอแล้วโดยส่วนตัว ถ้าฉันพูดถูกนี่เป็นการวัดความสับสนของคนอื่นเกี่ยวกับค่าpซึ่งเป็นแรงบันดาลใจให้กับโพสต์ดั้งเดิม!
Nick Stauner

คำตอบ:


11

ย่อมมีข้อโต้แย้งที่จะไม่รวมข้อจำกัดความรับผิดชอบ ตรงไปตรงมาฉันจะหาบทความสั้น ๆ เกี่ยวกับธรรมชาติของค่า p ในบทความในวารสารที่จะวางเล็กน้อยและสักครู่จะต้องหยุดและพยายามคิดว่าคุณทำอะไรโดยเฉพาะ .. .esereric ... เพื่อรับประกันการจัดสรรพื้นที่ว่างให้กับจุดที่กำหนด

โดยพื้นฐานแล้วในฐานะนักวิจารณ์ฉันจะเรียกมันว่าไม่จำเป็นเพราะผู้อ่านควรรู้แล้วว่าค่า p คืออะไรและทำอะไร ฉันอาจจะคัดค้านเพราะการทำบันทึกดังกล่าวไม่ได้ป้องกันการวิเคราะห์และการตีความที่เกี่ยวข้องกับค่า p แต่ก็ใส่เพียงแค่เสื้อคลุมของ "เชื่อฉันฉันรู้ว่าฉันกำลังทำอะไร" มันก็แปลก ๆ เหมือนกัน - "ฉันจะยืนหยัดอย่างกล้าหาญต่อค่า p แต่ไม่กล้าเลยที่ฉันจะไม่รายงาน"

เมื่อผมพิจารณา "มุมมองที่ยึดที่มั่นบน P-ค่า" ผมกังวลมากน้อยเกี่ยวกับสิ่งที่ชอบสิ่งที่คุณโพสต์ดังกล่าวข้างต้นและอื่นๆ อีกมากมายความกังวลเกี่ยวกับการเรียกร้องของผู้แสดงความคิดเห็นเกี่ยวกับนัยสำคัญทางสถิติเพื่อที่จะได้รับการตีพิมพ์หรือปรับโฟกัสของกระดาษ (ใส่ ดาวโดยการค้นพบและทันใดนั้นมันเป็นเรื่องใหญ่) หรือการผสมผสานนัยสำคัญทางสถิติเข้ากับความสำคัญของการค้นพบ


3
ฉันไม่คิดว่านี่เป็นคำตอบของ OP ฉันสมมติว่า @ rolando2 รายงานสถิติอื่น ๆ ที่เป็นศูนย์กลางในการสนทนาของเขา (เช่นขนาดของเอฟเฟกต์) และส่วนใหญ่รายงานค่าpเป็นวิธีหนึ่งในการรองรับความคาดหวังตามปกติแม้ว่าพวกเขาจะไม่ได้ใช้อย่างเคร่งครัด ด้วยเหตุนี้เราควรเลือกที่จะอ่านค่าpมากเกินไป เราควรพิจารณาแรงจูงใจของเขาสำหรับข้อจำกัดความรับผิดชอบ ผู้อ่านไม่รู้ว่าควรทำอะไร OP กล่าวถึงสิ่งนี้ ข้อจำกัดความรับผิดชอบส่งเสริมข้อสงสัยไม่ไว้วางใจ มันไม่แปลกที่วัตถุในมาตรฐานในขณะที่สอดคล้องกับมัน มันไม่ใช่ตัวหนา
Nick Stauner

@NickStauner ฉันไม่เห็นว่ามันไม่ "ตอบ" OP บางทีมันอาจไม่สนับสนุนสิ่งที่พวกเขาต้องการ แต่ในใจของฉันมันทั้งสองแตกต่างจากเนื้อหาจริงของกระดาษจริง ๆ และไร้ประโยชน์ - "นี่มันผิด แต่ฉันจะเป็นทหารราวกับว่ามัน ถูกต้องเพราะมันเป็นสิ่งที่คุณทุกคนคาดหวังว่า" ไม่ได้บอกฉันว่า wrongness เรื่อง
Fomite

3
คำถามของ OP: "มีใครประสบปัญหานี้และพบทางออกที่ดีหรือไม่" คำตอบของคุณจะไม่สนใจคำถามที่แท้จริงเพื่อตอบสนองต่อความคิดและส่วนใหญ่จะเสนอความคิดเห็นของคุณเกี่ยวกับสาเหตุที่ทำให้ความคิดนั้นถูกทิ้ง คุณเริ่มที่จะบอกใบ้ถึงการวิจารณ์เชิงสร้างสรรค์ของความคิดของ OP ว่า: คุณดูเหมือนจะไม่คิดว่าการอ้างอิงของ Oakes จะบอกคุณว่าทำไมมันถึงสำคัญ ฉันจะขยายนี้เล็กน้อยในคำตอบของฉันเอง
Nick Stauner

12

การใช้สถิติเชิงอนุมานสามารถพิสูจน์ได้ไม่เพียง แต่อิงจากแบบจำลองประชากร แต่ยังใช้แบบจำลองการสุ่มตัวอย่างด้วย หลังไม่ได้ตั้งสมมติฐานใด ๆ เกี่ยวกับวิธีการได้รับตัวอย่าง ในความเป็นจริงฟิชเชอร์เป็นคนหนึ่งที่แนะนำว่าแบบจำลองการสุ่มควรเป็นพื้นฐานสำหรับการอนุมานเชิงสถิติ (ซึ่งต่างจากเนย์แมนและเพียร์สัน) ดูตัวอย่าง:

เอินส์ท, MD (2004) วิธีการเรียงสับเปลี่ยน: พื้นฐานสำหรับการอนุมานที่แน่นอน วิทยาศาสตร์สถิติ, 19, 676-685 [ลิงค์ (เปิดการเข้าถึง)]

Ludbrook, J. & Dudley, H. (1998) ทำไมการทดสอบการเปลี่ยนรูปจึงเหนือกว่าการทดสอบ t และ F ในการวิจัยทางการแพทย์ นักสถิติชาวอเมริกัน, 52, 127-132 [ลิงค์ (ถ้าคุณมีการเข้าถึง JSTOR)]

ฉันสงสัยว่าตัวแก้ไขหรือผู้ตรวจสอบที่เป็นปัญหากำลังใช้สิ่งนี้เป็นเหตุผลในการเรียกข้อความปฏิเสธความรับผิดชอบของคุณว่า "ทำให้สับสน"


1
Wolfgang - จุดที่น่าสนใจและเป็นประโยชน์ ฉันควรจะอธิบายให้ชัดเจนว่างานของฉันส่วนใหญ่อยู่ในการสำรวจ
rolando2

7
หากเป้าหมายหลักคือการอนุมานบางอย่างกับประชากรและกลไกการสุ่มตัวอย่างมีลักษณะเช่นนั้นว่าการเป็นตัวแทนของกลุ่มตัวอย่างนั้นเป็นที่น่าสงสัยจริง ๆ แล้วการอนุมานใด ๆ ก็น่าสงสัยเช่นกัน โดยพื้นฐานแล้วคุณสามารถทำการอนุมานเฉพาะส่วนของประชากรที่กลไกการสุ่มตัวอย่างนั้นแสดงถึง ตามหลักการการอนุมานที่คุณทำจะเหมาะสมสำหรับส่วนนั้นของประชากร ไม่ว่าจะเป็นส่วนหนึ่งของประชากรที่คุณสนใจ (หรือผู้อ่าน) เป็นปัญหาอื่น
Wolfgang

7

พีในความเป็นจริงมีความจำเป็นต้องรายงานค่าแม้ว่าจะไม่มีความสำคัญในการศึกษาปัญหา - ปัญหา (ชั้นที่มากเกินไปที่ตีพิมพ์บทความตก) คนหนึ่งอาจดูถูกพวกเขาโดยปริยาย พิจารณาเน้นการบรรยายของคุณแทน - อาจเป็นพิเศษ - กับขนาดเอฟเฟกต์ หากการศึกษาของคุณเป็นตัวแทนอย่างเพียงพอที่จะให้ข้อมูลที่เป็นประโยชน์ (นี่ไม่จำเป็นต้องมีการสุ่มตัวอย่างอย่างสมบูรณ์ แต่ควรระมัดระวังในการตีความโดยทั่วไป) ขนาดของผลกระทบของคุณควรจะมีความหมายกว้างกว่าเพียงแสดงการดำรงอยู่และทิศทางของความสัมพันธ์ การมุ่งเน้นที่การอภิปรายเกี่ยวกับขนาดของเอฟเฟกต์จะช่วยให้เข้าใจได้ลึกซึ้งยิ่งขึ้นว่าความสัมพันธ์หรือความแตกต่างนั้นมีความสำคัญอย่างไรในทางปฏิบัติแม้ว่าจะต้องพิจารณาในบริบทของหัวข้อการศึกษาด้วยเช่นกันR=0.03พีพีพี

อีกทางเลือกหนึ่งที่อาจเป็นไปได้คือการขยายในเชิงอรรถของคุณ ทั้งคำอธิบายปัญหาของคุณในฐานะผู้ตรวจสอบมีประสบการณ์และคำตอบที่ได้รับการยอมรับในหน้านี้แนะนำว่ามีข้อมูลไม่เพียงพอที่จะอธิบายแรงจูงใจของคุณสำหรับการรวมถึงเชิงอรรถและไม่เพียงพอที่จะกระตุ้นให้ผู้อ่านติดตามการอ้างอิงของคุณ ที่คุณใช้อธิบายมันอย่างหนักแน่น ประโยคเดียวที่เพิ่มเติมแม้แต่คำพูดสั้น ๆ จากการอ้างอิงของคุณอาจไปไกลถึงการอธิบายคุณค่าของเชิงอรรถและกระตุ้นให้ผู้อ่านอ่านลึก ๆ เห็นได้ชัดว่าเชิงอรรถของคุณเป็นแรงกระตุ้นให้เกิดปฏิกิริยาตอบโต้ที่เรียบง่ายเป็นลบและไม่ย่อท้อต่อความพยายามที่คาดหวังของคุณเพื่อทำลายความพึงพอใจของพวกเขาเกี่ยวกับสมมติฐานที่ไม่เหมาะสมของพวกเขา ผู้อ่านอาจขี้เกียจน้อยทางปัญญาหากคุณป้อนข้อมูลลงในประเด็นหลัก ๆ หนึ่งหรือสองประเด็นเกี่ยวกับปัญหาที่พวกเขาอาจมองข้ามเป็นประจำ นอกจากนี้สำหรับปัญหาเฉพาะจำนวนมากด้วยพี

พี

พีพีพี

อ้างอิง

- สามี, SN (1992) ความคิดเห็นเกี่ยวกับการจำลองแบบP ค่าและหลักฐาน สถิติทางการแพทย์, 11 (7), 875–879
- Goodman, SN (2001) ของP- Values ​​และ Bayes: ข้อเสนอเล็กน้อย ระบาดวิทยา, 12 (3), 295–297 แปลจากhttp://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf
- Goodman, S. (2008) โหลสกปรก: ความเข้าใจผิดสิบสองค่าP สัมมนาทางโลหิตวิทยา, 45 (3), 135–140 แปลจากhttp://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf
- Gorroochurn, P. , Hodge, SE, Heiman, GA, Durner, M. , & Greenberg, DA (2007) การไม่จำลองแบบของการศึกษาแบบเชื่อมโยง:“ หลอกความล้มเหลว” เพื่อทำซ้ำ? พันธุศาสตร์ทางการแพทย์, 9 (6), 325–331 แปลจากhttp://www.nature.com/gim/journal/v9/n6/full/gim200755a.html
- Hurlbert, SH, & Lombardi, CM (2009) การล่มสลายครั้งสุดท้ายของกรอบการตัดสินใจเชิงทฤษฎีของ Neyman – Pearson และการเพิ่มขึ้นของ neoFisherian Annales Zoologici Fennici, 46 (5), 311–349 แปลจากhttp://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf
- Lew, MJ (2013) ถึง P หรือไม่ถึง P: ตามลักษณะเชิงประจักษ์ของค่า P และตำแหน่งในการอนุมานทางวิทยาศาสตร์ arXiv: 1311.0081 [stat.ME] ดึงมาจากhttp://arxiv.org/abs/1311.0081
- Nuzzo, R. (2014, 12 กุมภาพันธ์) วิธีการทางวิทยาศาสตร์: ข้อผิดพลาดทางสถิติ ข่าวธรรมชาติ, 506 (7487) แปลจากhttp://www.nature.com/news/scientific-method-statistical-errors-1.14700
- Rosenthal, R. , Rosnow, RL, & Rubin, DB (2000) ความแตกต่างและขนาดของผลกระทบในการวิจัยเชิงพฤติกรรม: วิธีการสหสัมพันธ์ สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์
- Senn, S. (2001) ไชโยสองค่า P-? วารสารระบาดวิทยาและชีวสถิติ, 6 (2), 193–204 แปลจากhttp://www.phil.vt.edu/dmayo/conference_2010/Senn%20Two%20Cheers%20Paper.pdf
- Wagenmakers, EJ (2007) วิธีแก้ปัญหาในทางปฏิบัติสำหรับปัญหาที่แพร่หลายของค่าp แถลงการณ์และการทบทวนทางจิตวิทยา, 14 (5), 779–804 แปลจากhttp://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf


3
การวิพากษ์วิจารณ์ P-values ​​ทั้งหมดนั้นไม่ถูกต้องหรือได้รับการรับประกัน คุณควรเห็นเอกสารสองฉบับนี้สำหรับจุดแข็งสองสามข้อต่อข้อคิดเห็นที่คุณอ้างถึง: สองเสียงไชโยสำหรับค่า P (โดยสตีเฟ่นเซนน์) phil.vt.edu/dmayo/conference_2010/ … ; ถึง P หรือไม่ To P (โดยฉัน) arxiv.org/abs/1311.0081
Michael Lew

1
จุดสุดยอด! ขอขอบคุณ! ฉันได้แก้ไขเล็กน้อยเพื่อรวมการมีส่วนร่วมของคุณและฉันอาจแก้ไขอีกเล็กน้อยเมื่อฉันเข้าใจพวกเขาดีพอที่จะรวมความหมายของพวกเขาเข้ากับส่วนที่เหลือของสิ่งที่ฉันพูด นี่คือเหตุผลที่ฉันรักการตรวจสอบข้าม ...
Nick Stauner

2
คุณมีหลักฐานการทดลองใด ๆ ที่สนับสนุนข้อกล่าวอ้างของคุณว่าการสันนิษฐานของ Edwards นั้นครอบคลุมไปถึงค่า p หรือไม่? ฉันพบว่าตัวเองสงสัยอย่างมาก วิธีการเปรียบเทียบของฉันฉันเห็นเอกสารสองฉบับที่แสดงให้เห็นว่าแม้กระทั่งนักวิทยาศาสตร์ข้อมูลที่มีประสบการณ์ก็ยังมีปัญหาในการประมาณค่าสัมประสิทธิ์สหสัมพันธ์จากสแกตเตอร์แปลง ดูเหมือนว่าคุณกำลังขอจากนักวิทยาศาสตร์มากขึ้นในการรับความรู้สึกของค่า ap หมายถึงในแง่ของความน่าจะเป็น ข้อโต้แย้งของคุณต่อฟังก์ชั่นความน่าจะเป็นเป็นเรื่องที่น่าสนใจ ... พวกมันมีแนวโน้มที่จะดูเหมือนเล็กน้อยหลังการแจกแจงใช่ไหม?
russellpierce

2
@rpierce ฉันไม่มีหลักฐานการทดลองเพื่อความเข้าใจผู้ใช้วิธีการทางสถิติ อย่างไรก็ตามฉันขอยืนยันว่าอย่างน้อยการศึกษาบางอย่างที่ได้ดำเนินการเพื่อดูว่าค่า p- ของนักวิทยาศาสตร์ 'เข้าใจผิดหรือไม่โดยไม่รวมตัวเลือกต่างๆในการอธิบายค่า p-value อย่างแท้จริง การเปรียบเทียบของคุณไม่ใกล้เพราะความจริงที่ว่าค่าสัมประสิทธิ์สหสัมพันธ์นั้นไม่ง่ายประมาณนั้นไม่ใช่ปัญหาเดียวกับการประเมินความแข็งแกร่งของหลักฐานจากค่า p
Michael Lew

1
@rpierce ฟังก์ชั่นความหนาแน่นของความน่าจะเป็นหลังจากเครื่องแบบก่อนจะเป็นสัดส่วนกับฟังก์ชันความน่าจะเป็น
Michael Lew
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.