เลื่อนเมาส์ไปที่ตำแหน่งใดก็ได้ แท็ก (←เป็นแท็กปลอม) ที่ปรากฏด้านล่างเพื่อดูข้อความที่ตัดตอนมาโดยย่อของวิกิ โปรดยกโทษให้การเว้นวรรคบรรทัด ฉันคิดว่ามันคุ้มค่าเพราะข้อความที่ตัดตอนมาจากแท็กอาจช่วยให้ผู้อ่านตรวจสอบความเข้าใจของศัพท์แสงในขณะที่อ่าน ข้อความที่ตัดตอนมาบางส่วนอาจสมควรได้รับการแก้ไขเช่นกันดังนั้นพวกเขาจึงสมควรได้รับการเผยแพร่ IMHO
p>.05 โดยปกติแล้วเราไม่ควรปฏิเสธ ด้วย null สมมติฐาน. ตรงกันข้ามพิมพ์-I-ข้อผิดพลาดหรือบวกเท็จเกิดขึ้นเมื่อหนึ่งปฏิเสธโมฆะเนื่องจากการสุ่มตัวอย่าง ข้อผิดพลาดหรือเหตุการณ์ผิดปกติอื่น ๆ ที่ทำให้ ตัวอย่าง ที่ไม่น่าเป็นอย่างอื่น (โดยปกติจะมี p<.05) เพื่อสุ่มตัวอย่างจาก a ประชากรซึ่ง null เป็นจริง ผลที่ได้ด้วยp>.05 ที่เรียกว่าบวกปลอมดูเหมือนว่าจะสะท้อนความเข้าใจผิดของสมมติฐานว่าง อย่างมีนัยสำคัญการทดสอบไอเอ็นจี (NHST) ความเข้าใจผิดไม่ใช่เรื่องผิดปกติในงานวิจัยที่ตีพิมพ์เนื่องจาก NHST มีชื่อเสียงในทางต่อต้าน นี่เป็นหนึ่งในเสียงร้องของการชุมนุมคชกรรมการบุกรุก (ซึ่งฉันสนับสนุน แต่ไม่ทำตาม ... ยัง) ฉันทำงานกับการแสดงผลที่ไม่ถูกต้องเช่นตัวเองจนกระทั่งเมื่อไม่นานมานี้
@DavidRobinson ถูกต้องในการสังเกตว่า p ไม่ใช่ความน่าจะเป็นของโมฆะที่เป็นเท็จ frequentistNHST นี่คือ (อย่างน้อย) หนึ่งในสามีของ(2008) "โหลสกปรก" ความเข้าใจผิดเกี่ยวกับpค่า (เห็นHurlbert & Lombardi 2009 ) ใน NHSTp คือ ความน่าจะเป็น ว่าจะวาดตัวอย่างสุ่มใด ๆ ในอนาคตด้วยวิธีเดียวกันกับที่จะแสดงความสัมพันธ์หรือความแตกต่าง (หรืออะไรก็ตาม ผลขนาด จะถูกทดสอบกับโมฆะหากมีขนาดของเอฟเฟกต์อื่น ๆ อยู่อย่างน้อยแตกต่างจากสมมติฐานว่างในขณะที่ตัวอย่างจากประชากรเดียวกันมีการทดสอบว่ามาถึงที่กำหนด pค่าถ้าเป็นจริง นั่นคือ,pความน่าจะเป็นของการได้รับตัวอย่างเช่นคุณที่ได้รับโมฆะ ; มันไม่ได้สะท้อนความน่าจะเป็นของโมฆะ - อย่างน้อยไม่ใช่โดยตรง ในทางกลับกันวิธีการแบบเบย์มีความภาคภูมิใจในสูตรการวิเคราะห์ทางสถิติที่มุ่งเน้นไปที่การประเมินหลักฐานสำหรับหรือต่อต้านก่อนทฤษฎีของผลกระทบที่ได้รับข้อมูลซึ่งพวกเขาอ้างว่าเป็นวิธีที่น่าสนใจยิ่งขึ้น( Wagenmakers, 2007 ) , ในข้อดีอื่น ๆ และการตั้งข้อเสียที่เป็นที่ถกเถียงกัน (เพื่อความเป็นธรรมดู " ข้อเสียของการวิเคราะห์แบบเบย์คืออะไร " คุณยังได้ให้ความเห็นกับบทความที่อาจมีคำตอบที่ดีเช่น: Moyé, 2008; Hurlbert & Lombardi, 2009 )
เนื้อหาที่เป็นโมฆะตามที่ระบุตามตัวอักษรมักจะเป็นไปได้มากกว่าที่จะไม่ผิดเพราะสมมติฐานที่เป็นโมฆะเป็นปกติธรรมดาสมมติฐานของศูนย์ผลแท้จริง (สำหรับตัวอย่างแบบเคาน์เตอร์ที่สะดวกดูคำตอบสำหรับ: " ชุดข้อมูลขนาดใหญ่ไม่เหมาะสมสำหรับการทดสอบสมมติฐานหรือไม่ ") ปัญหาเชิงปรัชญาเช่นผลกระทบจากผีเสื้อคุกคามตัวอักษรความถูกต้องของสมมติฐานดังกล่าว ดังนั้นค่า null จึงมีประโยชน์มากที่สุดโดยทั่วไปเป็นพื้นฐานของการเปรียบเทียบสำหรับสมมติฐานทางเลือกของเอฟเฟกต์ที่ไม่ใช่ศูนย์ ดังกล่าวสมมติฐานทางเลือกที่อาจจะยังคงเป็นไปได้มากขึ้นกว่าที่เป็นโมฆะหลังจากที่ข้อมูลได้รับการเก็บว่าจะได้รับที่จะเกิดขึ้นถ้าเป็นโมฆะเป็นความจริง ดังนั้นนักวิจัยมักจะสนับสนุนสมมติฐานทางเลือกจากหลักฐานต่อโมฆะ แต่นั่นไม่ใช่สิ่งที่P-ค่าปริมาณโดยตรง( Wagenmakers 2007 )
ตามที่คุณสงสัย นัยสำคัญทางสถิติ เป็นหน้าที่ของ ขนาดตัวอย่างเช่นเดียวกับขนาดผลและความสอดคล้อง (ดูคำตอบของ @ gung สำหรับคำถามล่าสุดว่า " การทดสอบแบบทดสอบจะมีนัยสำคัญทางสถิติได้อย่างไรหากความแตกต่างเฉลี่ยเกือบ 0? ") คำถามที่เรามักจะถามจากข้อมูลของเราคือ "ผลของการx
เปิดy
คืออะไร " ด้วยเหตุผลต่าง ๆ (รวมถึง IMO โปรแกรมการศึกษาที่เข้าใจผิดและมีข้อบกพร่องอย่างอื่นในสถิติโดยเฉพาะอย่างยิ่งที่สอนโดยนักสถิติที่ไม่ใช่) เรามักพบว่าตัวเองแทนที่จะถามคำถามที่เกี่ยวข้องอย่างแท้จริง "ความน่าจะเป็นของการสุ่มตัวอย่างข้อมูล จากประชากรที่x
ไม่มีผลกระทบy
หรือไม่ " นี่คือความแตกต่างที่สำคัญระหว่างการประมาณขนาดผลกระทบและการทดสอบอย่างมีนัยสำคัญตามลำดับ p คุณค่าตอบเพียงคำถามหลังโดยตรง แต่ผู้เชี่ยวชาญหลายคน (@rpierce อาจให้รายชื่อคุณดีกว่าฉันให้อภัยฉันที่ลากคุณเข้ามาในนี้!) แย้งว่านักวิจัยเข้าใจผิด pเป็นคำตอบสำหรับคำถามในอดีตของขนาดเอฟเฟกต์ทั้งหมดบ่อยเกินไป; ฉันเกรงว่าจะต้องเห็นด้วย
เพื่อตอบสนองโดยตรงมากขึ้นเกี่ยวกับความหมายของ .05<p<.95มันคือความน่าจะเป็นที่จะสุ่มตัวอย่างข้อมูลจากประชากรที่เป็นโมฆะ แต่แสดงความสัมพันธ์หรือความแตกต่างที่แตกต่างจากสิ่งที่โมฆะอธิบายตามตัวอักษรอย่างน้อยกว้างและสม่ำเสมอตามที่ข้อมูลของคุณทำ .. <สูดดม> ... อยู่ระหว่าง 5–95% บางคนอาจโต้แย้งว่านี่เป็นผลมาจากขนาดของกลุ่มตัวอย่างเนื่องจากการเพิ่มขนาดของกลุ่มตัวอย่างช่วยเพิ่มความสามารถในการตรวจจับขนาดของเอฟเฟกต์ขนาดเล็กและไม่คงที่และสร้างความแตกต่างจากขนาดศูนย์ อย่างไรก็ตามขนาดของเอฟเฟกต์ที่มีขนาดเล็กและไม่คงที่อาจเป็นไปได้≠นัยสำคัญทางสถิติ - อีกหนึ่งเรื่องของ Goodman's (2008) โหลสกปรก); สิ่งนี้ขึ้นอยู่กับความหมายของข้อมูลซึ่งนัยสำคัญทางสถิติเกี่ยวข้องกับตัวเองในระดับที่ จำกัด เท่านั้น ดูคำตอบของฉันข้างต้น
มันควรจะถูกต้องหรือไม่ที่จะเรียกผลลัพธ์ออกมาว่าเป็นเท็จอย่างแน่นอน (แทนที่จะได้รับการสนับสนุนเพียงอย่างเดียว) ถ้า ... p> 0.95?
เนื่องจากข้อมูลควรเป็นตัวแทนของการสังเกตเชิงประจักษ์โดยข้อเท็จจริงจึงไม่ควรเป็นเท็จ การอนุมานเกี่ยวกับพวกเขาเท่านั้นที่ควรเผชิญกับความเสี่ยงเช่นนี้ (ข้อผิดพลาดในการวัดเกิดขึ้นแน่นอนเกินไป แต่ปัญหานั้นอยู่นอกขอบเขตของคำตอบนี้ดังนั้นนอกเหนือจากการกล่าวถึงที่นี่ฉันจะปล่อยให้มันอยู่คนเดียว) ความเสี่ยงบางอย่างมีอยู่เสมอในการหาข้อสรุปเชิงบวกที่ผิดพลาด กว่าสมมติฐานทางเลือกอย่างน้อยนอกเสียจากว่าผู้อนุมานรู้ว่าไม่มีจริง เฉพาะในสถานการณ์ที่ยากต่อการเข้าใจความรู้ที่ว่าโมฆะนั้นเป็นจริงอย่างแท้จริงการอนุมานที่สนับสนุนสมมติฐานทางเลือกนั้นเป็นเท็จอย่างแน่นอน ... อย่างน้อยที่สุดเท่าที่ฉันจะจินตนาการได้ในขณะนี้
เห็นได้ชัดว่าการใช้งานหรือการประชุมที่แพร่หลายนั้นไม่ใช่อำนาจที่ดีที่สุดในการรับรองความถูกต้องหรือการอนุมาน แม้แต่แหล่งข้อมูลที่เผยแพร่ก็ยังมีความผิดพลาด ดูตัวอย่างเช่นการเข้าใจผิดในความหมาย p-value การอ้างอิงของคุณ( Hurlbert & Lombardi, 2009 )มีการอธิบายที่น่าสนใจของหลักการนี้ด้วย(หน้า 322):
StatSoft (2007) ภูมิใจนำเสนอบนเว็บไซต์ของพวกเขาว่าคู่มือออนไลน์ของพวกเขา“ เป็นแหล่งข้อมูลทางอินเทอร์เน็ตเพียงแห่งเดียวในสถิติที่แนะนำโดย Encyclopedia Brittanica” 'การเชื่อถือไม่ได้' เป็นสิ่งสำคัญอย่างยิ่งสำหรับสติกเกอร์กันชนที่บอกว่า [URL ที่ใช้งานไม่ได้ถูกแปลงเป็นข้อความไฮเปอร์ลิงก์]
อีกกรณีหนึ่งในจุด: วลีนี้ในบทความข่าวล่าสุดทางธรรมชาติ( Nuzzo, 2014 ) : "ค่า P, ดัชนีทั่วไปเพื่อความแข็งแรงของหลักฐาน ... " ดูWagenmakers ' (2007, หน้า 787) "ปัญหา 3:pค่าอย่าเปิดเผยหลักฐานเชิงสถิติเชิงปริมาณ "... อย่างไรก็ตาม @MichaelLew ( Lew, 2013 )ไม่เห็นด้วยกับวิธีที่คุณอาจพบว่ามีประโยชน์: เขาใช้pฟังก์ชั่นค่าความน่าจะเป็นของดัชนี แต่ในแหล่งข้อมูลที่ตีพิมพ์เหล่านี้ขัดแย้งกันอย่างน้อยก็ต้องผิด! (ในบางระดับฉันคิดว่า ... ) แน่นอนว่านี่ไม่เลวเท่า "ไม่น่าเชื่อถือ" ต่อ se ฉันหวังว่าฉันจะเกลี้ยกล่อมไมเคิลในการตีที่นี่โดยติดแท็กเขาตามที่ฉันมี (แต่ฉันไม่แน่ใจว่าแท็กผู้ใช้ส่งการแจ้งเตือนเมื่อมีการแก้ไข - ฉันไม่คิดว่าคุณใน OP ทำ) เขาอาจเป็นคนเดียวที่สามารถรักษา Nuzzo ได้ - แม้แต่ธรรมชาติเอง! ช่วยพวกเราโอบีวัน! (และให้อภัยฉันถ้าคำตอบของฉันที่นี่แสดงให้เห็นว่าฉันยังคงไม่เข้าใจความหมายของงานของคุณซึ่งฉันแน่ใจว่าฉันมีในกรณีใด ๆ ... ) BTW, Nuzzo ยังมีการป้องกันตัวที่น่าสนใจและการพิสูจน์ Wagenmaakers '"ปัญหา 3": ดู "สาเหตุน่าจะเป็น" ของ Nuzzo( กู๊ดแมน 2001 1992; Gorroochurn ฮ็อดจ์, Heiman, Durner และกรีนเบิร์ก 2007 ) สิ่งเหล่านี้อาจมีคำตอบที่คุณกำลังมองหา แต่ฉันสงสัยว่าฉันจะบอกได้
Re: d
คำถามหลายทางเลือกของคุณผมเลือก คุณอาจตีความบางแนวคิดผิดที่นี่ แต่คุณไม่ได้อยู่คนเดียวอย่างแน่นอนและฉันจะตัดสินให้คุณเพราะคุณเท่านั้นที่รู้ว่าคุณเชื่อในสิ่งใด การตีความที่ผิดนั้นหมายถึงความมั่นใจจำนวนหนึ่งในขณะที่การถามคำถามหมายถึงสิ่งที่ตรงกันข้ามและแรงกระตุ้นต่อคำถามเมื่อความไม่แน่นอนค่อนข้างน่ายกย่องและห่างไกลจากความแพร่หลายโชคไม่ดี เรื่องของธรรมชาติของมนุษย์นี้ทำให้ความไม่ถูกต้องของการประชุมของเราเศร้าอย่างไม่เป็นอันตรายและสมควรได้รับการร้องเรียนเช่นที่อ้างถึงที่นี่ (ขอขอบคุณในส่วนของคุณ!) อย่างไรก็ตามข้อเสนอของคุณไม่ถูกต้องสมบูรณ์เช่นกัน
การอภิปรายที่น่าสนใจของปัญหาที่เกี่ยวข้องกับ pค่าที่ฉันได้เข้าร่วมปรากฏในคำถามนี้: รองรับยึดที่มองเห็นวิวของ P-ค่า คำตอบของฉันแสดงรายการอ้างอิงสองสามข้อที่คุณอาจพบว่ามีประโยชน์สำหรับการอ่านเพิ่มเติมเกี่ยวกับปัญหาการตีความและทางเลือกอื่น ๆpค่า จะ forewarned: ฉันยังไม่ได้กดปุ่มด้านล่างนี้โดยเฉพาะอย่างยิ่งหลุมกระต่ายตัวเอง แต่อย่างน้อยผมสามารถบอกคุณได้ว่ามันลึกมาก ฉันยังคงเรียนรู้เกี่ยวกับมันด้วยตัวเอง (อื่นฉันสงสัยว่าฉันจะเขียนจากมุมมองแบบเบย์เพิ่มเติม: หรืออาจจะเป็นมุมมองของ NFSA! Hurlbert & Lombardi, 2009 )ฉันเป็นผู้มีอำนาจที่อ่อนแอที่สุดและฉันยินดีต้อนรับ การแก้ไขหรือนำเสนออย่างละเอียดอื่น ๆ อาจเสนอให้กับสิ่งที่ฉันได้พูดที่นี่ ทั้งหมดที่ฉันสามารถสรุปได้ก็คืออาจมีคำตอบที่ถูกต้องทางคณิตศาสตร์และอาจเป็นไปได้ว่าคนส่วนใหญ่เข้าใจผิด คำตอบที่ถูกต้องไม่ได้มาอย่างง่ายดายแน่นอนเนื่องจากการอ้างอิงต่อไปนี้แสดงให้เห็นถึง ...
ป.ล. ตามที่ได้รับการร้องขอ (เรียงลำดับ ... ฉันยอมรับว่าฉันเพิ่งจะแก้ปัญหานี้แทนการทำงานใน) คำถามนี้เป็นข้อมูลอ้างอิงที่ดีกว่าสำหรับการแจกแจงแบบสม่ำเสมอบางครั้งของpให้เป็นโมฆะ: " ทำไม p- ค่ากระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่าง? " สิ่งที่น่าสนใจเป็นพิเศษคือความคิดเห็นของ @ whuber ซึ่งยกระดับของข้อยกเว้น ในฐานะที่เป็นค่อนข้างจริงกับการอภิปรายโดยรวมฉันไม่ปฏิบัติตามข้อโต้แย้ง 100% นับประสานัยของพวกเขาดังนั้นฉันไม่แน่ใจว่าปัญหาเหล่านั้นด้วยpความสม่ำเสมอของการกระจายนั้นยอดเยี่ยมจริงๆ สาเหตุเพิ่มเติมสำหรับความสับสนทางสถิติที่ฝังลึกฉันกลัว ...
อ้างอิง
- สามี, SN (1992) ความคิดเห็นเกี่ยวกับการจำลองแบบP ค่าและหลักฐาน สถิติทางการแพทย์, 11 (7), 875–879
- Goodman, SN (2001) ของค่า Pและค่า Bayes: ข้อเสนอเล็กน้อย ระบาดวิทยา, 12 (3), 295–297 แปลจากhttp://swfsc.noaa.gov/uploadedFiles/Divisions/PRD/Programs/ETP_Cetacean_Assessment/Of_P_Values_and_Bayes__A_Modest_Proposal.6.pdf
- Goodman, S. (2008) โหลสกปรก: ความเข้าใจผิดสิบสองค่าP สัมมนาทางโลหิตวิทยา, 45 (3), 135–140 แปลจากhttp://xa.yimg.com/kq/groups/18751725/636586767/name/twelve+P+value+misconceptions.pdf
- Gorroochurn, P. , Hodge, SE, Heiman, GA, Durner, M. , & Greenberg, DA (2007) การจำลองแบบของการศึกษาแบบเชื่อมโยง:“ หลอกหลอกล้มเหลว” เพื่อทำซ้ำ? พันธุศาสตร์ทางการแพทย์, 9 (6), 325–331 แปลจากhttp://www.nature.com/gim/journal/v9/n6/full/gim200755a.html
- Hurlbert, SH, & Lombardi, CM (2009) การล่มสลายครั้งสุดท้ายของกรอบการตัดสินใจเชิงทฤษฎีของ Neyman – Pearson และการเพิ่มขึ้นของ neoFisherian Annales Zoologici Fennici, 46 (5), 311–349 แปลจากhttp://xa.yimg.com/kq/groups/1542294/508917937/name/HurlbertLombardi2009AZF.pdf
- Lew, MJ (2013) ถึง P หรือไม่ถึง P: ตามลักษณะเชิงประจักษ์ของค่า P และตำแหน่งในการอนุมานทางวิทยาศาสตร์ arXiv: 1311.0081 [stat.ME] ดึงมาจากhttp://arxiv.org/abs/1311.0081
- Moyé, LA (2008) Bayesians ในการทดลองทางคลินิก: หลับที่สวิตช์ สถิติทางการแพทย์, 27 (4), 469–482
- Nuzzo, R. (2014, 12 กุมภาพันธ์) วิธีการทางวิทยาศาสตร์: ข้อผิดพลาดทางสถิติ ข่าวธรรมชาติ, 506 (7487) แปลจากhttp://www.nature.com/news/scientific-method-statistical-errors-1.14700
- Wagenmakers, EJ (2007) วิธีการแก้ปัญหาในทางปฏิบัติเพื่อแก้ไขปัญหาค่าp แถลงการณ์และการทบทวนทางจิตวิทยา, 14 (5), 779–804 แปลจากhttp://www.brainlife.org/reprint/2007/Wagenmakers_EJ071000.pdf