คำถามติดแท็ก p-value

ในการทดสอบสมมติฐานบ่อยครั้ง พี- ค่าคือความน่าจะเป็นของผลลัพธ์ที่รุนแรง (หรือมากกว่า) กว่าผลที่สังเกตได้ภายใต้สมมติฐานที่ว่าสมมติฐานว่างเป็นจริง

16
ความหมายของค่า p และค่า t ในการทดสอบทางสถิติคืออะไร?
หลังจากลงเรียนวิชาสถิติแล้วพยายามช่วยเหลือเพื่อนนักเรียนฉันสังเกตเห็นวิชาหนึ่งที่ดลใจให้อาจารย์ใหญ่ตีกันมากคือตีความผลการทดสอบสมมติฐานทางสถิติ ดูเหมือนว่านักเรียนจะเรียนรู้วิธีการคำนวณตามที่กำหนดโดยการทดสอบที่กำหนดได้อย่างง่ายดาย เครื่องมือที่ใช้คอมพิวเตอร์หลายเครื่องรายงานผลการทดสอบในรูปของ "ค่า p" หรือ "ค่าที" คุณจะอธิบายประเด็นต่อไปนี้ให้กับนักเรียนที่เรียนหลักสูตรแรกในสถิติได้อย่างไร: "p-value" หมายถึงอะไรที่เกี่ยวข้องกับสมมติฐานที่กำลังทดสอบ มีกรณีที่ควรมองหาค่า p สูงหรือค่า p ต่ำหรือไม่ ความสัมพันธ์ระหว่างค่า p และค่า t คืออะไร?

6
เหตุใดค่า p จึงกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่าง?
เมื่อเร็ว ๆ นี้ฉันได้พบในหนังสือพิมพ์โดย Klammer และคณะ คำสั่งที่ค่า p ควรกระจายอย่างสม่ำเสมอ ฉันเชื่อผู้แต่ง แต่ไม่เข้าใจว่าทำไมจึงเป็นเช่นนั้น Klammer, AA, Park, CY และ Stafford โนเบิลดับบลิว (2009) สถิติการสอบเทียบของฟังก์ชั่น SEQUEST XCorr วารสารวิจัยโปรตีน 8 (4): 2106–2113
115 p-value  uniform 

8
ASA กล่าวถึงข้อ จำกัด ของ
เรามีแท็กหลายเธรดที่ติดแท็กเป็นค่า pที่เปิดเผยความเข้าใจผิดมากมายเกี่ยวกับพวกเขา สิบเดือนที่ผ่านมาเรามีหัวข้อเกี่ยวกับวารสารจิตวิทยาที่ "ต้องห้าม" -valuesพีppตอนนี้สมาคมอเมริกันสถิติ (2016)กล่าวว่ามีการวิเคราะห์ของเราที่เรา "ไม่ควรจบลงด้วยการคำนวณที่ -value"พีpp สมาคมสถิติอเมริกัน (ASA) เชื่อว่าชุมชนวิทยาศาสตร์จะได้รับประโยชน์จากคำแถลงอย่างเป็นทางการที่อธิบายถึงหลักการที่ใช้กันอย่างแพร่หลายในการใช้และการตีความอย่างเหมาะสมพีpp คณะกรรมการระบุวิธีการอื่น ๆ ซึ่งอาจเป็นทางเลือกหรือข้อมูลเพิ่มเติมเกี่ยวกับค่า :พีpp ในมุมมองของการใช้ผิดวิธีที่แพร่หลายและความเข้าใจผิดเกี่ยวกับค่า , สถิติบางคนชอบที่จะเสริมหรือแม้กระทั่งแทนที่ค่า ด้วยวิธีการอื่น ๆ เหล่านี้รวมถึงวิธีการที่เน้นการประมาณค่าการทดสอบเช่นความมั่นใจความน่าเชื่อถือหรือช่วงการทำนาย วิธีการแบบเบย์ มาตรการทางเลือกของหลักฐานเช่นอัตราส่วนความน่าจะเป็นหรือปัจจัยเบย์ และแนวทางอื่น ๆ เช่นการสร้างแบบจำลองเชิงทฤษฎีการตัดสินใจและอัตราการค้นพบที่ผิด มาตรการและวิธีการทั้งหมดเหล่านี้ขึ้นอยู่กับสมมติฐานต่อไป แต่พวกเขาอาจระบุขนาดของผลกระทบโดยตรง (และความไม่แน่นอนที่เกี่ยวข้อง) หรือว่าสมมติฐานนั้นถูกต้องหรือไม่พีพีppพีpp ดังนั้นขอจินตนาการหลัง -values ความเป็นจริง ASA แสดงวิธีการบางอย่างที่สามารถใช้แทนค่าแต่ทำไมถึงดีกว่า ข้อใดที่สามารถทดแทนชีวิตจริงสำหรับนักวิจัยที่ใช้ค่าสำหรับทุกชีวิตของเขา? ฉันคิดว่าชนิดของคำถามนี้จะปรากฏในโพสต์ -values ความเป็นจริงดังนั้นบางทีเรามาพยายามที่จะเป็นขั้นตอนหนึ่งไปข้างหน้าของพวกเขา อะไรคือทางเลือกที่สมเหตุสมผลที่สามารถนำไปใช้นอกกรอบได้? ทำไมวิธีนี้ควรทำให้นักวิจัยหัวหน้าบรรณาธิการหรือผู้อ่านนำของคุณเข้าใจพีพีพีพีppพีppพีppพีpp เนื่องจากรายการบล็อกติดตามผลนี้แนะนำค่าจึงไม่สามารถเอาชนะได้ในความเรียบง่าย:พีpp p-value ต้องการเพียงแบบจำลองทางสถิติสำหรับพฤติกรรมของสถิติภายใต้สมมติฐานว่างเพื่อเก็บไว้ แม้ว่ารูปแบบของสมมติฐานทางเลือกจะใช้ในการเลือกสถิติ "ดี" (ซึ่งจะใช้สำหรับการสร้าง p-value) รูปแบบทางเลือกนี้ไม่จำเป็นต้องถูกต้องเพื่อให้ p-value …

9
นี่เป็นวิธีที่ค่า p ทำงานได้จริงหรือ งานวิจัยหนึ่งล้านชิ้นต่อปีสามารถใช้แบบแผนที่บริสุทธิ์ได้หรือไม่?
ฉันมากใหม่สถิติและฉันแค่เรียนรู้ที่จะเข้าใจพื้นฐานรวมทั้ง -values แต่ตอนนี้มีเครื่องหมายคำถามขนาดใหญ่ในใจของฉันและฉันหวังว่าฉันจะเข้าใจผิด นี่คือกระบวนการคิดของฉัน:พีpp ไม่ใช่งานวิจัยทั่วโลกเหมือนลิงในทฤษฎีบทอนันต์ลิงหรือไม่? พิจารณาว่ามีมหาวิทยาลัย 23887 แห่งในโลก หากแต่ละมหาวิทยาลัยมีนักศึกษา 1,000 คนนั่นคือนักเรียน 23 ล้านคนในแต่ละปี สมมติว่าในแต่ละปีนักเรียนแต่ละคนไม่อย่างน้อยหนึ่งชิ้นส่วนของการวิจัยโดยใช้การทดสอบสมมติฐานด้วย\α = 0.05α=0.05\alpha=0.05 นั่นไม่ได้หมายความว่าแม้ว่าตัวอย่างการวิจัยทั้งหมดจะถูกดึงจากประชากรสุ่ม แต่ประมาณ 5% ของพวกเขาจะ "ปฏิเสธสมมติฐานว่างเปล่าว่าไม่ถูกต้อง" ว้าว. ลองคิดดู นั่นคือประมาณหนึ่งล้านงานวิจัยต่อปีได้รับการเผยแพร่เนื่องจากผลลัพธ์ "สำคัญ" หากนี่เป็นวิธีการทำงานนี่น่ากลัว มันหมายความว่า "ความจริงทางวิทยาศาสตร์" จำนวนมากที่เราได้รับนั้นขึ้นอยู่กับการสุ่มอย่างแท้จริง รหัส R อันเรียบง่ายดูเหมือนจะสนับสนุนความเข้าใจของฉัน: library(data.table) dt <- data.table(p=sapply(1:100000,function(x) t.test(rnorm(10,0,1))$p.value)) dt[p<0.05,] ดังนั้นบทความนี้ในที่ประสบความสำเร็จ -fishing: ฉันหลงกลล้านในความคิดของช็อคโกแลตช่วยลดน้ำหนัก นี่คือวิธีการพีpp ทั้งหมดนี้มีไว้เพื่ออะไรหรือ? นี่เป็นวิธีที่ "วิทยาศาสตร์" ควรทำงานหรือไม่

2
เรารู้มากแค่ไหนเกี่ยวกับการแฮ็ก p-in“ ในป่า”?
วลีp -hacking (เช่น: "data dredging" , "snooping" หรือ "Fishing") หมายถึงการทุจริตต่อหน้าที่ทางสถิติหลายรูปแบบซึ่งผลลัพธ์กลายเป็นนัยสำคัญทางสถิติเชิงประจักษ์ มีหลายวิธีในการจัดหาผลลัพธ์ "ที่สำคัญกว่า" ซึ่งรวมถึง แต่ไม่ จำกัด เพียง: วิเคราะห์เฉพาะชุดย่อย "น่าสนใจ" ของข้อมูลซึ่งพบรูปแบบ ล้มเหลวในการปรับอย่างเหมาะสมสำหรับการทดสอบหลายรายการโดยเฉพาะการทดสอบหลังการทดสอบและความล้มเหลวในการรายงานการทดสอบที่ไม่ได้มีนัยสำคัญ ลองการทดสอบที่แตกต่างกันของสมมติฐานเดียวกันเช่นทั้งการทดสอบแบบพารามิเตอร์และแบบไม่อิงพารามิเตอร์ ( มีการพูดคุยกันในหัวข้อนี้ ) แต่มีการรายงานที่สำคัญที่สุดเท่านั้น ทำการทดลองกับการรวม / แยกจุดข้อมูลจนกว่าจะได้ผลลัพธ์ที่ต้องการ โอกาสครั้งหนึ่งเกิดขึ้นเมื่อ "การทำความสะอาดข้อมูลผิดปกติ" แต่เมื่อใช้คำจำกัดความที่คลุมเครือ (เช่นในการศึกษาทางเศรษฐมิติของ "ประเทศที่พัฒนาแล้ว" คำจำกัดความที่แตกต่างกันทำให้เกิดกลุ่มประเทศที่แตกต่างกัน) หรือเกณฑ์การคัดเลือกเชิงคุณภาพ อาจเป็นข้อโต้แย้งที่สมดุลอย่างละเอียดว่าวิธีการศึกษาเฉพาะนั้นมีความแข็งแกร่งเพียงพอที่จะรวม); ตัวอย่างก่อนหน้านี้เกี่ยวข้องกับการหยุดที่ไม่จำเป็นเช่นการวิเคราะห์ชุดข้อมูลและตัดสินใจว่าจะรวบรวมข้อมูลมากขึ้นหรือไม่ขึ้นอยู่กับข้อมูลที่เก็บจนถึงปัจจุบัน ("นี่เป็นสิ่งสำคัญเกือบจะเป็นไปได้ลองวัดนักเรียนอีกสามคน!") ในการวิเคราะห์ การทดลองระหว่างการปรับตัวแบบจำลองโดยเฉพาะอย่างยิ่ง covariates ที่จะรวม แต่ยังเกี่ยวกับการแปลงข้อมูล / รูปแบบการทำงาน ดังนั้นเราจึงรู้ว่าการแฮ็คpสามารถทำได้ มันมักจะถูกระบุว่าเป็นหนึ่งใน"อันตรายของp-value "และถูกกล่าวถึงในรายงาน ASA เกี่ยวกับนัยสำคัญทางสถิติที่กล่าวถึงที่นี่ในการตรวจสอบข้ามดังนั้นเราจึงรู้ว่ามันเป็นสิ่งที่ไม่ดี …

9
เกี่ยวกับค่า p ทำไม 1% และ 5% ทำไมไม่ 6% หรือ 10%
เกี่ยวกับp-value s ผมสงสัยว่าทำไม % และ % ดูเหมือนจะเป็นมาตรฐานทองคำสำหรับ ทำไมค่าอื่น ๆ เช่น % หรือ %111555"statistical significance"666101010 มีเหตุผลทางคณิตศาสตร์พื้นฐานสำหรับเรื่องนี้หรือนี่เป็นเพียงการประชุมที่จัดขึ้นอย่างกว้างขวาง?

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

4
วารสารจิตวิทยาห้ามค่า p และช่วงความเชื่อมั่น; ควรหยุดใช้พวกเขาจริง ๆ หรือ?
25 กุมภาพันธ์ 2015 วารสารจิตวิทยาพื้นฐานและประยุกต์ใช้สังคม ออกบทบรรณาธิการห้าม -values และช่วงความเชื่อมั่นจากเอกสารทั้งหมดในอนาคตppp โดยเฉพาะพวกเขากล่าวว่า (การจัดรูปแบบและเน้นเป็นของฉัน): [... ] ก่อนที่จะตีพิมพ์ผู้เขียนจะต้องลบร่องรอยทั้งหมดของ NHSTP [ขั้นตอนการทดสอบนัยสำคัญสมมติฐานที่ว่างเปล่า] ( -values, t -values, F- Values, แถลงการณ์เกี่ยวกับความแตกต่างของ 'นัยสำคัญ' หรือขาด และอื่น ๆ )ppptttFFF คล้ายกับวิธีที่ NHSTP ไม่สามารถให้ความน่าจะเป็นของสมมติฐานว่างซึ่งเป็นสิ่งจำเป็นในการสร้างกรณีที่แข็งแกร่งสำหรับการปฏิเสธช่วงเวลาความเชื่อมั่นไม่ได้ให้กรณีที่แข็งแกร่งสำหรับการสรุปว่าพารามิเตอร์ประชากรที่น่าสนใจน่าจะอยู่ภายในระยะเวลาที่กำหนด ระยะห่าง ดังนั้นช่วงความเชื่อมั่นจึงถูกแบนจาก BASP [... ] ด้วยความเคารพต่อวิธีการแบบเบส์เราขอสงวนสิทธิ์ในการตัดสินเป็นกรณี ๆ ไปและขั้นตอนแบบเบย์นั้นไม่จำเป็นหรือถูกแบนจาก BASP [... ] จำเป็นต้องมีกระบวนการทางสถิติเชิงอนุมานหรือไม่? - ไม่ [... ] อย่างไรก็ตาม BASP จะต้องมีสถิติเชิงพรรณนาที่รัดกุมรวมถึงขนาดผลกระทบ pppppp ppp …

4
เมื่อใดที่จะใช้เฟรมเวิร์ก Fisher และ Neyman-Pearson
ฉันอ่านมากเมื่อเร็ว ๆ นี้เกี่ยวกับความแตกต่างระหว่างวิธีการทดสอบสมมติฐานของฟิชเชอร์กับโรงเรียนแห่งความคิดของเนย์แมน - เพียร์สัน คำถามของฉันคือไม่สนใจการคัดค้านทางปรัชญาสักครู่; เมื่อใดที่เราควรใช้วิธีการของชาวประมงในการสร้างแบบจำลองทางสถิติและเมื่อใดควรใช้วิธีการของเนย์แมน - เพียร์สันในระดับนัยสำคัญและอื่น ๆ ? มีวิธีปฏิบัติหรือไม่ในการตัดสินใจเลือกมุมมองที่จะรับรองในปัญหาการปฏิบัติที่ได้รับ?

3
นี่เป็นวิธีแก้ไขปัญหาค่า p หรือไม่
ในเดือนกุมภาพันธ์ 2559 สมาคมสถิติอเมริกันออกแถลงการณ์อย่างเป็นทางการเกี่ยวกับนัยสำคัญทางสถิติและค่า p หัวข้อของเราเกี่ยวกับมันกล่าวถึงปัญหาเหล่านี้อย่างกว้างขวาง อย่างไรก็ตามไม่มีผู้มีอำนาจออกมาเสนอทางเลือกที่ได้รับการยอมรับในระดับสากลจนถึงปัจจุบัน สมาคมสถิติอเมริกัน (ASS) ได้เผยแพร่การตอบสนองค่า p: มีอะไรต่อไป "p-value ไม่ค่อยดีเท่าไหร่" เราคิดว่า ASA ไม่ได้ไปไกลพอ ถึงเวลาที่ต้องยอมรับว่ายุคของค่า p จบลงแล้ว นักสถิติได้ใช้พวกเขาในการทำให้นักศึกษาปริญญาตรียุ่งเหยิงหลอกนักวิทยาศาสตร์และบรรณาธิการหลอกไปทุกที่ แต่โลกเริ่มมองผ่านอุบายนี้ เราจำเป็นต้องละทิ้งความพยายามในช่วงต้นศตวรรษที่ 20 โดยนักสถิติเพื่อควบคุมการตัดสินใจ เราต้องกลับไปที่สิ่งที่ใช้งานได้จริง ข้อเสนอ ASS อย่างเป็นทางการคือ: แทนที่ค่า p, ASS สนับสนุน STOP (ขั้นตอนการ SeaT-Of-Pants) วิธีการที่ได้รับเกียรติและผ่านการทดสอบครั้งนี้ถูกใช้โดยชาวกรีกโบราณชายยุคฟื้นฟูศิลปวิทยาและนักวิทยาศาสตร์ทุกคนจนกระทั่งโรนัลด์ฟิชเชอร์เข้ามาและทำลายสิ่งต่างๆ STOP นั้นง่ายตรงตามข้อมูลและเชื่อถือได้ เพื่อดำเนินการร่างอำนาจ (ชายที่มีอายุมากกว่าโดยการตั้งค่า) ตรวจสอบข้อมูลและตัดสินใจว่าพวกเขาเห็นด้วยกับความเห็นของเขา เมื่อเขาตัดสินใจว่าจะทำผลก็คือ“ สำคัญ” มิฉะนั้นแล้วมันก็ไม่ใช่และทุกคนจะต้องลืมเรื่องทั้งหมด หลักการ การตอบสนองที่อยู่ของแต่ละหกหลักการ ASA STOP สามารถระบุว่าข้อมูลไม่เข้ากันกับแบบจำลองทางสถิติที่ระบุได้อย่างไร เราชอบวลีนี้เพราะมันเป็นวิธีแฟนซีในการบอกว่า …

8
อะไรคือตัวอย่างที่ดีและน่าเชื่อถือที่ค่า p มีประโยชน์?
คำถามของฉันในชื่อเป็นคำอธิบายตัวเอง แต่ฉันต้องการที่จะให้บริบท ASA ออกแถลงการณ์เมื่อต้นสัปดาห์นี้“ บนค่า p: บริบทกระบวนการและวัตถุประสงค์ ” สรุปความเข้าใจผิดที่หลากหลายของค่า p และเรียกร้องให้ระมัดระวังไม่ใช้โดยไม่มีบริบทและความคิด (ซึ่งอาจกล่าวได้เพียงเกี่ยวกับ วิธีการทางสถิติใด ๆ จริงๆ) ในการตอบสนองต่อ ASA ศาสตราจารย์ Matloff เขียนบล็อกโพสต์หัวข้อ: หลังจาก 150 ปี, เอเอสเอกล่าวว่าไม่มีค่า P- จากนั้นอาจารย์ Benjamini (และฉัน) โพสต์ตอบกลับหัวข้อมันไม่ใช่ความผิด P-ค่า - การสะท้อนความเห็นในงบ เพื่อตอบสนองต่อมันศาสตราจารย์ Matloff ถามในโพสต์ติดตาม : สิ่งที่ฉันต้องการเห็น [... คือ] - เป็นตัวอย่างที่ดีและน่าเชื่อถือซึ่งค่า p มีประโยชน์ นั่นจะต้องเป็นบรรทัดล่าง เพื่ออ้างถึงสองข้อโต้แย้งที่สำคัญของเขากับประโยชน์ของค่า:ppp ด้วยตัวอย่างขนาดใหญ่การทดสอบอย่างมีนัยสำคัญจะกระโจนเข้าหาตัวเล็ก ๆ ซึ่งไม่สำคัญออกไปจากสมมติฐานว่าง เกือบจะไม่มีสมมติฐานว่างใด ๆ …

3
การอ้างอิงที่มีข้อโต้แย้งเปรียบเทียบกับการทดสอบนัยสำคัญสมมุติฐานว่าง?
ในช่วงไม่กี่ปีที่ผ่านมาฉันได้อ่านเอกสารจำนวนหนึ่งที่โต้แย้งการใช้การทดสอบสมมติฐานที่ไม่มีนัยสำคัญทางวิทยาศาสตร์ในทางวิทยาศาสตร์ แต่ไม่คิดว่าจะเก็บรายการถาวร เมื่อเร็ว ๆ นี้มีเพื่อนร่วมงานคนหนึ่งขอให้ฉันทำรายการแบบนี้ฉันคิดว่าฉันจะขอให้ทุกคนที่นี่ช่วยสร้างมันขึ้นมา เพื่อเริ่มต้นสิ่งต่าง ๆ นี่คือสิ่งที่ฉันมีจนถึงตอนนี้: Johansson (2011) "ยกย่องสิ่งที่เป็นไปไม่ได้: ค่า p, หลักฐานและความน่าจะเป็น" Haller & Kraus (2002) "การตีความความหมายที่ผิด: นักเรียนมีปัญหาแบ่งปันกับครู" Wagenmakers (2007) "วิธีแก้ปัญหาที่ใช้งานได้จริงเพื่อแก้ไขปัญหา p-values" Rodgers (2010) "ญาณวิทยาของการสร้างแบบจำลองทางคณิตศาสตร์และสถิติ: การปฏิวัติระเบียบวิธีที่เงียบสงบ" Dixon (1998) "ทำไมนักวิทยาศาสตร์ถึงให้คุณค่ากับค่า p" Glover & Dixon (2004) "อัตราส่วนความน่าจะเป็น: สถิติที่ง่ายและยืดหยุ่นสำหรับนักจิตวิทยาเชิงประจักษ์"

4
วิธีควรเล็ก -values มีการรายงาน? (และทำไม R ใส่ค่าต่ำสุดใน 2.22e-16)
สำหรับการทดสอบบางอย่างในการRมีวงเงินที่ต่ำกว่าในp-valueคำนวณของ16} ฉันไม่แน่ใจว่าทำไมมันเป็นจำนวนนี้ถ้ามีเหตุผลที่ดีสำหรับมันหรือถ้ามันเป็นเพียงโดยพลการ แพ็คเกจสถิติอื่น ๆ มากมายให้ไปดังนั้นนี่คือระดับความแม่นยำที่สูงขึ้นมาก แต่ผมยังไม่ได้เห็นเอกสารจำนวนมากเกินไปรายงานหรือ16}2.22⋅10−162.22⋅10−162.22 \cdot 10^{-16}0.0001p&lt;2.22⋅10−16p&lt;2.22⋅10−16p < 2.22\cdot 10^{-16}p=2.22⋅10−16p=2.22⋅10−16p = 2.22\cdot 10^{-16} เป็นเรื่องปกติ / วิธีปฏิบัติที่ดีที่สุดในการรายงานค่าที่คำนวณนี้หรือเป็นเรื่องปกติมากกว่าที่จะรายงานสิ่งอื่น (เช่นp &lt; 0.000000000000001)

10
“ นักวิทยาศาสตร์ลุกขึ้นเทียบกับนัยสำคัญทางสถิติ” หมายความว่าอะไร? (ความคิดเห็นในธรรมชาติ)
ชื่อของความคิดเห็นในนักวิทยาศาสตร์ธรรมชาติลุกขึ้นต่อต้านความสำคัญทางสถิติเริ่มต้นด้วย: Valentin Amrhein, Sander Greenland, Blake McShane และผู้ลงนามมากกว่า 800 คนเรียกร้องให้ยุติการเรียกร้องค่าสินไหมทดแทนและการยกเลิกผลกระทบที่สำคัญ และหลังจากนั้นมีข้อความเช่น: อีกครั้งเราจะไม่สนับสนุนการห้ามค่า P ช่วงเวลาความเชื่อมั่นหรือมาตรการทางสถิติอื่น ๆ - เฉพาะที่เราไม่ควรปฏิบัติต่อพวกเขาอย่างเด็ดขาด ซึ่งรวมถึงการแบ่งแยกขั้วที่มีนัยสำคัญทางสถิติหรือไม่รวมถึงการจัดหมวดหมู่ตามมาตรการทางสถิติอื่น ๆ เช่นปัจจัย Bayes ฉันคิดว่าฉันสามารถเข้าใจได้ว่าภาพด้านล่างไม่ได้บอกว่าการศึกษาทั้งสองไม่เห็นด้วยเพราะ "กฎ" ไม่มีผลในขณะที่อีกคนไม่ทำ แต่บทความดูเหมือนจะลึกลงไปมากกว่าที่ฉันเข้าใจได้ ในตอนท้ายดูเหมือนว่าจะมีการสรุปในสี่จุด เป็นไปได้หรือไม่ที่จะสรุปสิ่งเหล่านี้ด้วยคำศัพท์ที่ง่ายขึ้นสำหรับพวกเราที่อ่านสถิติแทนที่จะเขียนมัน? เมื่อพูดถึงช่วงเวลาที่ใช้งานร่วมกันได้โปรดคำนึงถึงสี่สิ่ง ก่อนอื่นเพียงเพราะช่วงเวลาให้ค่าที่เข้ากันได้กับข้อมูลมากที่สุดเนื่องจากข้อสมมติฐานมันไม่ได้หมายความว่าค่าภายนอกนั้นไม่เข้ากัน พวกมันเข้ากันได้น้อยกว่า ... ประการที่สองค่าทั้งหมดภายในไม่สามารถใช้งานร่วมกันกับข้อมูลได้อย่างเท่าเทียมกันเนื่องจากข้อสมมติฐาน ... ประการที่สามเช่นเดียวกับขีด จำกัด 0.05 ที่มาถึงค่าเริ่มต้น 95% ที่ใช้ในการคำนวณช่วงเวลานั้นเป็นข้อตกลงโดยพลการ ... สุดท้ายและที่สำคัญที่สุดคือจงอ่อนน้อม: การประเมินความเข้ากันได้นั้นขึ้นอยู่กับความถูกต้องของสมมติฐานทางสถิติที่ใช้ในการคำนวณช่วงเวลา ...

5
ทำไมการรวบรวมข้อมูลจนกว่าจะได้ผลลัพธ์ที่มีนัยสำคัญจะเพิ่มอัตราความผิดพลาด Type I
ฉันสงสัยว่าทำไมการรวบรวมข้อมูลจนกว่าจะได้ผลลัพธ์ที่สำคัญ (เช่น ) ได้รับ (เช่นการแฮ็ค p) เพิ่มอัตราความผิดพลาด Type I หรือไม่p &lt; .05p&lt;.05p \lt .05 ฉันขอชื่นชมการRสาธิตปรากฏการณ์นี้อย่างมาก

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.