คำถามติดแท็ก p-value

ในการทดสอบสมมติฐานบ่อยครั้ง พี- ค่าคือความน่าจะเป็นของผลลัพธ์ที่รุนแรง (หรือมากกว่า) กว่าผลที่สังเกตได้ภายใต้สมมติฐานที่ว่าสมมติฐานว่างเป็นจริง

8
ความอุดมสมบูรณ์ของค่า P ในกรณีที่ไม่มีสมมติฐาน
ฉันเข้าสู่ระบาดวิทยา ฉันไม่ใช่นักสถิติ แต่ฉันพยายามทำการวิเคราะห์ด้วยตัวเองถึงแม้ว่าฉันมักจะประสบปัญหา ฉันทำการวิเคราะห์ครั้งแรกเมื่อ 2 ปีก่อน ค่า P ถูกรวมไว้ทุกที่ในการวิเคราะห์ของฉัน (ฉันเพียงแค่ทำสิ่งที่นักวิจัยคนอื่นทำ) จากตารางเชิงพรรณนาถึงการวิเคราะห์การถดถอย นักสถิติที่ทำงานในอพาร์ทเมนต์ของฉันชักชวนให้ฉันข้ามค่า p ทั้งหมดยกเว้นว่าฉันมีสมมติฐานจริง ๆ ปัญหาคือว่าค่า p มีมากมายในสิ่งพิมพ์วิจัยทางการแพทย์ มันเป็นเรื่องธรรมดาที่จะรวมค่า p ในบรรทัดที่มากเกินไป ข้อมูลเชิงพรรณนาของวิธีการค่ามัธยฐานหรืออะไรก็ตามที่มักจะไปพร้อมกับค่า p (นักเรียนทดสอบ t, Chi-square ฯลฯ ) ฉันเพิ่งส่งรายงานไปยังวารสารและฉันปฏิเสธ (สุภาพ) เพื่อเพิ่มค่า p ลงในตารางอธิบาย "พื้นฐาน" ของฉัน กระดาษถูกปฏิเสธในที่สุด หากต้องการเป็นตัวอย่างให้ดูรูปด้านล่าง มันเป็นตารางอธิบายจากบทความที่ตีพิมพ์ล่าสุดในวารสารที่น่าเชื่อถือของอายุรศาสตร์: นักสถิติส่วนใหญ่ (ถ้าไม่เสมอ) มีส่วนร่วมในการตรวจสอบต้นฉบับเหล่านี้ คนธรรมดาอย่างฉันคาดหวังว่าจะไม่พบค่า p ใด ๆ ที่ไม่มีสมมติฐาน แต่พวกเขามีมากมาย แต่เหตุผลของเรื่องนี้ยังคงเข้าใจยากสำหรับฉัน ฉันพบว่ามันยากที่จะเชื่อว่ามันเป็นความเขลา ฉันรู้ว่านี่เป็นคำถามเชิงสถิติตามแนวเขต …

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
อะไรทำให้เกิดความไม่ต่อเนื่องในการแจกแจงค่า p ที่เผยแพร่ที่ p <.05
ในบทความล่าสุดMasicampo และ Lalande (ML) ได้รวบรวมค่า p จำนวนมากที่ตีพิมพ์ในการศึกษาที่แตกต่างกันมากมาย พวกเขาสังเกตเห็นการกระโดดที่น่าสนใจในฮิสโตแกรมของค่า p ขวาที่ระดับวิกฤตที่ยอมรับได้ 5% มีการสนทนาที่ดีเกี่ยวกับ ML ปรากฏการณ์นี้ในบล็อกของ Prof. Wasserman: http://normaldeviate.wordpress.com/2012/08/16/p-values-gone-wild-and-multiscale-madness/ ในบล็อกของเขาคุณจะพบฮิสโตแกรม: เนื่องจากระดับ 5% เป็นแบบแผนและไม่ใช่กฎหมายของธรรมชาติสิ่งที่ทำให้เกิดพฤติกรรมนี้ของการกระจายเชิงประจักษ์ของค่า p- เผยแพร่? การเลือกอคติ“ การปรับ” อย่างเป็นระบบของค่า p เหนือระดับวิกฤตที่ยอมรับได้หรืออะไร

5
วิธีการ "ไปหาข้อมูลเพิ่มเติม" ของฟิชเชอร์เมื่อใด
การอ้างอิงคำตอบที่ยอดเยี่ยมของ gung นักวิจัยเข้าหา Fisher ด้วยผลลัพธ์ที่“ ไม่สำคัญ” เมื่อถามถึงสิ่งที่เขาควรทำและฟิชเชอร์กล่าวว่า 'ไปหาข้อมูลเพิ่มเติม' จากมุมมองของเพียร์สัน Neyman นี้เป็นที่เห็นได้ชัด -hacking แต่มีกรณีการใช้งานที่ฟิชเชอร์ไปได้รับเพิ่มเติมข้อมูลวิธีการทำให้รู้สึก?ppp

3
การหาค่า p-pearson ในสหสัมพันธ์ p
เป็นไปได้หรือไม่ที่จะหาค่า p-pearson correlation ใน R? เพื่อค้นหาความสัมพันธ์ลูกแพร์สันฉันมักจะทำเช่นนี้ col1 = c(1,2,3,4) col2 = c(1,4,3,5) cor(col1,col2) # [1] 0.8315218 แต่ฉันจะหาค่า p ของสิ่งนี้ได้อย่างไร

4
Ziliak (2011) คัดค้านการใช้ค่า p และกล่าวถึงทางเลือกบางอย่าง พวกเขาคืออะไร
ในบทความล่าสุดที่กล่าวถึง demerits ของการพึ่งพา p-value สำหรับการอนุมานเชิงสถิติเรียกว่า"Matrixx v. Siracusano และ Student v. Fisher นัยสำคัญทางสถิติในการทดลอง" (DOI: 10.1111 / j.1740-9713.2011.00511.x), Stephen T. Ziliak คัดค้านการใช้ค่า p ในย่อหน้าสุดท้ายเขาพูดว่า: ข้อมูลเป็นสิ่งหนึ่งที่เรารู้และแน่นอน สิ่งที่เราต้องการทราบจริง ๆ คือสิ่งที่แตกต่างกันมาก: ความน่าจะเป็นของสมมติฐานที่เป็นจริง (หรืออย่างน้อยก็มีประโยชน์ในทางปฏิบัติ) จากข้อมูลที่เรามี เราต้องการทราบความน่าจะเป็นที่ยาทั้งสองนั้นแตกต่างกันและได้รับหลักฐานเท่าใด การทดสอบอย่างมีนัยสำคัญ - ขึ้นอยู่กับการเข้าใจผิดของเงื่อนไขการย้ายกับดักที่ฟิชเชอร์ล้มลง - ไม่ได้และไม่สามารถบอกเราว่าน่าจะเป็น ฟังก์ชั่นพลังงาน, ฟังก์ชั่นการสูญเสียที่คาดหวังและวิธีการตัดสินใจเชิงทฤษฎีและวิธีเบย์อื่น ๆ อีกมากมายที่สืบทอดมาจาก Student และ Jeffreys ซึ่งตอนนี้มีให้ใช้กันอย่างแพร่หลายและออนไลน์ฟรี ฟังก์ชั่นพลังงานฟังก์ชั่นการสูญเสียที่คาดหวังและ "วิธีการตัดสินใจเชิงทฤษฎีและวิธีเบย์อื่น ๆ " คืออะไร? วิธีการเหล่านี้ใช้กันอย่างแพร่หลายหรือไม่? พวกเขามีอยู่ใน …

3
การตรวจสอบสติ: p-value ไปได้น้อยแค่ไหน?
ฉันใช้การทดสอบ ranksum เพื่อเปรียบเทียบค่ามัธยฐานของทั้งสองตัวอย่าง (คน ) และได้พบว่าพวกเขามีความแตกต่างอย่างมีนัยสำคัญด้วย: ฉันควรจะสงสัยว่าค่าขนาดเล็กเช่นนี้หรือไม่หรือฉันควรกำหนดให้มีค่าสถิติสูงที่เกี่ยวข้องกับการมีกลุ่มตัวอย่างขนาดใหญ่มาก? มีสิ่งใดที่เป็นค่าต่ำอย่างน่าสงสัยหรือไม่?พีพีn = 120000n=120000n=120000p = 1.12E-207พีppพีpp

4
วิธี Z-คะแนนของ Stouffer: สิ่งที่ถ้าเราสรุป
ฉันกำลังทำการทดสอบทางสถิติอิสระด้วยสมมติฐานว่างเดียวกันและต้องการรวมผลลัพธ์เป็นค่าpเดียว มันดูเหมือนว่าจะมีสอง "ได้รับการยอมรับ" วิธีการ: วิธีการฟิชเชอร์และวิธีการของ Stoufferยังไม่มีข้อความNNพีpp คำถามของฉันเกี่ยวกับวิธีการของ Stouffer สำหรับการทดสอบแต่ละแยกต่างหากที่ผมได้รับคะแนน Z- ฉัน ภายใต้สมมติฐานแต่ละของพวกเขามีการกระจายและมีการกระจายแบบปกติมาตรฐานดังนั้นผลรวมΣ Z ฉันต่อไปนี้การแจกแจงแบบปกติที่มีความแปรปรวนN ดังนั้นวิธีของ Stouffer แนะนำให้คำนวณΣ z i / √Zผมziz_iΣ zผมΣzi\Sigma z_iยังไม่มีข้อความNNซึ่งควรกระจายตามปกติด้วยความแปรปรวนของหน่วยแล้วใช้สิ่งนี้เป็นคะแนน z ร่วมΣ zผม/ N--√Σzi/N\Sigma z_i / \sqrt{N} นี่เป็นเหตุผล แต่นี่เป็นอีกแนวทางหนึ่งที่ฉันคิดขึ้นและนั่นก็สมเหตุสมผลกับฉันเช่นกัน ในฐานะที่เป็นแต่ละมาจากการกระจายปกติมาตรฐานผลรวมของสี่เหลี่ยมS = Σ Z 2 ฉันควรมาจากการกระจายไคสแควร์กับNองศาอิสระ ดังนั้นเราสามารถคำนวณSและแปลงเป็นp-valueโดยใช้ฟังก์ชันการแจกแจงสะสมแบบ chi-squared ที่มีองศาอิสระN ( p = 1 - X N ( S …

4
เหตุใดการถดถอยเชิงเส้นและ ANOVA จึงให้ค่า
ฉันพยายามใส่ข้อมูลอนุกรมเวลาหนึ่งชุด (โดยไม่ทำซ้ำ) โดยใช้แบบจำลองการถดถอย ข้อมูลมีลักษณะดังนี้: &gt; xx.2 value time treat 1 8.788269 1 0 2 7.964719 6 0 3 8.204051 12 0 4 9.041368 24 0 5 8.181555 48 0 6 8.041419 96 0 7 7.992336 144 0 8 7.948658 1 1 9 8.090211 6 1 10 8.031459 12 1 11 …

4
ความแตกต่างระหว่างสมมติฐานที่มีความสัมพันธ์กับการทดสอบความชันของการถดถอยอย่างมีนัยสำคัญ
คำถามของฉันเกิดจากการพูดคุยกับ @whuber ในความคิดเห็นของคำถามอื่น โดยเฉพาะความคิดเห็นของ @whuber มีดังนี้: เหตุผลหนึ่งที่ทำให้คุณประหลาดใจก็คือสมมติฐานที่ใช้ทดสอบสหสัมพันธ์และการทดสอบความชันของการถดถอยนั้นแตกต่างกันดังนั้นแม้ว่าเราจะเข้าใจว่าสหสัมพันธ์และความชันนั้นวัดในสิ่งเดียวกันจริง ๆ ทำไมค่า p ของพวกเขาจึงเหมือนกัน นั่นแสดงให้เห็นว่าปัญหาเหล่านี้ลึกซึ้งยิ่งกว่าเพียงว่าและควรเท่ากับตัวเลขหรือไม่βRrrββ\beta นี่ทำให้ฉันคิดถึงมันและฉันก็ได้คำตอบที่น่าสนใจมากมาย ตัวอย่างเช่นฉันพบคำถามนี้ " สมมติฐานของค่าสัมประสิทธิ์สหสัมพันธ์ " แต่ไม่สามารถดูว่าสิ่งนี้จะชี้แจงความคิดเห็นข้างต้น ฉันพบคำตอบที่น่าสนใจมากขึ้นเกี่ยวกับความสัมพันธ์ของ Pearson'sและความชันในการถดถอยเชิงเส้นอย่างง่าย (ดูที่นี่และที่นี่เป็นต้น) แต่ดูเหมือนว่าไม่มีใครตอบคำถามที่ @whuber อ้างถึงในความคิดเห็นของเขา ถึงฉัน).βRrrββ\beta คำถามที่ 1:อะไรคือสมมติฐานที่ใช้ทดสอบสหสัมพันธ์และการทดสอบความชันถดถอย สำหรับคำถามที่ 2 พิจารณาผลลัพธ์ต่อไปนี้ในR: model &lt;- lm(Employed ~ Population, data = longley) summary(model) Call: lm(formula = Employed ~ Population, data = longley) Residuals: Min …

3
การเปรียบเทียบและการตัดกันค่า p ระดับนัยสำคัญและข้อผิดพลาดประเภทที่ 1
ฉันสงสัยว่าถ้าใครสามารถให้บทสรุปสั้น ๆ เกี่ยวกับคำจำกัดความและการใช้ค่า p, ระดับนัยสำคัญและข้อผิดพลาดประเภทที่ 1 ฉันเข้าใจว่าค่า p ถูกกำหนดเป็น "ความน่าจะเป็นที่จะได้รับสถิติการทดสอบอย่างน้อยที่สุดเท่าที่เราสังเกตจริง" ในขณะที่ระดับนัยสำคัญเป็นเพียงค่า cutoff ตามอำเภอใจเพื่อประเมินว่าค่า p นั้นมีความสำคัญหรือไม่ . ข้อผิดพลาดประเภทที่ 1 คือข้อผิดพลาดของการปฏิเสธสมมติฐานว่างที่เป็นจริง อย่างไรก็ตามฉันไม่แน่ใจเกี่ยวกับความแตกต่างระหว่างระดับนัยสำคัญและข้อผิดพลาดประเภทที่ 1 พวกเขาไม่ใช่แนวคิดเดียวกันหรือไม่ ตัวอย่างเช่นสมมติว่าการทดลองง่าย ๆ ที่ฉันพลิกเหรียญ 1,000 ครั้งและนับจำนวนครั้งที่มันตกลงบน 'หัว' สมมุติฐานว่างของฉัน, H0, นั่นคือหัว = 500 (เหรียญไม่มีอคติ) จากนั้นฉันตั้งระดับความสำคัญของฉันที่ alpha = 0.05 ฉันพลิกเหรียญ 1,000 ครั้งจากนั้นฉันคำนวณค่า p ถ้าค่า p เป็น&gt; 0.05 จากนั้นฉันไม่สามารถปฏิเสธสมมติฐานว่างได้และถ้าค่า p เป็น &lt;0.05 …

3
p-value 0.04993 เพียงพอที่จะปฏิเสธสมมติฐานว่างได้หรือไม่
ใน Wilcoxon ลงชื่ออันดับทดสอบนัยสำคัญทางสถิติเรามาข้ามข้อมูลบางอย่างที่ผลิต -value ของ0.04993ด้วยเกณฑ์ที่ผลลัพธ์นี้เพียงพอที่จะปฏิเสธสมมติฐานว่างหรือว่าปลอดภัยกว่าที่จะบอกว่าการทดสอบนั้นไม่สามารถสรุปได้เพราะถ้าเราปัดค่า p-value เป็นทศนิยม 3 ตำแหน่งจะกลายเป็นหรือไม่พีพีp0.049930.049930.04993p &lt; 0.05พี&lt;0.05p < 0.050.0500.0500.050

4
การเปรียบเทียบค่า p กับแต่ละรายการมีความหมายอย่างไร
ฉันมีประชากรสองคน (ชายและหญิง) แต่ละคนมีตัวอย่าง สำหรับตัวอย่างแต่ละตัวอย่างฉันมีคุณสมบัติ A &amp; B สองรายการ (เกรดเฉลี่ยปีแรกและคะแนน SAT) ฉันใช้การทดสอบแบบแยกต่างหากสำหรับ A &amp; B: ทั้งคู่พบความแตกต่างอย่างมีนัยสำคัญระหว่างทั้งสองกลุ่ม A กับP = 0.008และ B กับP = 0.002100010001000p =0.008p=0.008p=0.008p=0.002p=0.002p=0.002 การอ้างว่าทรัพย์สิน B นั้นเป็นการเลือกปฏิบัติที่ดีกว่า (สำคัญกว่า) คือคุณสมบัติ A หรือไม่? หรือว่าการทดสอบ t เป็นเพียงการวัดใช่หรือไม่ (สำคัญหรือไม่สำคัญ)? ปรับปรุง : ตามความเห็นที่นี่และกับสิ่งที่ผมได้อ่านในวิกิพีเดียผมคิดว่าคำตอบที่ควรจะวางความหมาย p-value และรายงานของคุณขนาดของผล ความคิดใด ๆ

3
ความสับสนกับอัตราการค้นพบที่ผิดและการทดสอบหลายอย่าง (ใน Colquhoun 2014)
ฉันได้อ่านบทความที่ยอดเยี่ยมนี้โดย David Colquhoun: การตรวจสอบอัตราการค้นพบที่ผิดพลาดและการตีความค่า p ผิดพลาด (2014) ในสาระสำคัญที่เขาอธิบายว่าทำไมอัตราการค้นพบที่ผิดพลาด (FDR) สามารถจะสูงถึงแม้ว่าเราควบคุมสำหรับข้อผิดพลาดประเภทที่มี\30 %30%30\%α = 0.05α=0.05\alpha=0.05 อย่างไรก็ตามฉันยังสับสนว่าจะเกิดอะไรขึ้นถ้าฉันใช้การควบคุม FDR ในกรณีของการทดสอบหลายครั้ง บอกเด็ก ๆ ว่าฉันได้ทำการทดสอบตัวแปรแต่ละตัวแล้วและคำนวณค่าโดยใช้ขั้นตอน Benjamini-Hochberg ผมหนึ่งตัวแปรที่มีความสำคัญกับqฉันกำลังถาม FDR สำหรับการค้นพบนี้คืออะไร?QQqQ= 0.049Q=0.049q=0.049 ฉันสามารถสันนิษฐานได้อย่างปลอดภัยว่าในระยะยาวหากฉันทำการวิเคราะห์ดังกล่าวเป็นประจำ FDR ไม่ใช่30 %30%30\%แต่ต่ำกว่า5 %5%5\%เพราะฉันใช้ Benjamini-Hochberg นั่นรู้สึกผิดฉันจะบอกว่าค่าQQq -value สอดคล้องกับค่าพีพีpค่าในกระดาษของ Colquhoun และการใช้เหตุผลของเขาที่นี่เช่นกันดังนั้นการใช้ค่าQQqเกณฑ์ที่0.050.050.05ฉันเสี่ยงที่จะ "ทำให้คนโง่" Colquhoun ใส่ไว้) ใน30 %30%30\%ของคดี อย่างไรก็ตามฉันพยายามอธิบายอย่างเป็นทางการมากกว่าและล้มเหลว

1
รับค่า p สำหรับ“ multinom” ใน R (แพ็คเกจ nnet)
ฉันจะรับค่า p โดยใช้multinomฟังก์ชันของnnetแพ็คเกจได้Rอย่างไร ฉันมีชุดข้อมูลซึ่งประกอบด้วย“ คะแนนพยาธิวิทยา” (ขาด, อ่อน, รุนแรง) เป็นตัวแปรผลลัพธ์และสองผลหลัก: อายุ (สองปัจจัย: ยี่สิบ / สามสิบวัน) และกลุ่มการรักษา (สี่ปัจจัย: การติดเชื้อโดยไม่ต้อง ATB; ATB1; ที่ติดเชื้อ + ATB2; ที่ติดเชื้อ + ATB3) ก่อนอื่นฉันพยายามจัดรูปแบบการถดถอยตามลำดับซึ่งดูเหมือนจะเหมาะสมกว่าเนื่องจากลักษณะของตัวแปรตาม (ลำดับ) ของฉัน อย่างไรก็ตามข้อสันนิษฐานของอัตราต่อรองถูกละเมิดอย่างรุนแรง (กราฟิก) ซึ่งทำให้ฉันใช้โมเดล multinomial แทนโดยใช้nnetแพ็คเกจ ก่อนอื่นฉันเลือกระดับผลลัพธ์ที่ฉันต้องใช้เป็นหมวดหมู่พื้นฐาน: Data$Path &lt;- relevel(Data$Path, ref = "Absent") จากนั้นฉันต้องตั้งค่าหมวดหมู่พื้นฐานสำหรับตัวแปรอิสระ: Data$Age &lt;- relevel(Data$Age, ref = "Twenty") Data$Treat &lt;- relevel(Data$Treat, …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.