คำถามติดแท็ก p-value

ในการทดสอบสมมติฐานบ่อยครั้ง พี- ค่าคือความน่าจะเป็นของผลลัพธ์ที่รุนแรง (หรือมากกว่า) กว่าผลที่สังเกตได้ภายใต้สมมติฐานที่ว่าสมมติฐานว่างเป็นจริง

2
กรณีการเลือกปฏิบัติในเอเชียของ Palantir: ความน่าจะเป็นคำนวณได้อย่างไร
ฉันอ่านบทความนี้เกี่ยวกับกรณีของ Palantir ที่ฝ่ายแรงงานกล่าวหาว่าพวกเขาเลือกปฏิบัติต่อชาวเอเชีย ไม่มีใครรู้ว่าพวกเขาได้รับการประเมินความน่าจะเป็นเหล่านี้จากที่ไหน ฉันไม่ได้รับ 1/741 ในรายการ (ก) (a) สำหรับตำแหน่ง QA Engineer จากกลุ่มผู้สมัครที่มีคุณสมบัติมากกว่า 730 คนซึ่งประมาณ 77% เป็นชาวเอเชีย - Palantir จ้างผู้สมัครที่ไม่ใช่ชาวเอเชียหกคนและผู้สมัครเอเชียเพียงคนเดียว ผลกระทบที่คำนวณโดย OFCCP มีค่าเกินกว่าสามส่วนเบี่ยงเบนมาตรฐาน โอกาสที่ผลลัพธ์นี้จะเกิดขึ้นตามโอกาสนั้นอยู่ที่ประมาณหนึ่งใน 741 (b) สำหรับตำแหน่งวิศวกรซอฟต์แวร์จากกลุ่มผู้สมัครที่มีคุณสมบัติมากกว่า 1,160 คนหรือประมาณ 85% เป็นชาวเอเชีย - Palantir จ้างผู้สมัครที่ไม่ใช่ชาวเอเชีย 14 คนและผู้สมัครชาวเอเชียเพียง 11 คน ผลกระทบที่คำนวณโดย OFCCP เกินกว่า 5 ส่วนเบี่ยงเบนมาตรฐาน โอกาสที่ผลลัพธ์นี้เกิดขึ้นตามโอกาสนั้นอยู่ที่ประมาณหนึ่งใน 3.4 ล้าน (c) สำหรับตำแหน่ง QA Engineer …

3
p = 5.0% สำคัญหรือไม่
วันนี้ฉันถูกถามว่า p-value 0.05 (ตรง) ถือว่ามีนัยสำคัญ (ให้ alpha = 5%) หรือไม่ ฉันไม่ทราบคำตอบและ Google เปิดทั้งสองคำตอบ: (a) ผลลัพธ์มีความสำคัญถ้า p น้อยกว่า 5% และ (b) ถ้า p น้อยกว่า 5% หรือเท่ากับ 5% แน่นอนว่าไม่มีเว็บไซต์ใดที่อ้างถึงใครเลย ทำไมหนึ่ง - มันเป็นความรู้ทั่วไปและ 5% เป็นสิ่งที่ไม่มีเหตุผล แต่นั่นไม่ได้ช่วยให้ฉันบอกนักเรียนถึงสิ่งที่ต้องจำ ดังนั้นนี่คือคำถามที่หมดหวังของฉันในการทดสอบสมมติฐาน: ถ้าค่า p เป็นค่าอัลฟา - ฉันจะพิจารณาผลลัพธ์ที่มีนัยสำคัญหรือไม่? และการอ้างอิงเชิงอำนาจในกรณีนี้คืออะไร? ขอบคุณมาก

5
เหตุใดการเลือกใช้แบบจำลองโดยใช้ AIC จึงให้ค่า p ที่ไม่สำคัญสำหรับตัวแปร
ฉันมีคำถามบางอย่างเกี่ยวกับ AIC และหวังว่าคุณจะสามารถช่วยฉันได้ ฉันใช้การเลือกแบบจำลอง (ย้อนกลับหรือไปข้างหน้า) ตาม AIC กับข้อมูลของฉัน และตัวแปรที่เลือกบางตัวก็จบลงด้วยค่า p> 0.05 ฉันรู้ว่าผู้คนกำลังพูดว่าเราควรเลือกแบบจำลองตาม AIC แทนค่า p ดังนั้นดูเหมือนว่า AIC และค่า p เป็นแนวคิดสองประการที่แตกต่างกัน มีคนบอกฉันว่าอะไรคือความแตกต่าง? สิ่งที่ฉันเข้าใจคือ: สำหรับการเลือกย้อนหลังโดยใช้ AIC สมมติว่าเรามี 3 ตัวแปร (var1, var2, var3) และ AIC ของรุ่นนี้คือ AIC * หากไม่รวมหนึ่งในสามของตัวแปรเหล่านี้จะไม่จบลงด้วย AIC ซึ่งต่ำกว่า AIC * อย่างมาก (ในแง่ของการกระจาย ch-square ด้วย df = 1) จากนั้นเราจะบอกว่าตัวแปรทั้งสามนี้เป็นผลลัพธ์สุดท้าย p-value ที่สำคัญสำหรับตัวแปร …

2
การคำนวณค่า p จากการแจกแจงโดยพลการ
ฉันหวังว่านี่ไม่ใช่คำถามงี่เง่า สมมติว่าฉันมีการกระจายอย่างต่อเนื่องโดยพลการ ฉันมีสถิติด้วยและฉันต้องการใช้การแจกแจงแบบสุ่มนี้เพื่อรับค่า p สำหรับสถิตินี้ ฉันรู้ว่าใน R มันง่ายที่จะทำสิ่งนี้ตราบใดที่การกระจายของคุณเหมาะกับหนึ่งในตัวเช่นถ้าเป็นเรื่องปกติ แต่มีวิธีง่ายๆในการทำเช่นนี้กับการแจกแจงแบบใดก็ตามโดยไม่ต้องตั้งสมมติฐานอย่างนั้นหรือ

2
สูตรสำหรับ Benjamini-Hochberg ปรับค่า p เป็นอย่างไร
ฉันเข้าใจขั้นตอนและสิ่งที่ควบคุม ดังนั้นสูตรสำหรับค่า p ที่ปรับในขั้นตอน BH สำหรับการเปรียบเทียบหลายรายการคืออะไร เพียงแค่ตอนนี้ฉันรู้เดิม BH ไม่ได้ผลิตปรับ P-ค่าปรับเท่านั้น (ไม่ใช่) เงื่อนไขการปฏิเสธ: https://www.jstor.org/stable/2346101 Gordon Smyth ได้แนะนำค่า p BH ที่ปรับปรุงใหม่ในปี 2002 อย่างไรก็ตามคำถามยังคงมีอยู่ มันนำมาใช้ในการวิจัยเป็นด้วยวิธีการp.adjustBH

1
ความแตกต่างระหว่าง wilcox.test และ coin :: wilcox_test in R คืออะไร?
ฟังก์ชันทั้งสองนี้มีอยู่ใน R แต่ฉันไม่รู้ความแตกต่าง มันดูเหมือนว่าพวกเขาจะกลับมาเหมือนเดิม P-ค่าเมื่อโทรwilcox.testด้วยcorrect=FALSEและwilcox_test(ในแพคเกจเหรียญ) distribution="aymptotic"ด้วย สำหรับค่าอื่น ๆ พวกเขากลับค่า p ที่แตกต่างกัน นอกจากนี้ยังwilcox.testส่งคืน W = 0 สำหรับชุดข้อมูลของฉันเสมอโดยไม่ขึ้นกับการตั้งค่าพารามิเตอร์: x = c(1, 1, 1, 3, 3, 3, 3) และ y = c(4, 4, 6, 7, 7, 8, 10) นอกจากนี้เมื่อฉันลองใช้เครื่องมือต่าง ๆ นอกเหนือจาก R (บางออนไลน์พร้อมใช้งานอื่น ๆ เป็น Add-on ของ Excel) บางครั้งพวกเขารายงานค่า p ที่แตกต่างกัน ดังนั้นฉันจะรู้ได้อย่างไรว่าเครื่องมือใดที่ให้ค่า p …

3
จะคำนวณความน่าจะเป็นที่เกี่ยวข้องกับคะแนน Z ขนาดใหญ่อย่างไร้เหตุผลได้อย่างไร
แพคเกจซอฟต์แวร์สำหรับการตรวจจับแรงจูงใจเครือข่ายสามารถให้คะแนน Z สูงมาก (สูงสุดที่ฉันเคยเห็นคือ 600,000+ แต่คะแนน Z มากกว่า 100 นั้นเป็นเรื่องธรรมดา) ฉันวางแผนที่จะแสดงว่าคะแนน Z เหล่านี้เป็นของปลอม คะแนน Z ขนาดใหญ่สอดคล้องกับความน่าจะเป็นที่ต่ำมาก ค่าของความน่าจะเป็นที่เกี่ยวข้องจะได้รับเช่นหน้าแจกวิกิพีเดียตามปกติ (และอาจเป็นตำราสถิติทุกเล่ม) สำหรับคะแนน Z ถึง 6 ดังนั้น ... คำถาม : เราคำนวณฟังก์ชันข้อผิดพลาดได้อย่างไรสำหรับ n มากถึง 1,000,000 พูด?1−erf(n/2–√)1−erf(n/2)1-\mathrm{erf}(n/\sqrt{2}) ฉันโดยเฉพาะอย่างยิ่งหลังจากแพคเกจที่ใช้งานแล้วสำหรับนี้ (ถ้าเป็นไปได้) สิ่งที่ดีที่สุดที่ฉันเคยพบคือ WolframAlpha ซึ่งสามารถคำนวณได้สำหรับ n = 150 ( ที่นี่ )

3
การถดถอยเชิงเส้นอย่างง่ายค่า p และ AIC
ฉันรู้ว่าหัวข้อนี้เกิดขึ้นหลายครั้งก่อนเช่นที่นี่แต่ฉันยังไม่แน่ใจว่าจะตีความผลลัพธ์การถดถอยของฉันได้ดีที่สุดอย่างไร ฉันมีชุดข้อมูลที่ง่ายมากประกอบด้วยคอลัมน์ของค่า xและคอลัมน์ค่า yแบ่งออกเป็นสองกลุ่มตามที่ตั้ง (loc) คะแนนมีลักษณะเช่นนี้ เพื่อนร่วมงานได้ตั้งสมมติฐานว่าเราควรใส่การถดถอยเชิงเส้นอย่างง่ายแยกกันในแต่ละกลุ่มซึ่งฉันได้ใช้y ~ x * C(loc)ไปแล้ว เอาท์พุทที่แสดงด้านล่าง OLS Regression Results ============================================================================== Dep. Variable: y R-squared: 0.873 Model: OLS Adj. R-squared: 0.866 Method: Least Squares F-statistic: 139.2 Date: Mon, 13 Jun 2016 Prob (F-statistic): 3.05e-27 Time: 14:18:50 Log-Likelihood: -27.981 No. Observations: 65 AIC: 63.96 Df Residuals: …

3
เหตุใดจึงเป็นปัญหาคอร์ติสในเชิงบวกสูงสำหรับการทดสอบสมมติฐาน?
ฉันได้ยินมาแล้ว (ขออภัยไม่สามารถให้ลิงก์ไปยังข้อความสิ่งที่ฉันได้รับการบอกเล่า) ว่าการมีส่วนร่วมในเชิงบวกที่สูงอาจเป็นปัญหาสำหรับการทดสอบสมมติฐานที่ถูกต้องและช่วงความมั่นใจ (ดังนั้นจึงมีปัญหากับการอนุมานเชิงสถิติ) นี่เป็นเรื่องจริงและถ้าเป็นเช่นนั้นทำไม ความเชื่อมั่นในเชิงบวกที่สูงของเศษซากจะไม่บ่งบอกว่าส่วนใหญ่ที่เหลืออยู่ใกล้กับค่าเฉลี่ยที่เหลืออยู่ของ 0 และดังนั้นจึงมีจำนวนที่เหลือน้อยกว่ามากอยู่? (หากคุณมีคำตอบโปรดลองตอบคำถามทางคณิตศาสตร์ที่ไม่ค่อยมีใครรู้เพราะฉันไม่ค่อยชอบคณิตศาสตร์มากนัก)

7
การอ้างถึงผลลัพธ์ว่า "เกือบ" หรือ "ค่อนข้าง" สำคัญหรือไม่
ฉันทามติทั่วไปเกี่ยวกับคำถามที่คล้ายกันมันผิดหรือไม่ที่อ้างถึงผลลัพธ์ว่า "สำคัญมาก" หรือไม่? คือ "มีความสำคัญสูง" เป็นวิธีที่ถูกต้องแม้ว่าจะไม่ใช่วิธีที่เฉพาะเจาะจงในการอธิบายความแข็งแกร่งของการเชื่อมโยงที่มีค่า p ต่ำกว่าขีด จำกัด นัยสำคัญที่คุณตั้งไว้ อย่างไรก็ตามสิ่งที่เกี่ยวกับการอธิบายค่า p ที่สูงกว่าเกณฑ์ของคุณเล็กน้อย? ฉันได้เห็นเอกสารบางฉบับใช้คำเช่น "ค่อนข้างมีนัยสำคัญ", "มีนัยสำคัญเกือบ", "ใกล้จะถึงความสำคัญ" และอื่น ๆ ฉันพบว่าคำศัพท์เหล่านี้มีความปรารถนาเล็กน้อยที่สกปรกในบางกรณีวิธีที่ไม่เหมาะสมในการดึงเส้นเขตแดนเพื่อดึงผลลัพธ์ที่มีความหมายออกมาจากการศึกษาที่มีผลลัพธ์เชิงลบ ข้อกำหนดเหล่านี้ยอมรับได้หรือไม่ที่จะอธิบายผลลัพธ์ที่ "เพิ่งพลาด" การตัดค่า p ของคุณหรือไม่

1
ช่วยฉันเข้าใจค่าในค่า Bayesian glm
ฉันกำลังพยายามที่จะใช้ logit คชกรรมกับข้อมูลที่นี่ ฉันใช้bayesglm()ในarmแพ็คเกจใน R การเข้ารหัสนั้นตรงไปตรงมามากพอ: df = read.csv("http://dl.dropbox.com/u/1791181/bayesglm.csv", header=T) library(arm) model = bayesglm(PASS ~ SEX + HIGH, family=binomial(link="logit"), data=df) summary(model) ให้เอาต์พุตต่อไปนี้: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.10381 0.10240 1.014 0.311 SEXMale 0.02408 0.09363 0.257 0.797 HIGH -0.27503 0.03562 -7.721 1.15e-14 *** --- Signif. codes: 0 ‘***’ …
13 r  bayesian  p-value 

1
แพคเกจ GBM กับ Caret ใช้ GBM
ฉันเคยใช้การจูนโมเดลcaretแต่แล้วก็รันโมเดลอีกครั้งโดยใช้gbmแพ็คเกจ ฉันเข้าใจว่าcaretแพ็กเกจที่ใช้gbmและเอาต์พุตควรเหมือนกัน อย่างไรก็ตามการทดสอบการทำงานอย่างรวดเร็วโดยใช้data(iris)แสดงความแตกต่างในรูปแบบประมาณ 5% โดยใช้ RMSE และ R ^ 2 เป็นตัวชี้วัดการประเมินผล ฉันต้องการค้นหาประสิทธิภาพของแบบจำลองที่ดีที่สุดโดยใช้caretแต่เรียกใช้อีกครั้งgbmเพื่อใช้ประโยชน์จากแผนการพึ่งพาบางส่วน รหัสด้านล่างสำหรับการทำซ้ำ คำถามของฉันจะเป็น: 1) เหตุใดฉันจึงเห็นความแตกต่างระหว่างแพ็คเกจทั้งสองนี้ถึงแม้ว่าพวกเขาจะเหมือนกัน (ฉันเข้าใจว่าพวกมันสุ่ม แต่ 5% ค่อนข้างแตกต่างกันมากโดยเฉพาะอย่างยิ่งเมื่อฉันไม่ได้ใช้ชุดข้อมูลที่ดีirisสำหรับการสร้างแบบจำลองของฉัน) . 2) มีข้อดีหรือข้อเสียในการใช้ทั้งสองแพคเกจหรือไม่ 3) ไม่เกี่ยวข้อง: การใช้irisชุดข้อมูลที่ดีที่สุดinteraction.depthคือ 5 แต่สูงกว่าที่ฉันได้อ่านควรจะใช้สูงสุดfloor(sqrt(ncol(iris)))ซึ่งควรจะเป็น 2 นี่เป็นกฎง่ายๆหรือเข้มงวดหรือไม่? library(caret) library(gbm) library(hydroGOF) library(Metrics) data(iris) # Using caret caretGrid <- expand.grid(interaction.depth=c(1, 3, 5), n.trees = (0:50)*50, shrinkage=c(0.01, 0.001), n.minobsinnode=10) metric …

4
ใน R วิธีคำนวณค่า p สำหรับพื้นที่ใต้ ROC
ฉันพยายามหาวิธีคำนวณค่า p สำหรับพื้นที่ภายใต้ลักษณะตัวดำเนินการตัวรับ (ROC) ฉันมีตัวแปรต่อเนื่องและผลการทดสอบการวินิจฉัย ฉันต้องการดูว่า AUROC มีนัยสำคัญทางสถิติหรือไม่ ฉันพบแพ็คเกจจำนวนมากที่เกี่ยวข้องกับเส้นโค้ง ROC: pROC, ROCR, caTools, การตรวจสอบ, Epi แต่หลังจากใช้เวลาหลายชั่วโมงในการอ่านเอกสารและการทดสอบฉันไม่สามารถหาวิธีได้ ฉันคิดว่าฉันเพิ่งพลาดไป
13 r  p-value  roc 

1
การตีความเอาต์พุตการถดถอยโลจิสติกใน R
ผมทำงานในการถดถอยโลจิสติกในหลาย R glmโดยใช้ ตัวแปรทำนายนั้นต่อเนื่องและจัดหมวดหมู่ แยกข้อมูลสรุปของแบบจำลองแสดงดังต่อไปนี้: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 ช่วงความเชื่อมั่น: 2.5 % 97.5 % (Intercept) …

3
ขนาดสัมพัทธ์ของค่า p ที่ขนาดตัวอย่างต่างกัน
ขนาดสัมพัทธ์ของค่า ap เปลี่ยนแปลงขนาดตัวอย่างต่างกันอย่างไร เช่นถ้าคุณได้p=0.20p=0.20p=0.20ที่n=45n=45n=45สำหรับค่าสหสัมพันธ์และที่n=120n=120n=120คุณได้ค่า p เท่ากันที่ 0.20 สิ่งที่จะเป็นขนาดสัมพันธ์ของค่า p สำหรับการทดสอบครั้งที่สองเมื่อเทียบกับค่า p ดั้งเดิม เมื่อn=45n=45n=45 ?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.