คำถามติดแท็ก multiple-comparisons

สถานการณ์สัญญาณที่มีความกังวลเกี่ยวกับการบรรลุอำนาจและขนาดที่กำหนดเมื่อทำการทดสอบสมมติฐานมากกว่าหนึ่งครั้ง

3
มีใครแก้ไข PTLOS แบบฝึกหัด 4.1 ได้บ้างไหม?
นี้การออกกำลังกายที่ได้รับในทฤษฎีความน่าจะเป็น: ตรรกะของวิทยาศาสตร์โดยเอ็ดวินเจย์นส์, ปี 2003 มีวิธีการแก้ปัญหาบางส่วนเป็นที่นี่ ฉันได้หาทางแก้ปัญหาบางส่วนที่กว้างขึ้นและสงสัยว่ามีคนอื่นแก้ไขมันได้ไหม ฉันจะรอสักครู่ก่อนโพสต์คำตอบของฉันเพื่อให้ผู้อื่นได้ไป เอาล่ะสมมติว่าเรามีnnnพิเศษร่วมกันและสมมติฐานหมดจดแสดงโดยHi(i=1,…,n)Hi(i=1,…,n)H_i \;\;(i=1,\dots,n) ) ต่อไปสมมติว่าเรามีชุดข้อมูลmmmแสดงโดยDj(j=1,…,m)Dj(j=1,…,m)D_j \;\;(j=1,\dots,m) ) อัตราส่วนความน่าจะเป็นสำหรับข้อสมมติฐานที่ i ถูกกำหนดโดย: LR(Hi)=P(D1D2…,Dm|Hi)P(D1D2…,Dm|H¯¯¯¯¯i)LR(Hi)=P(D1D2…,Dm|Hi)P(D1D2…,Dm|H¯i)LR(H_{i})=\frac{P(D_{1}D_{2}\dots,D_{m}|H_{i})}{P(D_{1}D_{2}\dots,D_{m}|\overline{H}_{i})} โปรดทราบว่าสิ่งเหล่านี้เป็นความน่าจะเป็นตามเงื่อนไข ตอนนี้สมมติว่าได้รับ ith สมมติฐานเมตรชุดข้อมูลมีความเป็นอิสระเพื่อให้เรามี:HiHiH_{i}mmm P(D1D2…,Dm|Hi)=∏j=1mP(Dj|Hi)(i=1,…,n)Condition 1P(D1D2…,Dm|Hi)=∏j=1mP(Dj|Hi)(i=1,…,n)Condition 1P(D_{1}D_{2}\dots,D_{m}|H_{i})=\prod_{j=1}^{m}P(D_{j}|H_{i}) \;\;\;\; (i=1,\dots,n)\;\;\;\text{Condition 1} ตอนนี้มันจะค่อนข้างสะดวกถ้าตัวหารยังรวมอยู่ในสถานการณ์นี้ด้วยดังนั้นเราจึงมี: P(D1D2…,Dm|H¯¯¯¯¯i)=∏j=1mP(Dj|H¯¯¯¯¯i)(i=1,…,n)Condition 2P(D1D2…,Dm|H¯i)=∏j=1mP(Dj|H¯i)(i=1,…,n)Condition 2P(D_{1}D_{2}\dots,D_{m}|\overline{H}_{i})=\prod_{j=1}^{m}P(D_{j}|\overline{H}_{i}) \;\;\;\; (i=1,\dots,n)\;\;\;\text{Condition 2} สำหรับในกรณีนี้อัตราส่วนความน่าจะเป็นแยกเป็นผลิตภัณฑ์ที่มีขนาดเล็กลงสำหรับแต่ละชุดข้อมูลดังนั้นเราจึงมี: LR(Hi)=∏j=1mP(Dj|Hi)P(Dj|H¯¯¯¯¯i)LR(Hi)=∏j=1mP(Dj|Hi)P(Dj|H¯i)LR(H_i)=\prod_{j=1}^{m}\frac{P(D_{j}|H_{i})}{P(D_{j}|\overline{H}_{i})} ดังนั้นในกรณีนี้แต่ละชุดข้อมูล "จะออกเสียงลงคะแนนสำหรับHiHiH_i " หรือ "โหวตกับHiHiH_i " เป็นอิสระจากชุดข้อมูลอื่น ๆ แบบฝึกหัดคือการพิสูจน์ว่าถ้าn>2n>2n>2 (มากกว่าสองข้อสมมุติ) ไม่มีวิธีที่ไม่น่าสนใจเช่นนี้ที่แฟคตอริ่งสามารถเกิดขึ้นได้ นั่นคือถ้าคุณสมมติว่าเงื่อนไข 1 และเงื่อนไข …

1
ทำไมต้องใช้ ANOVA เลยแทนที่จะกระโดดเข้าสู่การทดสอบแบบโพสต์เฉพาะกิจหรือการวางแผนเปรียบเทียบ
เมื่อมองสถานการณ์ ANOVA ระหว่างกลุ่มคุณจะได้อะไรจากการทำแบบทดสอบ ANOVA ก่อนและหลังทำการทดสอบ (Bonferroni, Šidák ฯลฯ ) หรือการทดสอบเปรียบเทียบที่วางแผนไว้ ทำไมไม่ข้ามขั้นตอน ANOVA ทั้งหมด? ฉันรวบรวมว่าในสถานการณ์เช่นนี้ประโยชน์อย่างหนึ่งของ ANOVA ระหว่างกลุ่มคือความสามารถในการใช้ HSD ของ Tukey เป็นแบบทดสอบหลังเลิกเรียน หลังต้องการตารางภายในกลุ่มหมายถึงจากตาราง ANOVA เพื่อคำนวณข้อผิดพลาดมาตรฐานที่เกี่ยวข้อง แต่การปรับ Bonferroni และŠidákเป็นการทดสอบ t-unpaired นั้นไม่จำเป็นต้องมีการวิเคราะห์ ANOVA ใด ๆ ฉันอยากจะถามคำถามเดียวกันเกี่ยวกับสถานการณ์ ANOVA ภายในกลุ่ม ฉันรู้ว่าในกรณีเช่นนี้การทดสอบ HSD ของ Tukey ไม่ได้เป็นการพิจารณาที่เกี่ยวข้องทำให้คำถามนี้มีความกดดันมากขึ้น

1
ความหมายภาษาธรรมดาของการทดสอบแบบ "พึ่งพา" และ "อิสระ" ในวรรณคดีเปรียบเทียบหลายรายการ?
ในทั้งวรรณกรรมอัตราข้อผิดพลาดครอบครัว (FWER) และอัตราการค้นพบที่ผิดพลาด (FDR), วิธีการเฉพาะในการควบคุม FWER หรือ FDR กล่าวว่ามีความเหมาะสมกับการทดสอบขึ้นอยู่กับหรืออิสระ ตัวอย่างเช่นในปี 1979 บทความ "ขั้นตอนการทดสอบการปฏิเสธหลายครั้งอย่างง่าย ๆ " โฮล์มเขียนเพื่อเปรียบเทียบวิธีการแบบupidákแบบ step-up contrastidákกับวิธีการควบคุม Bonferroni แบบขั้นตอนของเขา: ความเรียบง่ายในการคำนวณเดียวกันจะได้รับเมื่อสถิติการทดสอบมีความเป็นอิสระ ใน "การควบคุมอัตราการค้นพบที่ผิด" โดย Benjamini และ Hochberg (1995) ผู้เขียนเขียน: ทฤษฎีบท 1.สำหรับอิสระสถิติการทดสอบและการกำหนดค่าของสมมติฐานที่ผิดพลาดใด ๆ ดังกล่าวข้างต้นการควบคุมขั้นตอนที่ FDR *q∗q∗q^{*} ต่อมาในปี 2544 เบญจมินิและเยคุเตเอลลีเขียน: 1.3 ปัญหาที่เกิดขึ้น เมื่อพยายามที่จะใช้วิธีการ FDR ในทางปฏิบัติสถิติการทดสอบขึ้นอยู่กับการพบบ่อยกว่าคนที่เป็นอิสระตัวอย่างของจุดปลายหลายจุดที่กล่าวถึงข้างต้นเป็นแบบตรงประเด็น ผู้เขียนเหล่านี้ใช้ความหมายใดเป็นพิเศษในการพึ่งพาความเป็นอิสระ ฉันจะมีความสุขกับคำจำกัดความที่เป็นทางการของสิ่งที่ทำให้การทดสอบขึ้นอยู่กับหรือเป็นอิสระจากกันถ้าพวกเขามาพร้อมกับคำอธิบายภาษาธรรมดา ฉันสามารถคิดถึงความหมายต่าง ๆ ที่เป็นไปได้สองสามอย่าง แต่ฉันไม่คิดเลยว่าจะเป็นเช่นนั้น: "Dependent" …

2
ความเป็นอิสระของสารตกค้างในการทดสอบ / จำลองทางคอมพิวเตอร์?
ฉันทำการประเมินทางคอมพิวเตอร์โดยใช้วิธีการที่แตกต่างกันของการปรับแบบจำลองที่ใช้ในวิทยาศาสตร์ Palaeo ฉันมีชุดฝึกอบรมแบบ ish ขนาดใหญ่ดังนั้นฉันจึงสุ่ม (ชุดชั้นในแบบสุ่มแบ่งชั้น) แล้ววางชุดทดสอบ ผมติดตั้งวิธีการแตกต่างกันไปตัวอย่างการฝึกอบรมชุดและการใช้ม.ส่งผลให้รูปแบบที่ผมคาดการตอบสนองสำหรับตัวอย่างการทดสอบชุดและคำนวณ RMSEP มากกว่ากลุ่มตัวอย่างที่อยู่ในชุดทดสอบ นี้เป็นหนึ่งในการทำงานม.ม.mม.ม.m ฉันทำกระบวนการนี้ซ้ำหลายครั้งทุกครั้งที่ฉันเลือกชุดฝึกอบรมที่แตกต่างกันโดยการสุ่มตัวอย่างชุดทดสอบใหม่ หลังจากทำสิ่งนี้แล้วฉันต้องการตรวจสอบว่าวิธีใดวิธีมีประสิทธิภาพ RMSEP ที่ดีขึ้นหรือแย่ลง ฉันต้องการเปรียบเทียบวิธีการจับคู่แบบฉลาด ๆม.ม.m วิธีการของฉันได้รับเพื่อให้พอดีกับผลกระทบที่ผสม (LME) รูปแบบเชิงเส้นที่มีผลกระทบสุ่มเดียวสำหรับการเรียกใช้ ฉันใช้lmer()จากแพ็คเกจlme4เพื่อให้พอดีกับรุ่นและฟังก์ชั่นของฉันจากแพ็คเกจmultcompเพื่อทำการเปรียบเทียบหลายอย่าง แบบจำลองของฉันเป็นหลัก lmer(RMSEP ~ method + (1 | Run), data = FOO) ที่methodบ่งชี้วิธีการที่ถูกนำมาใช้ในการสร้างแบบจำลองพยากรณ์สำหรับชุดทดสอบและRunเป็นตัวบ่งชี้สำหรับแต่ละโดยเฉพาะอย่างยิ่งการเรียกของ "ทดลอง" ของฉัน คำถามของฉันเกี่ยวกับส่วนที่เหลือของ LME ให้ผลแบบสุ่มเดียวสำหรับRunฉันสมมติว่าค่า RMSEP สำหรับการทำงานนั้นมีความสัมพันธ์กับระดับหนึ่ง แต่ไม่เกี่ยวข้องระหว่างการวิ่งบนพื้นฐานของความสัมพันธ์ที่ชักนำให้เกิดผลแบบสุ่ม ข้อสันนิษฐานเกี่ยวกับความเป็นอิสระระหว่างการรันนี้มีผลหรือไม่? หากไม่มีวิธีที่จะอธิบายสิ่งนี้ในโมเดล LME หรือฉันควรมองหาการวิเคราะห์ทางสถิติประเภทอื่นเพื่อตอบคำถามของฉัน?

5
มาตรการความคล้ายคลึงกันระหว่างเส้นโค้ง?
ฉันต้องการคำนวณการวัดความคล้ายคลึงกันระหว่างชุดคะแนนที่สั่งสองชุด --- ชุดที่อยู่ภายใต้ผู้ใช้เปรียบเทียบกับชุดที่อยู่ภายใต้ครู : ประเด็นคือเส้นโค้งในพื้นที่ 3 มิติ แต่ฉันคิดว่าปัญหาจะง่ายขึ้นถ้าฉันพล็อตมันเป็น 2 มิติเหมือนในภาพ หากคะแนนทับซ้อนกันความคล้ายคลึงควรเป็น 100%

1
เหตุใดการควบคุม FDR จึงเข้มงวดน้อยกว่าการควบคุม FWER
ฉันได้อ่านแล้วว่าการควบคุม FDR นั้นเข้มงวดน้อยกว่าการควบคุม FWER เช่นในWikipedia : ขั้นตอนการควบคุม FDR ออกแรงควบคุมที่เข้มงวดน้อยกว่าการค้นพบที่ผิดพลาดเมื่อเปรียบเทียบกับขั้นตอนอัตราข้อผิดพลาดในระดับครอบครัว (FWER) (เช่นการแก้ไข Bonferroni) สิ่งนี้จะเพิ่มพลังงานที่ค่าใช้จ่ายในการเพิ่มอัตราข้อผิดพลาดประเภทที่ 1 เช่นการปฏิเสธสมมติฐานว่างไม่มีผลเมื่อมันควรได้รับการยอมรับ แต่ฉันสงสัยว่ามันแสดงให้เห็นว่าเป็นจริงทางคณิตศาสตร์ได้อย่างไร มีความสัมพันธ์ระหว่าง FDR และ FWER บ้างไหม

1
วิธีการเปรียบเทียบแบบใดที่จะใช้สำหรับโมเดล lmer: lsmeans หรือ glht
ฉันกำลังวิเคราะห์ชุดข้อมูลโดยใช้โมเดลเอฟเฟกต์ผสมกับเอฟเฟ็กต์คงที่หนึ่งรายการ (เงื่อนไข) และเอฟเฟกต์แบบสุ่มสองรายการ (ผู้เข้าร่วมเนื่องจากการออกแบบภายในและคู่ของเรื่อง) รูปแบบที่ถูกสร้างขึ้นด้วยแพคเกจ:lme4exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp) ต่อไปฉันทำการทดสอบอัตราส่วนความน่าจะเป็นของโมเดลนี้เทียบกับโมเดลโดยไม่มีผลกระทบคงที่ (เงื่อนไข) และมีความแตกต่างอย่างมีนัยสำคัญ ชุดข้อมูลของฉันมี 3 เงื่อนไขดังนั้นฉันจึงต้องการเปรียบเทียบหลายรายการ แต่ฉันไม่แน่ใจว่าจะใช้วิธีใด ฉันพบคำถามที่คล้ายกันจำนวนหนึ่งใน CrossValidated และฟอรัมอื่น ๆ แต่ฉันยังสับสนอยู่ จากสิ่งที่ฉันเห็นผู้คนแนะนำให้ใช้ 1.lsmeansแพคเกจ - lsmeans(exp.model,pairwise~condition)ซึ่งทำให้ผมส่งออกต่อไปนี้: condition lsmean SE df lower.CL upper.CL Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552 Confidence level used: 0.95 $contrasts …

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
ตัวแยกประเภทการเรียนรู้ของเครื่องใหญ่ -O หรือความซับซ้อน
เพื่อประเมินประสิทธิภาพของอัลกอริธึมลักษณนามใหม่ฉันพยายามเปรียบเทียบความแม่นยำและความซับซ้อน (big-O ในการฝึกอบรมและการจำแนก) จากเครื่องการเรียนรู้: ความคิดเห็นที่ฉันได้รับที่สมบูรณ์รายการลักษณนามภายใต้การดูแลยังเป็นตารางความถูกต้องระหว่างขั้นตอนวิธีการและปัญหาการทดสอบ 44 จากUCI repositoy อย่างไรก็ตามฉันไม่สามารถหาบทวิจารณ์กระดาษหรือเว็บไซต์กับ big-O สำหรับตัวแยกประเภททั่วไปเช่น: C4.5 RIPPER (ฉันคิดว่านี่อาจเป็นไปไม่ได้ แต่ใครจะรู้) ANN พร้อมการขยายพันธุ์กลับ Bayesian ไร้เดียงสา K-NN SVM ถ้าใครมีการแสดงออกสำหรับลักษณนามเหล่านี้มันจะมีประโยชน์มากขอบคุณ

2
ทำซ้ำมาตรการเมื่อเวลาผ่านไปด้วยขนาดเล็ก
ฉันได้รับข้อมูลเพื่อวิเคราะห์เพื่อศึกษาดูผลของการรักษาต่อระดับเหล็กที่จุดเวลาสี่จุดที่แตกต่างกัน (ก่อนการรักษาการรักษาสิ้นสุดวันที่ 4 สัปดาห์หลังการรักษาและ 2-4 เดือนหลังการรักษา) ไม่มีกลุ่มควบคุม พวกเขาต้องการตรวจสอบว่าระดับเหล็กเพิ่มขึ้นอย่างมีนัยสำคัญในแต่ละช่วงเวลาหลังการรักษา 3 ครั้งหรือไม่เมื่อเทียบกับระดับก่อนการรักษา (พื้นฐาน) ผู้ป่วยที่สิบเอ็ดมีระดับพื้นฐาน แต่มีเพียง 8 ผู้ป่วยที่มีข้อมูลที่สมบูรณ์สำหรับทุกจุดเวลา 4 ( nnn = 11, 10, 9 และ 8 สำหรับแต่ละจุดเวลา) ไม่เพียง แต่วัดระดับเหล็กเท่านั้น แต่ยังมีการใช้มาตรการทางห้องปฏิบัติการสองแบบในแต่ละช่วงเวลาเพื่อเปรียบเทียบกับระดับพื้นฐาน ฉันมีคำถามสองสามข้อเกี่ยวกับวิธีวิเคราะห์สิ่งนี้ ฉันแรกคิดว่า RM ANOVA จะเหมาะสมในการวิเคราะห์ข้อมูลนี้ แต่ฉันกังวลเกี่ยวกับขนาดตัวอย่างขนาดเล็กการสูญเสียข้อมูลและการกระจายข้อมูลที่ไม่ปกติ จากนั้นฉันพิจารณาเปรียบเทียบการวัดหลังการรักษาแต่ละครั้งกับการใช้การทดสอบ Wilcoxon ที่ได้รับการลงลายมือชื่อในระดับพื้นฐาน แต่จากนั้นฉันพบปัญหาการเปรียบเทียบหลายครั้ง อย่างไรก็ตามฉันได้อ่านวรรณกรรมบางอย่างที่ downplays จำเป็นต้องใช้การเปรียบเทียบหลาย ๆ โดยรวมแล้วฉันกำลังเผชิญกับตัวอย่างขนาดเล็กข้อมูลที่ไม่สมบูรณ์และการเปรียบเทียบหลาย ๆ แบบ (และจำเป็นหรือไม่ก็ตาม) ฉันหวังว่าทั้งหมดนี้ทำให้รู้สึก ฉันใหม่กับ CrossValidated และถูกเพื่อนร่วมงานกำกับที่นี่เพื่อเรียนรู้จากนักสถิติที่มีประสบการณ์ดังนั้นฉันจึงขอขอบคุณคำแนะนำใด …

2
มีสติถดถอยแบบขั้นตอน?
สมมติว่าฉันต้องการสร้างตัวจําแนกไบนารี ฉันมีคุณสมบัติหลายพันและตัวอย่างเพียงไม่กี่ 10s จากความรู้โดเมนผมมีเหตุผลที่ดีที่จะเชื่อว่าฉลากชั้นเรียนสามารถคาดการณ์ได้อย่างถูกต้องโดยใช้เพียงไม่กี่อย่าง แต่ผมไม่มีความคิดที่คน ฉันต้องการให้กฎการตัดสินใจขั้นสุดท้ายง่ายต่อการตีความ / อธิบายเพิ่มเติมโดยจำเป็นต้องมีคุณสมบัติจำนวนเล็กน้อย ชุดย่อยบางส่วนของคุณสมบัติของฉันมีความสัมพันธ์กันสูงดังนั้นการเลือกตัวเลือกทำนายที่น้อยที่สุดจะไม่ทำงาน ฉันยังต้องการที่จะสามารถทำการทดสอบสมมติฐานที่มีความหมายเกี่ยวกับคุณสมบัติของฉัน ขั้นตอนการถดถอยแบบขั้นตอนต่อไปนี้สมเหตุสมผลภายใต้เงื่อนไขเหล่านี้: เมื่อพิจารณาคุณลักษณะที่มีอยู่แล้วในโมเดล (หรือเพียงแค่การสกัดกั้นในการวนซ้ำครั้งแรก) ให้เลือกคุณลักษณะที่สร้างอัตราส่วนความน่าจะเป็นบันทึกที่ใหญ่ที่สุดเมื่อเพิ่มเข้ากับโมเดล ใช้อัตราส่วนการทดสอบไคสแควร์ในการคำนวณค่า P-value เล็กน้อยสำหรับการทดสอบสมมติฐานแต่ละครั้งที่ดำเนินการในการเลือกนี้ ค่า null ที่นี่คือการเพิ่มตัวแปรพิเศษเข้ากับโมเดลไม่มีความสามารถในการทำนายเพิ่มเติม ทางเลือกคือเพิ่มความสามารถในการทำนาย ปฏิบัติต่อสมมติฐานที่ทดสอบในขั้นตอนที่ 1 ของการวนซ้ำในแต่ละครอบครัวและคำนวณอัตราการค้นพบที่ผิดพลาดสำหรับค่า P-value ที่น้อยที่สุด (สำหรับสถานที่ที่เลือก) โดยใช้บางอย่างเช่น ไปที่ 1 เว้นแต่ว่าจะมีคุณสมบัติตรงตามเกณฑ์การหยุดบางอย่าง รายงานอัตราการค้นพบที่ผิดพลาดสำหรับฟีเจอร์แต่ละรายการ แต่ไม่ใช่ค่า P-value สำหรับโมเดลโดยรวม (เนื่องจากจะมีการขยายตัวอย่างมาก) การทดสอบค่า P ที่ถูกต้องแต่ละการทดสอบหลายรายการเหล่านี้แสดงถึงนัยสำคัญทางสถิติของคุณลักษณะนั้นซึ่งได้รับคุณสมบัติทั้งหมดที่เพิ่มไว้ก่อนหน้านี้ในโมเดล การทำสิ่งนี้ภายใต้สถานการณ์เหล่านี้ประสบความสำเร็จในการหลีกเลี่ยงการวิพากษ์วิจารณ์ทั่วไปของการถดถอยแบบขั้นตอนทั้งหมดหรือไม่? คำนวณอัตราการค้นพบที่ผิดด้วยวิธีนี้สมเหตุสมผลหรือไม่?

2
สูตรสำหรับ Benjamini-Hochberg ปรับค่า p เป็นอย่างไร
ฉันเข้าใจขั้นตอนและสิ่งที่ควบคุม ดังนั้นสูตรสำหรับค่า p ที่ปรับในขั้นตอน BH สำหรับการเปรียบเทียบหลายรายการคืออะไร เพียงแค่ตอนนี้ฉันรู้เดิม BH ไม่ได้ผลิตปรับ P-ค่าปรับเท่านั้น (ไม่ใช่) เงื่อนไขการปฏิเสธ: https://www.jstor.org/stable/2346101 Gordon Smyth ได้แนะนำค่า p BH ที่ปรับปรุงใหม่ในปี 2002 อย่างไรก็ตามคำถามยังคงมีอยู่ มันนำมาใช้ในการวิจัยเป็นด้วยวิธีการp.adjustBH

1
เท่าไหร่ขนาดเล็กสามารถ
อินโทร:หลังจากที่สังเกตเห็นความสนใจที่ได้รับในวันนี้จากคำถามนี้ " ANOVA จะมีความสำคัญหรือไม่หากไม่มีการทดสอบแบบ pairwise t? " ฉันคิดว่าฉันอาจสามารถ reframe ในวิธีที่น่าสนใจซึ่งสมควรได้รับคำตอบของตัวเอง . ความหลากหลายของผลไม่ลงรอยกัน (มูลค่าที่ตรา) สามารถเกิดขึ้นเมื่อนัยสำคัญทางสถิติเป็นที่เข้าใจกันว่าเป็นขั้วที่เรียบง่ายและตัดสินบนพื้นฐานเพียงของซึ่งเป็นสูงกว่าpppหรือααα\alpha@ Glen_b คำตอบสำหรับคำถามข้างต้นแสดงตัวอย่างที่มีประโยชน์ของกรณีที่: ANOVA FFFทดสอบสร้างpF&lt;.05pF&lt;.05p_F<.05สำหรับหนึ่งตัวแปรอิสระ (IV) กับสี่ระดับ แต่ pt&gt;.08pt&gt;.08p_t>.08สำหรับทุกสองตัวอย่างttt -tests ที่เปรียบเทียบความแตกต่างในตัวแปรเดียวกัน (DV) ในหมู่สังเกตสอดคล้องกับคู่ของ IV สี่แต่ละระดับ กรณีที่คล้ายกันเกิดขึ้นแม้จะมีการแก้ไข Bonferroni สำหรับการเปรียบเทียบแบบคู่หลังด้วยคำถามนี้: การวัดซ้ำของ Anova มีความสำคัญ แต่การเปรียบเทียบหลาย ๆ ครั้งกับการแก้ไข Bonferroni ไม่ได้เป็นเช่นนั้นหรือ? กรณีที่กล่าวถึงก่อนหน้านี้ที่มีการทดสอบแตกต่างกันเล็กน้อยในการถดถอยหลายครั้งก็มีอยู่: ทำไมจึงเป็นไปได้ที่จะได้รับสถิติ F อย่างมีนัยสำคัญ (p &lt;.001) แต่การทดสอบ t regressor ไม่สำคัญ? : …

2
การทดสอบของ Dunnett ใน R คืนค่าต่างกันในแต่ละครั้ง
ฉันใช้ไลบรารี R 'multcomp' ( http://cran.r-project.org/web/packages/multcomp/ ) เพื่อคำนวณการทดสอบของ Dunnett ฉันใช้สคริปต์ด้านล่าง: Group &lt;- factor(c("A","A","B","B","B","C","C","C","D","D","D","E","E","F","F","F")) Value &lt;- c(5,5.09901951359278,4.69041575982343,4.58257569495584,4.79583152331272,5,5.09901951359278,4.24264068711928,5.09901951359278,5.19615242270663,4.58257569495584,6.16441400296898,6.85565460040104,7.68114574786861,7.07106781186548,6.48074069840786) data &lt;- data.frame(Group, Value) aov &lt;- aov(Value ~ Group, data) summary(glht(aov, linfct=mcp(Group="Dunnett"))) ตอนนี้ถ้าฉันรันสคริปต์นี้ผ่าน R Console หลาย ๆ ครั้งฉันจะได้ผลลัพธ์ที่แตกต่างกันเล็กน้อยในแต่ละครั้ง นี่คือตัวอย่างหนึ่ง: Simultaneous Tests for General Linear Hypotheses Multiple Comparisons of Means: Dunnett Contrasts Fit: aov(formula = Value …

2
การแปลงรายการการจัดอันดับบางส่วนเป็นการจัดอันดับโลก
ฉันกำลังทำงานบางอย่างเช่นปัญหาต่อไปนี้ ฉันมีกลุ่มผู้ใช้และหนังสือ N เล่ม ผู้ใช้แต่ละคนสร้างการจัดอันดับตามลำดับของหนังสือทั้งหมดที่เขาอ่าน (ซึ่งน่าจะเป็นชุดย่อยของหนังสือ N) เช่นเล่ม 1&gt; เล่ม 40&gt; เล่ม 25 ตอนนี้ฉันต้องการเปลี่ยนการจัดอันดับผู้ใช้เหล่านี้ให้เป็นอันดับหนึ่งของหนังสือทั้งหมด มีวิธีการที่ดีหรือมาตรฐานที่จะลอง? จนถึงตอนนี้ฉันกำลังนึกถึงโมเดลแบรดลีย์ - เทอร์รี่ที่ใช้ในการเปรียบเทียบแบบคู่ แต่ฉันสงสัยว่ามีอะไรอีกไหม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.