คำถามติดแท็ก permutation-test

การทดสอบทางสถิติโดยอาศัยการจัดเรียงข้อมูลใหม่ที่สอดคล้องกับสมมติฐานว่าง

2
วิธีการสุ่มตัวอย่าง / การจำลองใหม่: monte carlo, bootstrapping, jackknifing, cross-validation, การทดสอบแบบสุ่มและการทดสอบการเปลี่ยนรูป
ฉันพยายามเข้าใจความแตกต่างระหว่างวิธีการสุ่มใหม่ (การจำลองมอนติคาร์โล, การบูตแบบพาราเมตริก, การบู๊ตแบบไม่มีพารามิเตอร์, การทดสอบแบบสุ่ม, การตรวจสอบข้าม, การทดสอบแบบสุ่มและการเปลี่ยนรูป) และการนำไปใช้ในบริบทของฉันเอง ว่าฉันมีสถานการณ์ดังต่อไปนี้ - ฉันต้องการดำเนินการ ANOVA ด้วยตัวแปรY ( Yvar) และX variable ( Xvar) Xvarเป็นหมวดหมู่ ฉันสนใจในสิ่งต่อไปนี้: (1) ความสำคัญของ p-values ​​- อัตราการค้นพบที่ผิด (2) ขนาดผลของXvarระดับ Yvar <- c(8,9,10,13,12, 14,18,12,8,9, 1,3,2,3,4) Xvar <- c(rep("A", 5), rep("B", 5), rep("C", 5)) mydf <- data.frame (Yvar, Xvar) คุณช่วยให้ฉันอธิบายความแตกต่างของการสุ่มตัวอย่างด้วยตัวอย่างงานที่ชัดเจนว่าวิธีการสุ่มตัวอย่างใหม่นี้ทำงานอย่างไร การแก้ไข: นี่คือความพยายามของฉัน: Bootstrap …

4
ดูแล้วคุณจะพบ (ความสัมพันธ์)
ฉันมีการวัดหลายร้อย ตอนนี้ฉันกำลังพิจารณาใช้ซอฟต์แวร์บางชนิดเพื่อเชื่อมโยงทุกการวัดกับทุกการวัด ซึ่งหมายความว่ามีความสัมพันธ์นับพัน ในกลุ่มคนเหล่านี้ควรมีความสัมพันธ์ทางสถิติสูงแม้ว่าข้อมูลจะสุ่มอย่างสมบูรณ์ (แต่ละการวัดมีเพียง 100 ดาต้าพอยน์) เมื่อฉันพบความสัมพันธ์ฉันจะรวมข้อมูลเกี่ยวกับความยากลำบากที่ฉันมองหาความสัมพันธ์ลงไปได้อย่างไร ฉันไม่ได้อยู่ในระดับสูงในสถิติดังนั้นโปรดอดทนกับฉัน

6
การใช้การทดสอบการเปลี่ยนรูปแบบใน R เพื่อใช้แทนการทดสอบแบบที (ทั้งคู่และไม่ใช่คู่)?
ฉันมีข้อมูลจากการทดสอบที่ฉันวิเคราะห์โดยใช้การทดสอบที ตัวแปรตามคือสเกลช่วงเวลาและข้อมูลไม่ถูกจับคู่ (เช่น 2 กลุ่ม) หรือจับคู่ (เช่นภายในวิชา) เช่น (ภายในวิชา): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 99.5, 99, 99, 99.5, 89.5, 99.5, 100, 99.5) y1 <- c(99, 99.5, 99.5, 0, 50, 100, 99.5, 99.5, 0, 99.5, 99.5, 90, 80, 0, 99, 0, 74.5, …

3
Bootstrap vs. การทดสอบสมมติฐานการเปลี่ยนลำดับ
มีเทคนิคการสุ่มตัวอย่างที่นิยมใช้กันหลายครั้งซึ่งมักใช้ในทางปฏิบัติเช่น bootstrapping, permutation test, jackknife เป็นต้นมีบทความและหนังสือจำนวนมากที่พูดถึงเทคนิคเหล่านี้เช่นPhilip I Good (2010) Permutation, Parametric และ Bootstrap Tests ของสมมติฐาน คำถามของฉันคือเทคนิคการสุ่มตัวอย่างแบบใดที่ได้รับความนิยมและง่ายต่อการใช้งานมากขึ้น การทดสอบการบูตหรือการเปลี่ยนรูป?

3
การคำนวณค่า p โดยใช้ bootstrap ด้วย R
ฉันใช้แพคเกจ "boot" เพื่อคำนวณค่าp-value bootstrapped แบบสองด้านโดยประมาณแต่ผลลัพธ์นั้นอยู่ห่างจาก p-value ของการใช้ t.test มากเกินไป ฉันไม่สามารถหาสิ่งที่ฉันทำผิดในรหัส R ของฉัน ใครช่วยได้โปรดให้คำแนะนำสำหรับเรื่องนี้กับฉัน time = c(14,18,11,13,18,17,21,9,16,17,14,15, 12,12,14,13,6,18,14,16,10,7,15,10) group=c(rep(1:2, each=12)) sleep = data.frame(time, group) require(boot) diff = function(d1,i){ d = d1[i,] Mean= tapply(X=d$time, INDEX=d$group, mean) Diff = Mean[1]-Mean[2] Diff } set.seed(1234) b3 = boot(data = sleep, statistic = diff, R = …

1
รายงานการเสียชีวิตของการทดสอบเสื้อได้พูดเกินจริงอย่างมากหรือไม่?
การอ่าน CV คลาสสิกตลอดเวลาฉันเจอข้อความที่ฉันต้องการชี้แจง นี่คือโพสต์และคำถามของฉันอ้างถึงคำพูดปิด: "ฉันต้องทราบว่าความรู้ทั้งหมดที่ฉันเพิ่งจะค่อนข้างล้าสมัยตอนนี้ที่เรามีคอมพิวเตอร์เราสามารถทำได้ดีกว่าการทดสอบ t - เป็น Frank บันทึกคุณ อาจต้องการใช้การทดสอบ Wilcoxon ในทุก ๆ ที่ที่คุณได้รับการสอนให้ทำการทดสอบด้วย t " การขาดความกังวลเกี่ยวกับว่ามันเป็นเสียงที่จะสมมติว่าการกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นเรื่องปกติพอที่จะเรียกใช้การทดสอบ t-เห็นได้ชัดว่าเป็นข้อได้เปรียบอย่างมาก และฉันเห็นว่าคอมพิวเตอร์สามารถจัดอันดับรายการที่มีความแตกต่างยาวระหว่างสองเวกเตอร์ของข้อมูลในสายลม ... ฉันจำได้ว่าทำด้วยตนเองเมื่อหลายปีก่อน แต่ฉันเชือนแช ... ดังนั้นการทดสอบเสื้อยืดเป็นเรื่องของอดีตอย่างแท้จริงหรือไม่? การทดสอบการเรียงสับเปลี่ยน? พวกเขาเกินไปเฉพาะกิจในความรู้สึกของมักจะผูกพันเขียนไม่กี่บรรทัดของรหัส?

2
สมมติฐานของการทดสอบการเปลี่ยนแปลงคืออะไร
มันมักจะระบุว่าการทดสอบการเปลี่ยนแปลงไม่มีข้อสันนิษฐานอย่างไรก็ตามเรื่องนี้ไม่เป็นความจริง ตัวอย่างเช่นหากตัวอย่างของฉันมีความสัมพันธ์กันฉันสามารถจินตนาการได้ว่าการอนุญาตให้ใช้ป้ายกำกับของพวกเขาจะไม่ใช่สิ่งที่ถูกต้อง เพียงคิดว่าฉันพบเกี่ยวกับปัญหานี้คือประโยคนี้จากวิกิพีเดีย: "ข้อสมมติฐานที่สำคัญที่อยู่เบื้องหลังการทดสอบการเปลี่ยนแปลงคือการสังเกตสามารถแลกเปลี่ยนได้ภายใต้สมมติฐานว่าง" ซึ่งฉันไม่เข้าใจ ข้อสมมติฐานของการทดสอบการเปลี่ยนรูปคืออะไร? และสมมติฐานเหล่านี้เชื่อมโยงกับแผนการเปลี่ยนแปลงที่เป็นไปได้ที่แตกต่างกันอย่างไร

1
การใช้ bootstrap ภายใต้ H0 เพื่อทำการทดสอบความแตกต่างของสองวิธี: การเปลี่ยนภายในกลุ่มหรือภายในกลุ่มตัวอย่าง
สมมติว่าฉันมีข้อมูลที่มีสองกลุ่มอิสระ: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length (g1.lengths), length (g2.lengths))) lengths = data.frame( lengths …

3
t-test กับข้อมูลที่บิดเบือนสูง
ฉันมีชุดข้อมูลที่มีการตรวจสอบข้อมูลค่ารักษาพยาบาลนับหมื่น ข้อมูลนี้เอียงไปทางขวาอย่างมากและมีศูนย์จำนวนมาก ดูเหมือนว่าสำหรับคนสองชุด (ในกรณีนี้มีวงดนตรีสองวงที่มี> 3000 obs ต่อคน): Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0 0.0 4536.0 302.6 395300.0 Min. 1st Qu. Median Mean 3rd Qu. Max. 0.0 0.0 0.0 4964.0 423.8 721700.0 ถ้าฉันทำการทดสอบ t ของ Welch กับข้อมูลนี้ฉันจะได้ผลลัพธ์กลับมา: Welch Two Sample t-test data: x and y t = …

2
ค่า P เท่ากับ 0 ในการทดสอบการเรียงสับเปลี่ยน
ฉันมีสองชุดข้อมูลและฉันต้องการที่จะทราบว่าพวกเขาแตกต่างกันอย่างมีนัยสำคัญหรือไม่ (นี้มาจาก " สองกลุ่มมีความแตกต่างอย่างมีนัยสำคัญ? ทดสอบที่จะใช้ ") ฉันตัดสินใจใช้การทดสอบการเปลี่ยนรูปโดยทำสิ่งต่อไปนี้ใน R: permutation.test <- function(coding, lncrna) { coding <- coding[,1] # dataset1 lncrna <- lncrna[,1] # dataset2 ### Under null hyphotesis, both datasets would be the same. So: d <- c(coding, lncrna) # Observed difference diff.observed = mean(coding) - mean(lncrna) number_of_permutations = 5000 diff.random …

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
ความแตกต่างระหว่างการทดสอบการสุ่มและการทดสอบการเปลี่ยนแปลง
ในวรรณคดีคำว่า Randomization and Permutation นั้นใช้แทนกันได้ ด้วยผู้เขียนหลายคนระบุว่าการทดสอบ "การเปลี่ยนแปลง (การสุ่ม) หรือ" ในทางกลับกัน อย่างดีที่สุดฉันเชื่อว่าความแตกต่างนั้นบอบบางและอยู่ในสมมติฐานของพวกเขาเกี่ยวกับข้อมูลและข้อสรุปที่อาจเกิดขึ้นซึ่งสามารถวาดได้ ฉันแค่ต้องตรวจสอบว่าความเข้าใจของฉันนั้นถูกต้องหรือว่ามีความแตกต่างที่ลึกซึ้งกว่าที่ฉันขาดหายไป การทดสอบการเปลี่ยนรูปสันนิษฐานว่าข้อมูลถูกสุ่มตัวอย่างจากการแจกแจงประชากรพื้นฐาน (แบบจำลองประชากร) ซึ่งหมายความว่าข้อสรุปที่ได้จากการทดสอบการเปลี่ยนรูปมักใช้กับข้อมูลอื่นจากประชากร [3] การทดสอบการสุ่ม (แบบจำลองการสุ่ม) "อนุญาตให้เราทิ้งสมมติฐานที่ไม่น่าเชื่อของการวิจัยทางจิตวิทยาทั่วไป --- การสุ่มตัวอย่างจากการแจกแจงที่ระบุ" [2] อย่างไรก็ตามนั่นหมายความว่าข้อสรุปที่ดึงมาใช้ได้เฉพาะกับตัวอย่างที่ใช้ในการทดสอบ [3] แน่นอนแม้ว่าความแตกต่างเป็นเพียงในแง่ของความหมายของประชากร หากเรากำหนดประชากรให้เป็น 'ผู้ป่วยทุกรายที่มีอาการป่วยและมีความเหมาะสมสำหรับการรักษา' การทดสอบการเปลี่ยนรูปนั้นมีผลต่อประชากร แต่เนื่องจากเราได้ จำกัด ประชากรให้เหมาะกับการรักษาจึงเป็นการทดสอบแบบสุ่ม การอ้างอิง: [1] การทดสอบการเปลี่ยนรูปของฟิลิปที่ดี: คู่มือปฏิบัติเพื่อทดสอบวิธีการทดสอบสมมติฐานอีกครั้ง [2] Eugene Edgington และ Patric Onghena การทดสอบการสุ่ม [3] Michael Ernst, วิธีการเรียงสับเปลี่ยน: พื้นฐานสำหรับการอนุมานที่แน่นอน

1
เป็นวิธีการของการสุ่มตัวอย่างเวลาชุดใหม่นี้เป็นที่รู้จักในวรรณคดี? มันมีชื่อหรือไม่?
เมื่อเร็ว ๆ นี้ฉันกำลังมองหาวิธีในการสุ่มตัวอย่างอนุกรมเวลาใหม่ในแบบที่ ประมาณรักษาความสัมพันธ์อัตโนมัติของกระบวนการหน่วยความจำยาว เก็บรักษาโดเมนของการสังเกต (ตัวอย่างเช่นชุดข้อมูลจำนวนเต็มครั้งที่ resampled ยังคงเป็นชุดข้อมูลจำนวนเต็มครั้ง) อาจส่งผลกระทบต่อเครื่องชั่งบางตัวเท่านั้นหากจำเป็น ฉันคิดรูปแบบการเปลี่ยนแปลงต่อไปนี้สำหรับอนุกรมเวลาที่มีความยาว :2ยังไม่มีข้อความ2ยังไม่มีข้อความ2^N Bin อนุกรมเวลาโดยการสังเกตต่อเนื่องเป็นคู่ (มีถังขยะ) พลิกแต่ละของพวกเขา ( เช่นดัชนีจากไป) อย่างอิสระที่มีความน่าจะเป็น1/22ยังไม่มีข้อความ- 12ยังไม่มีข้อความ-12^{N-1}1:22:11 / 21/21/2 Bin อนุกรมเวลาที่ได้รับจากการสังเกตครั้งติดต่อกัน(มีถังขยะ) ย้อนกลับแต่ละของพวกเขา ( เช่นดัชนีจากไป) independelty กับความน่า1/24442ยังไม่มีข้อความ- 22ยังไม่มีข้อความ-22^{N-2}1:2:3:44:3:2:11 / 21/21/2 ทำซ้ำขั้นตอนที่มีถังขยะขนาด , , ... ,เสมอย้อนกลับถังขยะที่มีความน่าจะเป็น1/28881616162N−12N−12^{N-1}1/21/21/2 การออกแบบนี้เป็นเชิงประจักษ์ล้วนและฉันกำลังมองหางานที่จะได้รับการตีพิมพ์ในประเภทของการเปลี่ยนแปลงนี้ ฉันยังเปิดรับข้อเสนอแนะสำหรับวิธีเรียงสับเปลี่ยนหรือโครงร่างการสุ่มใหม่

1
ช่วงความเชื่อมั่นและความไม่แน่นอนของค่า P สำหรับการทดสอบการเปลี่ยนรูป
ฉันกำลังเรียนรู้การทดสอบแบบสุ่มในขณะนี้ มีคำถามอยู่สองข้อในใจของฉัน: ใช่มันง่ายและใช้งานง่ายวิธีคำนวณค่า p ด้วยการทดสอบการสุ่ม (ซึ่งฉันคิดว่าเหมือนกับการทดสอบการเรียงสับเปลี่ยน?) อย่างไรก็ตามเราจะสร้างช่วงความมั่นใจได้ 95% ในขณะที่เราทำการทดสอบแบบพาราเมตริกได้อย่างไร เมื่อฉันอ่านเอกสารจาก University of Washington เกี่ยวกับการทดสอบการเรียงสับเปลี่ยนมีประโยคหนึ่งในหน้า 13 ที่บอกว่า: 1000 พีชคณิต .... ความไม่แน่นอนที่อยู่ใกล้ p = 0.05 เป็นเรื่องเกี่ยวกับ \%± 1 %±1%\pm 1\% ฉันสงสัยว่าเราจะมีความไม่แน่นอนนี้ได้อย่างไร

5
วิธีการทดสอบเอฟเฟกต์ปฏิสัมพันธ์กับการทดสอบที่ไม่ใช่พารามิเตอร์ (เช่นการทดสอบการเปลี่ยนแปลง)
ฉันมีตัวแปรเด็ดขาด / สองเล็กน้อย แต่ละคนสามารถรับค่าที่แตกต่างกันเพียงสองค่าเท่านั้น (ดังนั้นฉันจึงมีทั้งหมด 4 แบบ) การรวมกันของค่าแต่ละค่ามาพร้อมกับชุดของค่าตัวเลข ดังนั้นฉันมีตัวเลข 4 ชุด เพื่อให้เป็นรูปธรรมมากขึ้นขอให้เราบอกว่าฉันมีmale / femaleและyoung / oldเป็นตัวแปรที่กำหนดและฉันมีweight"เอาท์พุท" เชิงตัวเลข ฉันรู้ว่าการเปลี่ยนจากmaleเป็นfemaleเปลี่ยนน้ำหนักเฉลี่ยและการเปลี่ยนแปลงเหล่านี้มีนัยสำคัญทางสถิติ ดังนั้นฉันสามารถคำนวณgenderปัจจัย เช่นเดียวกับageตัวแปร ฉันรู้ว่าการเปลี่ยนจากyoungเป็นoldเปลี่ยนน้ำหนักเฉลี่ยและฉันสามารถคำนวณageปัจจัยที่เกี่ยวข้องได้ ตอนนี้สิ่งที่ฉันต้องการดูว่าข้อมูลพิสูจน์ให้เห็นว่าการเปลี่ยนจากหญิงสาวเป็นชายชราเป็นมากกว่าการรวมกันของเพศ - และปัจจัยอายุ กล่าวอีกนัยหนึ่งฉันต้องการทราบว่าข้อมูลพิสูจน์ว่ามี "เอฟเฟ็กต์ 2 มิติ" หรือกล่าวอีกนัยหนึ่งว่าเอฟเฟกต์อายุและเพศไม่ได้เป็นอิสระ ตัวอย่างเช่นอาจเป็นเรื่องเก่าสำหรับผู้ชายที่เพิ่มน้ำหนักตามปัจจัย 1.3 และสำหรับผู้หญิงปัจจัยที่เกี่ยวข้องคือ 1.1 แน่นอนฉันสามารถคำนวณสองปัจจัยที่กล่าวถึง (ปัจจัยอายุสำหรับผู้ชายและปัจจัยอายุสำหรับผู้หญิง) และพวกเขาจะแตกต่างกัน แต่ฉันต้องการคำนวณนัยสำคัญทางสถิติของความแตกต่างนี้ ความแตกต่างนี้จริงแค่ไหน ฉันต้องการทำแบบทดสอบที่ไม่ใช่พารามิเตอร์หากเป็นไปได้ เป็นไปได้ไหมที่จะทำสิ่งที่ฉันต้องการจะทำโดยการผสมทั้งสี่เซตสับมันแบ่งอีกครั้งและคำนวณบางอย่าง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.