คำถามติดแท็ก wilcoxon-mann-whitney

การทดสอบผลรวมของอันดับ Wilcoxon หรือที่เรียกว่าการทดสอบ Mann-Whitney U เป็นการทดสอบที่ไม่ใช้พารามิเตอร์เพื่อประเมินว่าหนึ่งในสองตัวอย่างนั้นมีค่ามากกว่าที่อื่นหรือไม่

7
วิธีเลือกระหว่างการทดสอบ t-test หรือ non-parametric เช่น Wilcoxon ในกลุ่มตัวอย่างขนาดเล็ก
สมมติฐานบางอย่างสามารถทดสอบได้โดยใช้นักศึกษาของT -test (อาจจะใช้การแก้ไขเวลช์การแปรปรวนไม่เท่ากันในกรณีที่สองตัวอย่าง) หรือโดยการทดสอบไม่ใช่ตัวแปรเช่น Wilcoxon จับคู่ลงนามในการทดสอบการจัดอันดับการทดสอบ Wilcoxon-Mann-Whitney U, หรือการทดสอบเครื่องหมายจับคู่ เราจะตัดสินใจอย่างมีหลักการเกี่ยวกับการทดสอบใดที่เหมาะสมที่สุดโดยเฉพาะอย่างยิ่งหากขนาดตัวอย่างเป็น "เล็ก" หลายตำราเบื้องต้นและบันทึกการบรรยายให้ "ผัง" วิธีการที่ปกติมีการตรวจสอบ (อย่างใดอย่างหนึ่ง - inadvisedly - โดยการทดสอบภาวะปกติหรือวงกว้างมากขึ้นโดยพล็อต QQหรือคล้ายกัน) ที่จะตัดสินใจระหว่างT -test หรือการทดสอบไม่ใช่ตัวแปร สำหรับ unpaired สองตัวอย่างT -test อาจจะมีการตรวจสอบต่อไปสำหรับความสม่ำเสมอของความแปรปรวนในการตัดสินใจว่าจะใช้การแก้ไขเวลช์ ปัญหาหนึ่งของวิธีนี้คือวิธีการตัดสินใจที่จะใช้การทดสอบขึ้นอยู่กับข้อมูลที่สังเกตและวิธีการนี้มีผลต่อประสิทธิภาพ (พลังงานอัตราความผิดพลาดประเภทที่ 1) ของการทดสอบที่เลือก ปัญหาอีกประการหนึ่งคือความยากลำบากในการตรวจสอบมาตรฐานอยู่ในชุดข้อมูลขนาดเล็ก: การทดสอบอย่างเป็นทางการมีพลังงานต่ำดังนั้นการละเมิดอาจไม่ถูกตรวจจับได้ดี แม้การละเมิดที่ร้ายแรงจะไม่สามารถตรวจจับได้เช่นหากมีการกระจายการผสม แต่ไม่มีการสังเกตจากส่วนประกอบหนึ่งของส่วนผสม ซึ่งแตกต่างจากขนาดใหญ่เราไม่สามารถพึ่งพาความปลอดภัยของทฤษฎีขีด จำกัด กลางและบรรทัดฐานเชิงเส้นกำกับของสถิติการทดสอบและการแจกแจงแบบtnnn หลักการหนึ่งในการตอบสนองต่อสิ่งนี้คือ "ปลอดภัยไว้ก่อน": ไม่มีทางที่จะพิสูจน์ความน่าเชื่อถือของสมมติฐานในตัวอย่างเล็ก ๆ อีกประการหนึ่งคือการพิจารณาเหตุใด ๆ สมมติว่าปกติในทางทฤษฎี (เช่นตัวแปรคือผลรวมของส่วนประกอบสุ่มหลาย CLT ใช้) หรือสังเกตุ …

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

1
การคำนวณซ้ำของเอฟเฟกต์จากโมเดล lmer
ฉันเพิ่งอ่านบทความนี้ซึ่งอธิบายถึงวิธีการคำนวณความสามารถในการทำซ้ำ (ความน่าเชื่อถือหรือความสัมพันธ์ภายในอินทราเน็ต) ของการวัดผ่านการสร้างแบบจำลองเอฟเฟกต์ผสม รหัส R จะเป็น: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability R = intercept_var/(intercept_var+residual_var) #compute n0, the repeatability adjustment n = as.data.frame(table(my_data$unit)) k = nrow(n) N = sum(n$Freq) n0 = (N-(sum(n$Freq^2)/N))/(k-1) #compute …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

2
เมื่อใดจึงจะใช้การทดสอบยศรวมของวิลคอกซันแทนการทดสอบทีไม่มีคู่
นี่เป็นคำถามติดตามผลถึงสิ่งที่ Frank Harrell เขียนไว้ที่นี่ : จากประสบการณ์ของฉันขนาดตัวอย่างที่ต้องการสำหรับการแจกแจงแบบ t นั้นแม่นยำมักจะใหญ่กว่าขนาดตัวอย่างในมือ การทดสอบ Wilcoxon ที่ได้รับการจัดอันดับนั้นมีประสิทธิภาพอย่างที่คุณพูดและมีความแข็งแกร่งดังนั้นฉันจึงมักจะชอบมากกว่าการทดสอบ t ถ้าฉันเข้าใจถูกต้อง - เมื่อเปรียบเทียบตำแหน่งของตัวอย่างที่ไม่ตรงกันสองตัวอย่างเราต้องการใช้การทดสอบยศวิลคอกซันเหนือการทดสอบทีไม่มีคู่ถ้าขนาดตัวอย่างของเรามีขนาดเล็ก มีสถานการณ์ทางทฤษฎีที่เราต้องการทดสอบ Wilcoxon rank-sum มากกว่าการทดสอบ t-unpaired แม้ว่าขนาดตัวอย่างของทั้งสองกลุ่มของเรานั้นค่อนข้างใหญ่หรือไม่? แรงจูงใจของฉันสำหรับคำถามนี้เกิดจากการสังเกตว่าสำหรับการทดสอบตัวอย่าง t-test เพียงอย่างเดียวการใช้มันสำหรับการแจกแจงแบบเบ้เล็กน้อยที่ไม่ดังขนาดนั้นจะทำให้เกิดข้อผิดพลาดประเภท I ที่ผิด: n1 <- 100 mean1 <- 50 R <- 100000 P_y1 <- numeric(R) for(i in seq_len(R)) { y1 <- rexp(n1, 1/mean1) P_y1[i] <- t.test(y1 , …

1
รายงานการเสียชีวิตของการทดสอบเสื้อได้พูดเกินจริงอย่างมากหรือไม่?
การอ่าน CV คลาสสิกตลอดเวลาฉันเจอข้อความที่ฉันต้องการชี้แจง นี่คือโพสต์และคำถามของฉันอ้างถึงคำพูดปิด: "ฉันต้องทราบว่าความรู้ทั้งหมดที่ฉันเพิ่งจะค่อนข้างล้าสมัยตอนนี้ที่เรามีคอมพิวเตอร์เราสามารถทำได้ดีกว่าการทดสอบ t - เป็น Frank บันทึกคุณ อาจต้องการใช้การทดสอบ Wilcoxon ในทุก ๆ ที่ที่คุณได้รับการสอนให้ทำการทดสอบด้วย t " การขาดความกังวลเกี่ยวกับว่ามันเป็นเสียงที่จะสมมติว่าการกระจายตัวของค่าเฉลี่ยตัวอย่างเป็นเรื่องปกติพอที่จะเรียกใช้การทดสอบ t-เห็นได้ชัดว่าเป็นข้อได้เปรียบอย่างมาก และฉันเห็นว่าคอมพิวเตอร์สามารถจัดอันดับรายการที่มีความแตกต่างยาวระหว่างสองเวกเตอร์ของข้อมูลในสายลม ... ฉันจำได้ว่าทำด้วยตนเองเมื่อหลายปีก่อน แต่ฉันเชือนแช ... ดังนั้นการทดสอบเสื้อยืดเป็นเรื่องของอดีตอย่างแท้จริงหรือไม่? การทดสอบการเรียงสับเปลี่ยน? พวกเขาเกินไปเฉพาะกิจในความรู้สึกของมักจะผูกพันเขียนไม่กี่บรรทัดของรหัส?

2
ความแตกต่างระหว่างการทดสอบผลรวมของอันดับ Wilcoxon กับการทดสอบอันดับของ Wilcoxon
ฉันสงสัยว่าความแตกต่างทางทฤษฎีคืออะไรระหว่างการทดสอบ Wilcoxon Rank-Sum Test และ Wilcoxon Signed-Rank Test โดยใช้การสังเกตแบบคู่ ฉันรู้ว่าการทดสอบระดับผลรวมของ Wilcoxon ช่วยให้การสังเกตแตกต่างกันในสองตัวอย่างที่แตกต่างกันในขณะที่การทดสอบการลงนามอันดับสำหรับตัวอย่างที่จับคู่ไม่อนุญาตให้ทำได้อย่างไรก็ตามพวกเขาทั้งคู่ดูเหมือนจะทดสอบแบบเดียวกัน ใครสามารถให้ข้อมูลพื้นฐาน / ทฤษฎีเพิ่มเติมแก่ฉันได้บ้างเมื่อฉันควรใช้การทดสอบผลรวมลำดับของ Wilcoxon และเมื่อใดที่ควรใช้การทดสอบการลงนามระดับ Wilcoxon โดยใช้การสังเกตแบบคู่

5
การทดสอบแบบไม่อิงพารามิเตอร์ทำอะไรได้บ้างและคุณทำอะไรกับผลลัพธ์
ฉันรู้สึกว่านี่อาจถูกถามที่อื่น แต่ไม่จริงกับประเภทของคำอธิบายพื้นฐานที่ฉันต้องการ ฉันรู้ว่าไม่ใช่พารามิเตอร์อาศัยค่ามัธยฐานแทนค่าเฉลี่ยเพื่อเปรียบเทียบ ... บางสิ่งบางอย่าง ฉันเชื่อว่ามันต้องอาศัย "องศาอิสระ" (?) แทนที่จะเบี่ยงเบนมาตรฐาน ถูกต้องฉันถ้าฉันผิด ฉันได้ทำการวิจัยที่ดีพอสมควรหรืออย่างนั้นฉันก็คิดว่าพยายามเข้าใจแนวคิดว่าผลงานอยู่เบื้องหลังความหมายของผลการทดสอบจริง ๆ และ / หรือจะทำอย่างไรกับผลการทดสอบ อย่างไรก็ตามดูเหมือนว่าจะไม่มีใครกล้าเข้าไปในพื้นที่นั้น เพื่อความเรียบง่ายลองมากับ Mann-Whitney U-test ซึ่งฉันสังเกตเห็นว่ามันค่อนข้างเป็นที่นิยม หากคุณต้องการอธิบายการทดสอบอื่น ๆ ด้วยเช่นกันแม้ว่าฉันจะรู้สึกว่าเมื่อฉันเข้าใจแล้วฉันก็สามารถเข้าใจการทดสอบอื่น ๆ ในลักษณะที่คล้ายคลึงกับการทดสอบ t แบบต่างๆเป็นต้น สมมติว่าฉันทำการทดสอบที่ไม่ใช่พารามิเตอร์กับข้อมูลของฉันและฉันได้รับผลลัพธ์กลับมา: 2 Sample Mann-Whitney - Customer Type Test Information H0: Median Difference = 0 Ha: Median Difference ≠ 0 Size of Customer Large …

3
เอาต์พุตสถิติ W โดย wilcox.test () ใน R เหมือนกับสถิติ U หรือไม่
ฉันเพิ่งได้อ่านเกี่ยวกับการทดสอบ Mann-Whitney U ปรากฎว่าการทดสอบนี้ใน R คุณจำเป็นต้องทำการทดสอบ Wilcoxon จริง ๆ ! คำถามของฉัน: เป็น W สถิติของwilcox.testใน R เหมือนกับสถิติ U?

1
การทดสอบแบบไม่อิงพารามิเตอร์หากดึงตัวอย่างสองตัวอย่างจากการแจกแจงแบบเดียวกัน
ฉันต้องการทดสอบสมมติฐานว่ามีตัวอย่างสองตัวอย่างมาจากประชากรเดียวกันโดยไม่มีการตั้งสมมติฐานใด ๆ เกี่ยวกับการกระจายตัวของกลุ่มตัวอย่างหรือประชากร ฉันจะทำสิ่งนี้ได้อย่างไร จากวิกิพีเดียความประทับใจของฉันคือการทดสอบ Mann Whitney U ควรเหมาะสม แต่ดูเหมือนจะไม่เหมาะสำหรับฉันในทางปฏิบัติ สำหรับ concreteness ฉันได้สร้างชุดข้อมูลที่มีสองตัวอย่าง (a, b) ที่มีขนาดใหญ่ (n = 10,000) และดึงมาจากประชากรสองกลุ่มที่ไม่ปกติ (bimodal) มีความคล้ายคลึงกัน (ค่าเฉลี่ยเดียวกัน) แตกต่างกัน (ค่าเบี่ยงเบนมาตรฐาน รอบ "humps.") ฉันกำลังมองหาการทดสอบที่จะรับรู้ว่าตัวอย่างเหล่านี้ไม่ได้มาจากประชากรเดียวกัน มุมมองฮิสโตแกรม: รหัส R: a <- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b <- tibble(group = "b", n …

2
วิธีการทดสอบความแตกต่างระหว่างสองกลุ่มหมายถึงเมื่อข้อมูลไม่กระจายตามปกติ?
ฉันจะกำจัดรายละเอียดและการทดลองทางชีวภาพทั้งหมดและเสนอราคาเพียงปัญหาในมือและสิ่งที่ฉันทำทางสถิติ ฉันอยากจะรู้ว่ามันถูกต้องหรือไม่และจะทำอย่างไรต่อไป หากข้อมูล (หรือคำอธิบายของฉัน) ไม่ชัดเจนเพียงพอฉันจะพยายามอธิบายให้ดีขึ้นโดยแก้ไข สมมติว่าฉันมีสองกลุ่ม / สังเกต X และ Y มีขนาดNx=215Nx=215N_x=215และNy=40Ny=40N_y=40 40 ฉันต้องการทราบว่าค่าเฉลี่ยของการสังเกตทั้งสองนี้เท่ากันหรือไม่ คำถามแรกของฉันคือ: หากสมมติฐานเป็นที่พอใจจะต้องใช้การทดสอบสองตัวอย่างพารามิเตอร์ที่นี่? ฉันถามสิ่งนี้เพราะจากความเข้าใจของฉันมันมักจะใช้เมื่อขนาดเล็ก? ฉันพล็อตฮิสโทแกรมของทั้ง X และ Y และพวกมันไม่ได้กระจายตามปกติซึ่งเป็นหนึ่งในสมมติฐานของการทดสอบสองตัวอย่าง ความสับสนของฉันคือว่าฉันคิดว่าพวกเขาเป็นสองประชากรและนั่นคือเหตุผลที่ฉันตรวจสอบการกระจายปกติ แต่ฉันกำลังจะทำการทดสอบสองตัวอย่าง ... นี่ถูกไหม? จากทฤษฎีบทขีด จำกัด กลางฉันเข้าใจว่าถ้าคุณทำการสุ่มตัวอย่าง (โดยมี / ไม่มีการซ้ำซ้อนขึ้นอยู่กับขนาดประชากรของคุณ) หลาย ๆ ครั้งและคำนวณค่าเฉลี่ยของตัวอย่างในแต่ละครั้งมันจะกระจายโดยประมาณปกติ และค่าเฉลี่ยของตัวแปรสุ่มนี้จะเป็นการประมาณค่าเฉลี่ยของประชากรที่ดี ดังนั้นฉันจึงตัดสินใจทำทั้ง X และ Y 1,000 ครั้งและได้รับตัวอย่างและฉันกำหนดตัวแปรสุ่มให้กับค่าเฉลี่ยของแต่ละตัวอย่าง พล็อตนั้นกระจายตามปกติอย่างมาก ค่าเฉลี่ยของ X และ Y เท่ากับ 4.2 และ …

1
หลังการทดสอบหลัง Kruskal-Wallis: การทดสอบของ Dunn หรือ Bonferroni แก้ไขการทดสอบ Mann-Whitney หรือไม่
ฉันมีตัวแปรแบบกระจายที่ไม่ใช่แบบเกาส์และต้องตรวจสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าของตัวแปรนี้ใน 5 กลุ่มที่แตกต่างกันหรือไม่ ฉันทำการวิเคราะห์ความแปรปรวนทางเดียวของ Kruskal-Wallis (ซึ่งมีนัยสำคัญมาก) และหลังจากนั้นฉันต้องตรวจสอบว่ากลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญ เนื่องจากกลุ่มเรียงลำดับแล้ว (ค่าของตัวแปรในกลุ่มแรกควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สองซึ่งควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สามเป็นต้น บน) ฉันทำการทดสอบ 4 ครั้งเท่านั้น: Group 1 vs Group 2 Group 2 vs Group 3 Group 3 vs Group 4 Group 4 vs Group 5 ฉันทำการวิเคราะห์ด้วยวิธีที่ต่างกันสองวิธี ฉันเริ่มโดยใช้การทดสอบการเปรียบเทียบหลายอย่างของดันน์ แต่ไม่มีอะไรสำคัญเกิดขึ้น ในทางกลับกันถ้าฉันใช้การทดสอบ Mann-Whitney และแก้ไขจำนวนการทดสอบ (4) โดยใช้ Bonferroni การทดสอบ 3 ครั้งจะมีความสำคัญ มันหมายความว่าอะไร? ฉันควรเชื่อถือผลลัพธ์ใด

8
ขนาดตัวอย่างขั้นต่ำสำหรับการทดสอบทีไม่มีคู่
มี "กฎ" เพื่อกำหนดขนาดตัวอย่างขั้นต่ำที่จำเป็นสำหรับการทดสอบ t- ถูกต้องหรือไม่ ตัวอย่างเช่นการเปรียบเทียบจะต้องดำเนินการระหว่างค่าเฉลี่ยของ 2 ประชากร มี 7 จุดข้อมูลจากประชากรหนึ่งและเพียง 2 จุดข้อมูลจากที่อื่น น่าเสียดายที่การทดสอบมีราคาแพงมากและใช้เวลานานและการได้รับข้อมูลเพิ่มเติมนั้นไม่สามารถทำได้ สามารถใช้การทดสอบ t ได้ไหม? ทำไมหรือทำไมไม่? โปรดระบุรายละเอียด (ไม่ทราบความแปรปรวนของประชากรและการกระจาย) หากไม่สามารถใช้การทดสอบ t ได้จะสามารถใช้การทดสอบแบบไม่มีพารามิเตอร์ (Mann Whitney) ได้หรือไม่? ทำไมหรือทำไมไม่?

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
ทำไมการทดสอบ Mann-Whitney U ถึงมีความสำคัญเมื่อค่ามัธยฐานเท่ากัน?
ฉันได้รับผลลัพธ์จากการทดสอบระดับ Mann-Whitney ที่ฉันไม่เข้าใจ ค่ามัธยฐานของ 2 ประชากรนั้นเหมือนกัน (6.9) ตัวพิมพ์ใหญ่และควอนไทล์ที่ต่ำกว่าของแต่ละประชากรคือ: 6.64 และ 7.2 6.60 และ 7.1 ค่า p ที่เป็นผลมาจากการทดสอบเปรียบเทียบประชากรเหล่านี้คือ 0.007 ประชากรเหล่านี้จะแตกต่างกันอย่างมีนัยสำคัญได้อย่างไร? เป็นเพราะการแพร่กระจายเกี่ยวกับค่าเฉลี่ยหรือไม่ boxplot เปรียบเทียบ 2 แสดงว่าอันที่สองมีค่าผิดปกติมากกว่าครั้งแรก ขอบคุณสำหรับคำแนะนำใด ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.