คำถามติดแท็ก kruskal-wallis

ขั้นตอน Kruskal-Wallis เป็นการวิเคราะห์ความแปรปรวนทางเดียวแบบไม่ใช้พารามิเตอร์ซึ่งใช้ในการเปรียบเทียบตำแหน่งของกลุ่มสามกลุ่มขึ้นไป มันขยายขั้นตอนของ Mann-Whitney-Wilcoxon สองตัวอย่าง

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

4
ความแตกต่างระหว่างการทดสอบ ANOVA และ Kruskal-Wallis
ฉันกำลังเรียน R และได้ทำการทดลองกับการวิเคราะห์ความแปรปรวน ฉันวิ่งมาทั้งคู่แล้ว kruskal.test(depVar ~ indepVar, data=df) และ anova(lm(depVar ~ indepVar, data=dF)) มีความแตกต่างในทางปฏิบัติระหว่างการทดสอบทั้งสองนี้หรือไม่? ความเข้าใจของฉันคือพวกเขาทั้งสองประเมินสมมติฐานว่างว่าประชากรมีค่าเฉลี่ยเท่ากัน

3
มีการทดสอบ Kruskal Wallis ทางเดียวสำหรับแบบจำลองสองทางหรือไม่?
หากแบบจำลองนั้นไม่เป็นไปตามสมมติฐานของ ANOVA (โดยเฉพาะในภาวะปกติ) หากเป็นแบบทางเดียวแนะนำให้ทำการทดสอบแบบไม่ใช้พารามิเตอร์ของ Kruskal-Wallis แต่ถ้าคุณมีหลายปัจจัย

1
หลังการทดสอบหลัง Kruskal-Wallis: การทดสอบของ Dunn หรือ Bonferroni แก้ไขการทดสอบ Mann-Whitney หรือไม่
ฉันมีตัวแปรแบบกระจายที่ไม่ใช่แบบเกาส์และต้องตรวจสอบว่ามีความแตกต่างอย่างมีนัยสำคัญระหว่างค่าของตัวแปรนี้ใน 5 กลุ่มที่แตกต่างกันหรือไม่ ฉันทำการวิเคราะห์ความแปรปรวนทางเดียวของ Kruskal-Wallis (ซึ่งมีนัยสำคัญมาก) และหลังจากนั้นฉันต้องตรวจสอบว่ากลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญ เนื่องจากกลุ่มเรียงลำดับแล้ว (ค่าของตัวแปรในกลุ่มแรกควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สองซึ่งควรต่ำกว่าค่าของตัวแปรในกลุ่มที่สามเป็นต้น บน) ฉันทำการทดสอบ 4 ครั้งเท่านั้น: Group 1 vs Group 2 Group 2 vs Group 3 Group 3 vs Group 4 Group 4 vs Group 5 ฉันทำการวิเคราะห์ด้วยวิธีที่ต่างกันสองวิธี ฉันเริ่มโดยใช้การทดสอบการเปรียบเทียบหลายอย่างของดันน์ แต่ไม่มีอะไรสำคัญเกิดขึ้น ในทางกลับกันถ้าฉันใช้การทดสอบ Mann-Whitney และแก้ไขจำนวนการทดสอบ (4) โดยใช้ Bonferroni การทดสอบ 3 ครั้งจะมีความสำคัญ มันหมายความว่าอะไร? ฉันควรเชื่อถือผลลัพธ์ใด

2
การวิเคราะห์กำลังไฟสำหรับการทดสอบ Kruskal-Wallis หรือ Mann-Whitney U โดยใช้ R?
เป็นไปได้ไหมที่จะทำการวิเคราะห์พลังงานสำหรับการทดสอบ Kruskal-Wallis และ Mann-Whitney U? ถ้าใช่จะมีแพ็คเกจ / ฟังก์ชั่น R ใดบ้างที่ใช้งานได้?

1
จะอ่านผลการทดสอบของ Dunn ได้อย่างไร?
ฉันจะอ่านผลลัพธ์จากการ ทดสอบของ Dunn ได้อย่างไร โดยเฉพาะค่าในตารางด้านล่างบอกอะไรฉัน ฉันมีข้อมูลที่ไม่ใช่พารามิเตอร์ใน 4 กลุ่มและฉันทำการทดสอบ Kruskal-Wallis ก่อนเพื่อยืนยันว่าการแจกแจงของกลุ่มแตกต่างจากชุดข้อมูลอื่นและชุดข้อมูลรวม จากนั้นฉันใช้การทดสอบของ Dunn เพื่อดูว่ากลุ่มใดแตกต่างกันซึ่งไม่ได้เป็นกลุ่ม library(dunn.test) dunn.test(data, g=area, kw=TRUE) Kruskal-Wallis rank sum test data: x and area Kruskal-Wallis chi-squared = 1730.4401, df = 3, p-value = 0 Comparison of x by area (No adjustment) Row Mean-| Col Mean | A B C …

2
ฉันควรรายงานผลลัพธ์ที่ไม่สำคัญหรือไม่
ฉันใช้การทดสอบ Kruskal Wallis และสำหรับบางคำถามค่า p ไม่สำคัญ ฉันจะรายงานสิ่งนี้ในลักษณะเดียวกับที่เป็นสาระสำคัญโดยระบุ df สถิติการทดสอบและค่า p หรือไม่ ดังนั้นมันจะเป็นแบบนี้การทดสอบ Kruskal Wallis ได้ดำเนินการ แต่ผลลัพธ์ไม่พบว่ามีนัยสำคัญ H (3) = 2.119, p> 0.05 (หรือฉันจะระบุค่า p ที่แน่นอนที่นี่ (.548))

1
การเปรียบเทียบหลายรายการในการทดสอบแบบไม่มีพารามิเตอร์
ฉันกำลังทำงานกับชุดข้อมูลที่ไม่ใช่พารามิเตอร์และมี 12 การรักษา ฉันทำการทดสอบ Kruskal-Wallis และได้ค่าสำคัญและตอนนี้ฉันต้องการทำการเปรียบเทียบหลายขั้นตอนเพื่อดูว่าการรักษาใดที่แตกต่างกันอย่างมีนัยสำคัญ มีข้อมูลจำนวนมากเกี่ยวกับหัวข้อนี้ แต่ฉันไม่พบสิ่งใดที่แก้ไขปัญหานี้โดยเฉพาะ ความคิดใด ๆ ?? พีพีp

1
ความไม่สอดคล้องกันเล็กน้อยระหว่างฟังก์ชัน R ในตัว Kruskal-Wallis และการคำนวณด้วยตนเอง
ฉันสับสนในเรื่องต่อไปนี้และฉันไม่สามารถหาคำตอบที่อื่นได้ ฉันพยายามเรียนรู้ R ในขณะที่ทำสถิติและในการออกกำลังกายฉันพยายามตรวจสอบผลลัพธ์ของฟังก์ชั่น R ในตัวอีกครั้งโดยทำสิ่งเหล่านี้ 'ด้วยมือ' ตามที่เป็นอยู่ในอาร์อย่างไรก็ตาม สำหรับการทดสอบ Kruskal-Wallis ฉันได้รับผลลัพธ์ที่แตกต่างกันไปและฉันไม่สามารถหาสาเหตุได้ ตัวอย่างเช่นฉันกำลังดูข้อมูลต่อไปนี้ที่แจกในแบบฝึกหัด activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2) group <- c(rep("A", 11), rep("B", 10), …

4
สามารถใช้การทดสอบ Mann-Whitney สำหรับการเปรียบเทียบหลังเหตุการณ์หลังจาก Kruskal-Wallis ได้หรือไม่?
ฉันมีแบบจำลองที่สัตว์ถูกวางไว้ในสภาพแวดล้อมที่เป็นมิตรและหมดเวลาเพื่อดูว่ามันสามารถอยู่รอดได้นานแค่ไหนโดยใช้วิธีการบางอย่างเพื่อความอยู่รอด มีสามวิธีที่สามารถใช้เพื่อความอยู่รอด ฉันวิ่งสัตว์จำลอง 300 ตัวโดยใช้วิธีการเอาชีวิตรอดในแต่ละครั้ง การจำลองทั้งหมดเกิดขึ้นในสภาพแวดล้อมเดียวกัน แต่มีการสุ่มดังนั้นจึงแตกต่างกันในแต่ละครั้ง ฉันใช้เวลากี่วินาทีที่สัตว์มีชีวิตรอดในการจำลองแต่ละครั้ง ชีวิตที่ยืนยาวนั้นดีกว่า ข้อมูลของฉันมีลักษณะเช่นนี้: Approach 1, Approach 2, Approach 2 45,79,38 48,32,24 85,108,44 ... 300 rows of these ฉันไม่แน่ใจในทุกสิ่งที่ฉันทำหลังจากจุดนี้ดังนั้นให้ฉันรู้ว่าฉันกำลังทำอะไรที่โง่และผิด ฉันพยายามที่จะหาว่ามีความแตกต่างทางสถิติเกี่ยวกับอายุขัยโดยใช้วิธีการเฉพาะ ฉันรันการทดสอบ Shapiro ของแต่ละตัวอย่างและพวกเขากลับมาพร้อมค่า p เล็ก ๆ ดังนั้นฉันจึงเชื่อว่าข้อมูลไม่ได้เป็นมาตรฐาน ข้อมูลในแถวไม่มีความสัมพันธ์ซึ่งกันและกัน การสุ่มเมล็ดที่ใช้ในการจำลองแต่ละครั้งนั้นแตกต่างกัน ด้วยเหตุนี้ฉันจึงเชื่อว่าไม่มีการจับคู่ข้อมูล เนื่องจากข้อมูลไม่ได้ถูกทำให้เป็นมาตรฐาน, ไม่ได้จับคู่และมีตัวอย่างมากกว่าสองตัวอย่างฉันจึงทำการทดสอบ Kruskal Wallis ซึ่งกลับมาด้วยค่า p เท่ากับ 0.048 จากนั้นฉันย้ายไปที่โพสต์เฉพาะกิจโดยเลือก Mann Whitney ในไม่แน่ใจว่า Mann Whitney …

2
สมมติฐานการพึ่งพา Benjamini-Hochberg เป็นธรรม?
ฉันมีชุดข้อมูลที่ฉันทดสอบความแตกต่างอย่างมีนัยสำคัญระหว่างสามประชากรที่เกี่ยวกับตัวแปรที่แตกต่างกัน 50 รายการ ฉันทำสิ่งนี้โดยใช้การทดสอบ Kruskal-Wallis บนมือข้างหนึ่งและโดยการทดสอบอัตราส่วนความน่าจะเป็นของโมเดล GLM แบบซ้อนกันพอดี (ที่มีและไม่มีประชากรเป็นตัวแปรอิสระ) ในอีกด้านหนึ่ง เป็นผลให้ฉันมีรายชื่อ Kruskal-Wallis ppp- ค่าในมือข้างหนึ่งและสิ่งที่ฉันคิดว่าเป็นไคสแควร์ ppp- ค่าจากการเปรียบเทียบ LRT ที่อื่น ๆ ฉันต้องทำการแก้ไขการทดสอบหลายรูปแบบบางรูปแบบเนื่องจากมีการทดสอบมากกว่า 50 รายการและ Benjamini-Hochberg FDR ดูเหมือนว่าเป็นตัวเลือกที่เหมาะสมที่สุด อย่างไรก็ตามตัวแปรอาจไม่เป็นอิสระโดยมี "แคลน" หลายตัวที่สัมพันธ์กัน คำถามคือ: ฉันจะบอกได้อย่างไรว่าชุดของสถิติพื้นฐานสำหรับฉันppp- ค่าตอบสนองความต้องการของการพึ่งพาในเชิงบวกที่จำเป็นสำหรับกระบวนการ Benjamini-Hochberg ที่จะยังคงผูกพันกับ FDR? กระดาษ Benjamini-Hochberg-Yekutieli จากปี 2544 ระบุว่าสภาพ PRDS มีไว้สำหรับการแจกแจงแบบปกติหลายตัวแปรและการแจกแจงแบบนักศึกษา สิ่งที่เกี่ยวกับการทดสอบอัตราส่วนความน่าจะเป็นของฉันค่าไคสแควร์สำหรับการเปรียบเทียบแบบจำลอง? เกี่ยวกับppp- ค่าที่ฉันมีสำหรับการทดสอบ Kruskal-Wallis? ฉันสามารถใช้การแก้ไข FDR ที่เลวร้ายที่สุดกรณี Benjamini-Hochberg-Yekutieli ที่ไม่มีอะไรขึ้นอยู่กับการพึ่งพา …

2
ทดสอบความแตกต่างของ quantile-Q ระหว่างกลุ่มหรือไม่?
สำหรับตัวแปร Y บางตัวที่แบ่งออกเป็น 3 กลุ่ม (X) ฉันต้องการเปรียบเทียบกลุ่มและสำหรับสมมติฐานที่ว่าควอนไทล์ 90% นั้นเหมือนกันระหว่างทั้งสามกลุ่ม ฉันสามารถใช้การทดสอบอะไรได้บ้าง ทางเลือกหนึ่งที่ฉันคิดว่าใช้การถดถอยแบบควอไทล์มีทางเลือกอื่น ๆ ฉันคิดว่าถ้าฉันต้องการเปรียบเทียบค่ามัธยฐานฉันสามารถใช้การทดสอบ kruskal วอลลิส (แม้ว่ามันจะขึ้นอยู่กับอันดับ แต่ถ้าฉันจำได้อย่างถูกต้องมันจะให้ผลลัพธ์ที่เหมือนกันเมื่อการกระจายตัวที่เหลือเป็นสมมาตร) ขอบคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.