คำถามติดแท็ก wilcoxon-signed-rank

การทดสอบอันดับที่ลงนามของ Wilcoxon เป็นการทดสอบอันดับที่ไม่ใช่พารามิเตอร์เพื่อเปรียบเทียบสองตัวอย่างที่จับคู่ว่าค่าในหนึ่งใหญ่กว่าอีกค่าหนึ่งหรือไม่ ยังสามารถใช้เพื่อเปรียบเทียบตัวอย่างหนึ่งกับค่าคงที่ [การทดสอบอย่าสับสนกับ "การทดสอบเครื่องหมาย"]

5
วิธีจัดการกับข้อมูลแบบลำดับชั้น / ซ้อนในการเรียนรู้ของเครื่อง
ฉันจะอธิบายปัญหาด้วยตัวอย่าง สมมติว่าคุณต้องการที่จะทำนายรายได้ของแต่ละบุคคลที่มีคุณลักษณะบางอย่าง: {อายุ, เพศ, ประเทศ, ภูมิภาค, เมือง} คุณมีชุดข้อมูลการฝึกอบรมเช่นนั้น train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) train CountryID RegionID CityID Age Gender Income 1 1 1 1 23 M 31 2 1 1 1 48 F 42 3 …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 

2
ความแตกต่างระหว่างการทดสอบผลรวมของอันดับ Wilcoxon กับการทดสอบอันดับของ Wilcoxon
ฉันสงสัยว่าความแตกต่างทางทฤษฎีคืออะไรระหว่างการทดสอบ Wilcoxon Rank-Sum Test และ Wilcoxon Signed-Rank Test โดยใช้การสังเกตแบบคู่ ฉันรู้ว่าการทดสอบระดับผลรวมของ Wilcoxon ช่วยให้การสังเกตแตกต่างกันในสองตัวอย่างที่แตกต่างกันในขณะที่การทดสอบการลงนามอันดับสำหรับตัวอย่างที่จับคู่ไม่อนุญาตให้ทำได้อย่างไรก็ตามพวกเขาทั้งคู่ดูเหมือนจะทดสอบแบบเดียวกัน ใครสามารถให้ข้อมูลพื้นฐาน / ทฤษฎีเพิ่มเติมแก่ฉันได้บ้างเมื่อฉันควรใช้การทดสอบผลรวมลำดับของ Wilcoxon และเมื่อใดที่ควรใช้การทดสอบการลงนามระดับ Wilcoxon โดยใช้การสังเกตแบบคู่

1
การทดสอบแบบไม่อิงพารามิเตอร์หากดึงตัวอย่างสองตัวอย่างจากการแจกแจงแบบเดียวกัน
ฉันต้องการทดสอบสมมติฐานว่ามีตัวอย่างสองตัวอย่างมาจากประชากรเดียวกันโดยไม่มีการตั้งสมมติฐานใด ๆ เกี่ยวกับการกระจายตัวของกลุ่มตัวอย่างหรือประชากร ฉันจะทำสิ่งนี้ได้อย่างไร จากวิกิพีเดียความประทับใจของฉันคือการทดสอบ Mann Whitney U ควรเหมาะสม แต่ดูเหมือนจะไม่เหมาะสำหรับฉันในทางปฏิบัติ สำหรับ concreteness ฉันได้สร้างชุดข้อมูลที่มีสองตัวอย่าง (a, b) ที่มีขนาดใหญ่ (n = 10,000) และดึงมาจากประชากรสองกลุ่มที่ไม่ปกติ (bimodal) มีความคล้ายคลึงกัน (ค่าเฉลี่ยเดียวกัน) แตกต่างกัน (ค่าเบี่ยงเบนมาตรฐาน รอบ "humps.") ฉันกำลังมองหาการทดสอบที่จะรับรู้ว่าตัวอย่างเหล่านี้ไม่ได้มาจากประชากรเดียวกัน มุมมองฮิสโตแกรม: รหัส R: a <- tibble(group = "a", n = c(rnorm(1e4, mean=50, sd=10), rnorm(1e4, mean=100, sd=10))) b <- tibble(group = "b", n …

2
ขนาดของเอฟเฟกต์สำหรับ Wilcoxon ได้ลงลายมือชื่อทดสอบยศแล้วหรือยัง?
ผู้เขียนบางคน (เช่น Pallant, 2007, p. 225; ดูภาพด้านล่าง) แนะนำให้คำนวณขนาดของเอฟเฟกต์สำหรับการทดสอบยศของวิลคอกซันโดยการแบ่งสถิติการทดสอบด้วยสแควร์รูทของจำนวนการสังเกต: r = Znx+ nY√R=Znx+nYr = \frac{Z}{\sqrt{n_x + n_y}} Zคือผลลัพธ์สถิติการทดสอบโดย SPSS (ดูภาพด้านล่าง) และโดยwilcoxsign_testใน R (ดูคำถามที่เกี่ยวข้องของฉัน: teststatistic vs linearstatistic ใน wilcoxsign_test ) คนอื่น ๆ แนะนำ Bravais-Pearson ( ) หรือ Spearman ( ) สัมประสิทธิ์สหสัมพันธ์ (ขึ้นอยู่กับชนิดของข้อมูล)r = c o v ( XY)s d( X) × s …

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
จะทราบได้อย่างไรว่าเว็บไซต์โป๊กเกอร์ออนไลน์นั้นยุติธรรมหรือไม่?
สัปดาห์ที่แล้วฉันมีการสนทนาที่น่าสนใจกับเพื่อนที่ดีของฉัน เขาเล่นโป๊กเกอร์ออนไลน์มาแล้วและแนะนำว่ามีความสัมพันธ์ระหว่างการสมัครสมาชิกใหม่ / การโอนเงินเพิ่มเติมและไพ่ที่คุณได้รับแจกเช่นคุณได้รับไพ่ดี ๆ ไซต์อาจจะเสี่ยงมากถ้าเป็นจริง แต่ปัญหายังคงติดใจฉัน วิธีแรกของฉันไปนี้คือการขอให้เพื่อนของฉันที่จะกำหนด "บัตรดี" และทำง่ายทดสอบทวินาม เพื่อนของฉันมีเวลายากลำบากในการกำหนดว่าการ์ดที่ดีคืออะไร ถ้าเขาได้ไพ่ที่ไม่ดีจริง ๆ เขาก็รู้ว่าจะพับในขณะที่ถ้าเขาได้ไพ่ที่ดีเขาก็จะรู้ว่าจะต้องไปไหน - ไพ่ที่ไม่ดีนั้นอยู่ระหว่างนั้น วิธีอื่นของฉันคือการคำนวณความน่าจะเป็นที่แน่นอนของแต่ละมือที่ได้รับจากนั้นดูว่ามันแตกต่างจากที่คาดไว้หรือไม่โดยใช้การทดสอบแบบลงนามของ Wilcoxonเนื่องจากสิ่งนี้ควรตรวจจับรูปร่างการกระจายที่แตกต่างกัน ฉันเดาว่าส่วนที่ยากคือการคำนวณความน่าจะเป็นที่แน่นอน ข้อมูลจะประกอบด้วยไพ่แจกไพ่ 0-100 ใบแรกเมื่อเทียบกับไพ่แจก 300-400 ใบในสัปดาห์ต่อมา (หรือเพื่อนที่อยู่บนไซต์สักพักหนึ่ง) คำถาม : คุณแนะนำให้แนวทางแก้ไขปัญหาอย่างไร? Texas Hold'em ทำงานอย่างไร ฉันไม่เล่นเกมผู้เชี่ยวชาญ (ผมเคยเล่นเพียง Texas Hold'em 3-4 ครั้ง) แต่มันค่อนข้างง่ายที่คุณสามารถหารายละเอียดเพิ่มเติมเกี่ยวกับหน้าวิกินี่ ความแตกต่างที่สำคัญจากโป๊กเกอร์ทั่วไปคือคุณจะได้รับไพ่ 2 ใบเมื่อเริ่มต้นเท่านั้น คุณไม่ได้เปลี่ยนการ์ดเหล่านี้ บนโต๊ะมีการ์ดอีก 5 ใบคว่ำหน้าลง เมื่อรวมสองโต๊ะของคุณเข้ากับโต๊ะ 5 คุณจะได้ไพ่ 5 ใบที่ดีที่สุดเท่าที่จะเป็นไปได้ …

2
ทำซ้ำมาตรการเมื่อเวลาผ่านไปด้วยขนาดเล็ก
ฉันได้รับข้อมูลเพื่อวิเคราะห์เพื่อศึกษาดูผลของการรักษาต่อระดับเหล็กที่จุดเวลาสี่จุดที่แตกต่างกัน (ก่อนการรักษาการรักษาสิ้นสุดวันที่ 4 สัปดาห์หลังการรักษาและ 2-4 เดือนหลังการรักษา) ไม่มีกลุ่มควบคุม พวกเขาต้องการตรวจสอบว่าระดับเหล็กเพิ่มขึ้นอย่างมีนัยสำคัญในแต่ละช่วงเวลาหลังการรักษา 3 ครั้งหรือไม่เมื่อเทียบกับระดับก่อนการรักษา (พื้นฐาน) ผู้ป่วยที่สิบเอ็ดมีระดับพื้นฐาน แต่มีเพียง 8 ผู้ป่วยที่มีข้อมูลที่สมบูรณ์สำหรับทุกจุดเวลา 4 ( nnn = 11, 10, 9 และ 8 สำหรับแต่ละจุดเวลา) ไม่เพียง แต่วัดระดับเหล็กเท่านั้น แต่ยังมีการใช้มาตรการทางห้องปฏิบัติการสองแบบในแต่ละช่วงเวลาเพื่อเปรียบเทียบกับระดับพื้นฐาน ฉันมีคำถามสองสามข้อเกี่ยวกับวิธีวิเคราะห์สิ่งนี้ ฉันแรกคิดว่า RM ANOVA จะเหมาะสมในการวิเคราะห์ข้อมูลนี้ แต่ฉันกังวลเกี่ยวกับขนาดตัวอย่างขนาดเล็กการสูญเสียข้อมูลและการกระจายข้อมูลที่ไม่ปกติ จากนั้นฉันพิจารณาเปรียบเทียบการวัดหลังการรักษาแต่ละครั้งกับการใช้การทดสอบ Wilcoxon ที่ได้รับการลงลายมือชื่อในระดับพื้นฐาน แต่จากนั้นฉันพบปัญหาการเปรียบเทียบหลายครั้ง อย่างไรก็ตามฉันได้อ่านวรรณกรรมบางอย่างที่ downplays จำเป็นต้องใช้การเปรียบเทียบหลาย ๆ โดยรวมแล้วฉันกำลังเผชิญกับตัวอย่างขนาดเล็กข้อมูลที่ไม่สมบูรณ์และการเปรียบเทียบหลาย ๆ แบบ (และจำเป็นหรือไม่ก็ตาม) ฉันหวังว่าทั้งหมดนี้ทำให้รู้สึก ฉันใหม่กับ CrossValidated และถูกเพื่อนร่วมงานกำกับที่นี่เพื่อเรียนรู้จากนักสถิติที่มีประสบการณ์ดังนั้นฉันจึงขอขอบคุณคำแนะนำใด …

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

1
Wilcoxon ทดสอบผลรวมอันดับใน R
ฉันมีผลลัพธ์จากการทดสอบเดียวกันกับตัวอย่างสองตัวอย่าง: x <- c(17, 12, 13, 16, 9, 19, 21, 12, 18, 17) y <- c(10, 6, 15, 9, 8, 11, 8, 16, 13, 7, 5, 14) และฉันต้องการคำนวณการทดสอบผลรวมลำดับของ Wilcoxon เมื่อฉันคำนวณสถิติด้วยมือฉันจะได้รับ: T W = ∑อันดับ( X i ) = 156.5TWTWT_{W}TW= ∑ อันดับ( Xผม) = 156.5TW=∑rank(Xi)=156.5 T_{W}=\sum\text{rank}(X_{i}) = 156.5 เมื่อฉันให้ R แสดง …

3
ทำไมประสิทธิภาพเชิงสัมพัทธ์ของซีมโทติคของการทดสอบ Wilcoxon
มันเป็นที่รู้จักกันดีว่าประสิทธิภาพญาติ asymptotic (เป็น) ของ Wilcoxon ลงนามในการทดสอบยศเป็นเมื่อเทียบกับนักศึกษาของT -test ถ้าข้อมูลจะถูกดึงออกมาจากประชากรกระจายตามปกติ สิ่งนี้เป็นจริงสำหรับทั้งการทดสอบหนึ่งตัวอย่างขั้นพื้นฐานและตัวแปรสำหรับสองตัวอย่างอิสระ (Wilcoxon-Mann-Whitney U) นอกจากนี้ยังเป็นส่วนของการทดสอบ Kruskal-Wallis เมื่อเทียบกับ ANOVA F -test สำหรับข้อมูลปกติ3π≈ 0.9553π≈0.955\frac{3}{\pi} \approx 0.955 สิ่งนี้น่าทึ่ง (สำหรับฉันซึ่งเป็นหนึ่งใน " ลักษณะที่ไม่คาดคิดที่สุดของππ\pi ") และผลลัพธ์ที่เรียบง่ายอย่างน่าทึ่งมีหลักฐานที่ลึกซึ้งน่าทึ่งหรือเรียบง่าย

1
จะเลือกระหว่างการทดสอบการลงชื่อกับการทดสอบการจัดอันดับของวิลคอกซันได้อย่างไร
ฉันพยายามเลือกหนึ่งจากการทดสอบทั้งสองนี้เพื่อวิเคราะห์ข้อมูลที่จับคู่ ไม่มีใครรู้กฎของหัวแม่มือเกี่ยวกับที่จะเลือกโดยทั่วไป?

1
การทดสอบ Signed-Rank Test ของ Wilcoxon จะดีกว่าแบบทดสอบ t-Test หรือ Sign Test อย่างไร
หลังจากการสนทนาบางส่วน (ด้านล่าง) ตอนนี้ฉันมีภาพที่ชัดเจนของคำถามที่มุ่งเน้นดังนั้นนี่คือคำถามที่ได้รับการแก้ไขแม้ว่าความคิดเห็นบางส่วนอาจดูเหมือนไม่เกี่ยวข้องกับคำถามเดิม ดูเหมือนว่าการทดสอบแบบ t- มาบรรจบกันอย่างรวดเร็วสำหรับการแจกแจงแบบสมมาตรซึ่งการทดสอบแบบลงนามจะถือว่าสมมาตรและสำหรับการกระจายแบบสมมาตรนั้นไม่แตกต่างกันระหว่างค่าเฉลี่ย / pseudomedians / ค่ามัธยฐาน ถ้าเป็นเช่นนั้นภายใต้สถานการณ์ใดนักสถิติที่ไม่มีประสบการณ์ค่อนข้างจะพบว่าการทดสอบแบบมีลายเซ็นมีประโยชน์เมื่อเขา / เธอมีทั้งแบบทดสอบ t-test และทดสอบแบบลงชื่อ? หากหนึ่งในนักเรียนของฉัน (เช่นสังคมศาสตร์) กำลังพยายามทดสอบว่าการรักษาหนึ่งทำได้ดีกว่าอีกหรือไม่ (โดยการวัดที่ค่อนข้างง่ายตีความเช่นความคิดของความแตกต่าง "เฉลี่ย") ฉันกำลังดิ้นรนเพื่อหาสถานที่สำหรับการเซ็นชื่อ - การทดสอบยศแม้ว่าโดยทั่วไปแล้วดูเหมือนว่าจะได้รับการสอนและการทดสอบการลงชื่อก็ไม่สนใจในมหาวิทยาลัยของฉัน

2
ข้อมูลลำดับหรือช่วงเวลาจำเป็นสำหรับการทดสอบยศ Wilcoxon ที่ลงนามหรือไม่?
เมื่อดูที่แหล่งข้อมูลออนไลน์หลายแห่งฉันดูเหมือนจะไม่ได้รับคำตอบที่ตรง มีคนช่วยอธิบายให้ฉันฟังได้ไหมถ้าข้อมูลลำดับนั้นเพียงพอที่จะใช้สำหรับ WSRT และถ้าไม่ใช่การทดสอบเครื่องหมายเป็นทางเลือกที่เหมาะสมหรือไม่? ในที่สุดนี้เป็นโครงการวิทยานิพนธ์ของฉันที่มหาวิทยาลัยและหากมีการอ้างอิง / วรรณคดีใด ๆ ที่จะรวมอยู่ในคำตอบก็จะได้รับการชื่นชมมากเพราะฉันต้องพิสูจน์ตัวเลือกการทดสอบของฉันทั้งสองทางและจนถึงตอนนี้มีคำตอบจากเว็บไซต์ ไม่สามารถอ้างอิงได้!)

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.