คำถามติดแท็ก t-test

การทดสอบเพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างสองตัวอย่างหรือค่าเฉลี่ยของตัวอย่างหนึ่งค่า (หรือค่าพารามิเตอร์ประมาณ) กับค่าที่ระบุ หรือที่เรียกว่า "การทดสอบนักเรียน t" หลังจากนามแฝงของนักประดิษฐ์

2
การตั้งค่าใดที่จะมั่นใจได้ว่าช่วงเวลาจะไม่ดีขึ้นเมื่อขนาดตัวอย่างเพิ่มขึ้น
ในโพสต์บล็อกฉันพบการอ้างสิทธิ์นั้น "ฉันเชื่อ WG Cochrane จุดแรก (ประมาณ 1970's) ว่าด้วยช่วงความเชื่อมั่นในการตั้งค่าการสังเกตขนาดของตัวอย่างขนาดเล็กส่งผลให้การครอบคลุมที่ดีขึ้นด้วยตัวอย่างที่มีขนาดใหญ่พอให้ใกล้ศูนย์ครอบคลุม! ตอนนี้ฉันคิดว่าความกว้างของ CI ควรเข้าหา 0 ด้วยการเพิ่มขนาดตัวอย่าง แต่ความคิดที่ว่าความครอบคลุมจะแย่ลงพร้อมกันไม่น่าเชื่อถือสำหรับฉัน การเรียกร้องนี้เป็นจริงและภายใต้สถานการณ์ใด หรือฉันอ่านผิด ฉันใช้การจำลองโดยใช้ข้อมูลที่กระจายแบบสุ่มที่มีขนาดตัวอย่างจาก 10,000 ถึง 1000000 (ทดสอบหนึ่งตัวอย่าง, 95% CI), 1,000 เรียกใช้ในทุกขนาดตัวอย่างและความครอบคลุมไม่เลวร้ายสำหรับขนาดตัวอย่างที่สูงขึ้น (แทนฉันพบอัตราข้อผิดพลาดที่คาดว่าจะใกล้ ~ 5%)

1
องศาอิสระสำหรับการทดสอบของ Welch นั้นน้อยกว่าค่า DF ของการทดสอบแบบ pooled เสมอหรือไม่?
ฉันกำลังสอนหลักสูตรเกี่ยวกับสถิติเบื้องต้นและเรากำลังทำการทดสอบแบบทดสอบ t สำหรับสองตัวอย่างอิสระที่มีความแปรปรวนไม่เท่ากัน (Welch test) ในตัวอย่างที่ฉันเห็นระดับความเป็นอิสระที่ปรับแล้วซึ่งใช้โดยการทดสอบ Welch นั้นน้อยกว่าหรือเท่ากับเสมอ n1+ n2- 2n1+n2−2n_1+n_2-2 เป็นเช่นนี้เสมอหรือไม่ การทดสอบ Welch จะลด (หรือไม่เปลี่ยนแปลง) องศาอิสระของการทดสอบ t แบบรวม (ความแปรปรวนเท่ากัน) หรือไม่ และในเรื่องเดียวกันถ้าค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างมีค่าเท่ากันทำ DF ของการทดสอบเวลช์ลด ? ฉันดูที่สูตร แต่พีชคณิตยุ่งเหยิงn1+ n2- 2n1+n2−2n_1+n_2-2

4
วิธีที่ดีที่สุดในการวิเคราะห์ระยะเวลาการพักข้อมูลใน RCT ที่ใช้ในโรงพยาบาล
ฉันสนใจที่จะรู้ว่ามีมติเกี่ยวกับวิธีที่ดีที่สุดในการวิเคราะห์ข้อมูลระยะเวลาการพักอาศัย (LOS) ของโรงพยาบาลจาก RCT หรือไม่ นี่คือการแจกแจงแบบเบ้ขวามากโดยผู้ป่วยส่วนใหญ่จะออกจากโรงพยาบาลภายในไม่กี่วันถึงหนึ่งสัปดาห์ แต่ผู้ป่วยที่เหลือมีการคาดเดาไม่ได้ ตัวเลือกสำหรับการวิเคราะห์รวมถึง: ทดสอบ t (สมมติว่าปกติซึ่งไม่น่าจะเป็นปัจจุบัน) การทดสอบ Mann Whitney U การทดสอบ logrank การปรับโมเดลโมเดลอันตราย Cox ตามสัดส่วนในการจัดสรรกลุ่ม วิธีใด ๆ เหล่านี้มีพลังที่สูงกว่าอย่างเห็นได้ชัดหรือไม่?

2
คู่แบบเบย์คืออะไรกับการทดสอบสองตัวอย่างที่มีความแปรปรวนไม่เท่ากัน
ฉันกำลังมองหาคู่แบบเบย์ของการทดสอบสองตัวอย่างที่มีความแปรปรวนไม่เท่ากัน (การทดสอบ Welch) ฉันกำลังมองหาการทดสอบหลายตัวแปรเช่นสถิติ T ของ Hotelling อ้างอิงชื่นชม สำหรับกรณีหลายตัวแปรสมมติว่าเรามีและ( z 1 , ⋯ , z N )โดยที่y i (resp z i ) เป็นทางลัดสำหรับค่าเฉลี่ยตัวอย่างส่วนเบี่ยงเบนมาตรฐานและจำนวนตัวอย่าง ของคะแนน เราสามารถสรุปได้ว่าจำนวนของจุดที่เป็นค่าคงที่ในชุดข้อมูลที่ทั้งค่าเบี่ยงเบนมาตรฐานเหมือนกันทุกปีผม (รับผิดชอบZ ฉัน ) และนั่นหมายถึงตัวอย่างของY ฉัน (รับผิดชอบZ ฉัน(y1,⋯,yN)(y1,⋯,yN)(y_1,\cdots,y_N)(z1, ⋯,zN)(z1,⋯,Zยังไม่มีข้อความ)(z_1,\cdots,z_N)YผมYผมy_iZผมZผมz_iYผมYผมy_iZผมZผมz_iYผมYผมy_iZผมZผมz_i) มีความสัมพันธ์กัน หากคุณพล็อตตัวอย่างหมายถึงพวกมันติดตามซึ่งกันและกันและโดยการเชื่อมต่อคุณจะได้รับฟังก์ชั่นที่เปลี่ยนแปลงอย่างราบรื่น ตอนนี้ในบางส่วนฟังก์ชั่นเห็นด้วยกับฟังก์ชั่นzแต่ในส่วนอื่น ๆ มันไม่ได้เพราะm e a n ( y i ) - m e a n …

1
ขนาดตัวอย่างที่ต้องการเพื่อพิจารณาว่าชุดโฆษณาใดที่มีอัตราการคลิกผ่านสูงสุด
ฉันเป็นนักออกแบบซอฟต์แวร์โดยการแลกเปลี่ยนและฉันกำลังทำงานในโครงการสำหรับลูกค้าและฉันต้องการตรวจสอบให้แน่ใจว่าการวิเคราะห์ของฉันมีสถิติที่ดี พิจารณาสิ่งต่อไปนี้: เรามีโฆษณาn รายการ (n <10) และเราต้องการทราบว่าโฆษณาใดมีประสิทธิภาพดีที่สุด เซิร์ฟเวอร์โฆษณาของเราจะแสดงโฆษณาเหล่านี้แบบสุ่ม ความสำเร็จคือถ้าผู้ใช้คลิกที่โฆษณา - เซิร์ฟเวอร์ของเราคอยติดตามสิ่งนั้น ให้ไว้: ช่วงความเชื่อมั่น: 95% คำถาม: ขนาดตัวอย่างโดยประมาณคืออะไร? (เราต้องแสดงโฆษณาทั้งหมดกี่รายการ) ทำไม (จำได้ว่าฉันเป็นคนบ้า ๆ บอ ๆ ) ขอบคุณ

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

3
วิธีการทดสอบด้วยตัวอย่างขนาดใหญ่?
ฉันมีสองประชากรหนึ่งมี N = 38,704 (จำนวนการสังเกต) และอื่น ๆ ที่มี N = 1,313,662 ชุดข้อมูลเหล่านี้มี ~ 25 ตัวแปรอย่างต่อเนื่องทั้งหมด ฉันใช้ค่าเฉลี่ยของแต่ละชุดข้อมูลและคำนวณสถิติการทดสอบโดยใช้สูตร t = ข้อผิดพลาดหมายถึงความแตกต่าง / std ปัญหาคือระดับของเสรีภาพ ตามสูตรของ df = N1 + N2-2 เราจะมีอิสระมากกว่าที่ตารางสามารถจัดการได้ ข้อเสนอแนะเกี่ยวกับเรื่องนี้? วิธีตรวจสอบสถิติ t ที่นี่ ฉันรู้ว่า t-test ใช้สำหรับการจัดการตัวอย่าง แต่ถ้าเราใช้สิ่งนี้กับตัวอย่างขนาดใหญ่
11 t-test 

4
วิธีการเห็นภาพตัวอย่างการทดสอบสองตัวอย่าง
วิธีที่ได้รับการยอมรับมากที่สุดในการแสดงภาพผลลัพธ์ของการทดสอบตัวอย่างสองตัวอย่างที่เป็นอิสระคืออะไร ตารางตัวเลขใช้บ่อยขึ้นหรือมีการเรียงลำดับบางอย่างหรือไม่? เป้าหมายคือเพื่อให้ผู้สังเกตการณ์แบบชั่วคราวมองดูรูปและเห็นได้ทันทีว่าพวกเขาอาจมาจากประชากรสองกลุ่มที่แตกต่างกัน

1
การทดสอบ Signed-Rank Test ของ Wilcoxon จะดีกว่าแบบทดสอบ t-Test หรือ Sign Test อย่างไร
หลังจากการสนทนาบางส่วน (ด้านล่าง) ตอนนี้ฉันมีภาพที่ชัดเจนของคำถามที่มุ่งเน้นดังนั้นนี่คือคำถามที่ได้รับการแก้ไขแม้ว่าความคิดเห็นบางส่วนอาจดูเหมือนไม่เกี่ยวข้องกับคำถามเดิม ดูเหมือนว่าการทดสอบแบบ t- มาบรรจบกันอย่างรวดเร็วสำหรับการแจกแจงแบบสมมาตรซึ่งการทดสอบแบบลงนามจะถือว่าสมมาตรและสำหรับการกระจายแบบสมมาตรนั้นไม่แตกต่างกันระหว่างค่าเฉลี่ย / pseudomedians / ค่ามัธยฐาน ถ้าเป็นเช่นนั้นภายใต้สถานการณ์ใดนักสถิติที่ไม่มีประสบการณ์ค่อนข้างจะพบว่าการทดสอบแบบมีลายเซ็นมีประโยชน์เมื่อเขา / เธอมีทั้งแบบทดสอบ t-test และทดสอบแบบลงชื่อ? หากหนึ่งในนักเรียนของฉัน (เช่นสังคมศาสตร์) กำลังพยายามทดสอบว่าการรักษาหนึ่งทำได้ดีกว่าอีกหรือไม่ (โดยการวัดที่ค่อนข้างง่ายตีความเช่นความคิดของความแตกต่าง "เฉลี่ย") ฉันกำลังดิ้นรนเพื่อหาสถานที่สำหรับการเซ็นชื่อ - การทดสอบยศแม้ว่าโดยทั่วไปแล้วดูเหมือนว่าจะได้รับการสอนและการทดสอบการลงชื่อก็ไม่สนใจในมหาวิทยาลัยของฉัน

6
เราจะทราบความแปรปรวนของประชากรได้อย่างไร?
ในการทดสอบสมมติฐานคำถามทั่วไปคือความแปรปรวนของประชากรคืออะไร? คำถามของฉันคือเราจะทราบความแปรปรวนของประชากรได้อย่างไร ถ้าเรารู้การกระจายตัวทั้งหมดเราก็อาจรู้ค่าเฉลี่ยของประชากรทั้งหมด จากนั้นการทดสอบสมมติฐานคืออะไร?

3
Cohen's d สำหรับการทดสอบตัวอย่างขึ้นอยู่กับ
คำถามด่วน: ฉันเคยเห็นโคเฮนคำนวณวิธีที่ต่างกันสองวิธีสำหรับตัวอย่างที่ต้องทดสอบ t-test (เช่นการออกแบบภายในตัวอย่างที่ทดสอบประสิทธิภาพของยาที่มีการจับเวลาก่อน / หลัง) ใช้ค่าเบี่ยงเบนมาตรฐานของคะแนนการเปลี่ยนแปลงในส่วนของสมการสำหรับ Cohen's d การใช้ค่าเบี่ยงเบนมาตรฐานของคะแนนทดสอบก่อนกำหนดในส่วนของสมการสำหรับ Cohen's d ฉันพบว่ามีวรรณกรรมน้อยมากที่อธิบายถึงการใช้และ / หรือตัวเลือกใดตัวเลือกหนึ่ง มีความคิดด่วนไหม?

4
การทดสอบ t จะมีนัยสำคัญทางสถิติได้อย่างไรหากความแตกต่างเฉลี่ยเกือบ 0
ฉันกำลังพยายามเปรียบเทียบข้อมูลจากประชากร 2 คนเพื่อบอกว่าความแตกต่างระหว่างการรักษานั้นมีนัยสำคัญทางสถิติหรือไม่ ดูเหมือนว่าชุดข้อมูลจะกระจายตามปกติโดยมีความแตกต่างน้อยมากระหว่างสองชุด ความแตกต่างเฉลี่ยคือ 0.00017 ฉันทำการทดสอบแบบจับคู่โดยคาดหวังว่าฉันจะไม่ปฏิเสธสมมติฐานว่างที่ไม่ต่างกันระหว่างค่าเฉลี่ยอย่างไรก็ตามค่า t ที่คำนวณได้ของฉันนั้นสูงกว่าค่า t วิกฤตมาก

2
ในตัวอย่างหนึ่ง t-test, เกิดอะไรขึ้นถ้าในความแปรปรวนประมาณการค่าเฉลี่ยของกลุ่มตัวอย่างจะถูกแทนที่ด้วย
สมมติหนึ่งตัวอย่าง t-test ที่สมมติฐานคือ\สถิติแล้วโดยใช้กลุ่มตัวอย่างส่วนเบี่ยงเบนมาตรฐานsในการประเมินหนึ่งเปรียบเทียบการสังเกตกับค่าเฉลี่ยตัวอย่าง : t = ¯ x - μ 0μ = μ0μ=μ0\mu=\mu_0 ss¯xt = x¯¯¯- μ0s / n√เสื้อ=x¯-μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} s = 1n - 1Σni = 1( xผม- x¯¯¯)2---------------√s=1n-1Σผม=1n(xผม-x¯)2s=\sqrt{\frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2}2} อย่างไรก็ตามหากเราถือว่าที่ระบุเป็นจริงเราสามารถประมาณค่าเบี่ยงเบนมาตรฐานโดยใช้แทนค่าเฉลี่ยตัวอย่าง :s ∗ μ 0 ¯ xμ0μ0\mu_0s* * * *s* * * *s^*μ0μ0\mu_0x¯¯¯x¯\overline{x} s* * * *= 1n - 1Σni = …

2
ทดสอบว่าผู้คนออกหรือลดการเดิมพันหลังจากมีการสูญเสียซ้ำ
ฉันมีข้อมูลเกี่ยวกับชุดของการชนะและแพ้การเดิมพันมากกว่า 5 รอบของการเดิมพันพร้อมการขัดสีหลังแต่ละรอบ ฉันใช้แผนผังการตัดสินใจดังต่อไปนี้เพื่อแสดงข้อมูล โหนไปทางด้านบนของแผนภูมิคือผู้ที่มีการเดิมพันชนะและที่ด้านล่างของแผนภูมิจะมีการสูญเสียเดิมพัน ฉันต้องการดู (a) การขัดสีที่แต่ละโหนด (b) การเปลี่ยนแปลงขนาดการเดิมพันเฉลี่ยที่แต่ละโหนด ฉันกำลังดูอัตราการขัดสีที่แต่ละโหนดจากโหนดก่อนหน้าและอัตราการรอดชีวิต (ใช้จำนวนคนที่คาดหวังในแต่ละโหนดถ้าความน่าจะเป็น 50%) ตัวอย่างเช่นหากความน่าจะเป็นคือ 50% ที่แต่ละโหนดจาก 1,000 ที่เริ่มต้นประมาณ 500 คนควรอยู่ในแต่ละโหนดที่สอง W และ L สมมติฐานคือ (a) อัตราการขัดสีสูงกว่าหลังจากสูญเสีย การเดิมพัน (b) หมายถึงขนาดการเดิมพันจะลดลงหลังจากผู้แพ้และเพิ่มขึ้นหลังจากผู้ชนะ ฉันแค่ต้องการทำสิ่งนี้ในบรรยากาศที่เรียบง่ายแบบ univariate ก่อน ฉันจะทดสอบ t-test เพื่อแสดงการเปลี่ยนแปลงของขนาดการเดิมพันเฉลี่ยจากโหนด WW เป็นโหนด WWW มีนัยสำคัญทางสถิติได้อย่างไรหากมีคน 50 คนออกไปแล้ว ฉันไม่แน่ใจว่านี่เป็นวิธีการที่ถูกต้อง: การเดิมพันแต่ละครั้งมีความเป็นอิสระ แต่ผู้คนต่างออกไปหลังจากผู้แพ้ดังนั้นตัวอย่างจะไม่ตรงกัน หากเป็นกรณีของชั้นเรียนเดียวกันที่ใช้ชุดการทดสอบแบบหนึ่งต่อเนื่องกันโดยไม่มีการเลื่อนออกไปฉันจะเข้าใจวิธีการทดสอบแบบทดสอบที่เหมาะสม แต่ฉันคิดว่านี่แตกต่างกันเล็กน้อย ฉันจะทำสิ่งนี้ได้อย่างไร นอกจากนี้หากผลลัพธ์มีการบิดเบือนจากลูกค้าจำนวนน้อยฉันจะลบ 5% แรกและ …

1
ฉันควรใช้ระดับความอิสระโดยประมาณของ Welch (1947) หรือ Satterthwaite's (1946) หรือไม่
ฉันสับสนเกี่ยวกับสูตรที่ถูกต้องสำหรับองศาอิสระโดยประมาณที่ใช้สำหรับการทดสอบ t ของ Welch สูตรของ Satterthwaite (1946) เป็นสูตรที่ถูกอ้างถึงมากที่สุด แต่ Welch ให้ทางเลือกในปี 1947 ฉันไม่แน่ใจว่าควรใช้สูตรไหน (หรือใช้โดยซอฟต์แวร์ทางสถิติส่วนใหญ่) สูตรของ Satterthwaite: ( s2x/ nx+ s2Y/ nY)2( s2x/nx)2/ ( nx- 1 ) + ( s2Y/nY)2/ ( nY- 1 )(sx2/nx+sY2/nY)2(sx2/nx)2/(nx-1)+(sY2/nY)2/(nY-1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} สูตรของ Welch: - 2 + ( s2x/ nx+ s2Y/ nY)2( s2x/ nx)2/ ( nx+ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.