คำถามติดแท็ก t-test

การทดสอบเพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างสองตัวอย่างหรือค่าเฉลี่ยของตัวอย่างหนึ่งค่า (หรือค่าพารามิเตอร์ประมาณ) กับค่าที่ระบุ หรือที่เรียกว่า "การทดสอบนักเรียน t" หลังจากนามแฝงของนักประดิษฐ์

3
แสดงคำตอบในแง่ของหน่วยดั้งเดิมในกล่องแปลงข้อมูล Box-Cox
สำหรับการวัดบางส่วนผลของการวิเคราะห์จะถูกนำเสนออย่างเหมาะสมในสเกลที่ถูกแปลง อย่างไรก็ตามในกรณีส่วนใหญ่เป็นที่พึงพอใจที่จะนำเสนอผลการวัดในระดับเดิม (มิฉะนั้นงานของคุณจะไร้ค่ามากกว่าหรือน้อยกว่า) ตัวอย่างเช่นในกรณีของข้อมูลที่บันทึกการแปลงปัญหาที่เกิดขึ้นกับการตีความในระดับเดิมเกิดขึ้นเพราะค่าเฉลี่ยของค่าบันทึกไม่ได้เป็นบันทึกของค่าเฉลี่ย การใช้ antilogarithm ของการประมาณค่าเฉลี่ยบนมาตราส่วนบันทึกไม่ได้ให้ค่าประมาณของค่าเฉลี่ยในระดับเดิม อย่างไรก็ตามหากข้อมูลที่แปลงเป็นบันทึกมีการแจกแจงแบบสมมาตรความสัมพันธ์ต่อไปนี้จะถูกเก็บไว้ (เนื่องจากบันทึกจะรักษาลำดับไว้): หมายถึง[ บันทึก( Y) ] = ค่ามัธยฐาน[ บันทึก( Y) ] = บันทึก[ ค่ามัธยฐาน( Y) ]Mean[log⁡(Y)]=Median[log⁡(Y)]=log⁡[Median(Y)]\text{Mean}[\log (Y)] = \text{Median}[\log (Y)] = \log[\text{Median} (Y)] (antilogarithm ของค่าเฉลี่ยของค่าบันทึกเป็นค่ามัธยฐานในระดับเดิมของการวัด) ดังนั้นฉันสามารถทำการอนุมานเกี่ยวกับความแตกต่าง (หรืออัตราส่วน) ของค่ามัธยฐานในระดับการวัดดั้งเดิม t-test สองตัวอย่างและช่วงความเชื่อมั่นมีความน่าเชื่อถือมากที่สุดถ้าประชากรอยู่ในเกณฑ์ปกติโดยมีค่าเบี่ยงเบนมาตรฐานประมาณดังนั้นเราอาจถูกล่อลวงให้ใช้การBox-Coxแปลงสำหรับสมมติฐานปกติที่จะถือ (ฉันยังคิดว่ามันเป็นความแปรปรวน ) อย่างไรก็ตามหากเราใช้เครื่องมือ t-to กับการBox-Coxแปลงข้อมูลเราจะได้รับการอนุมานเกี่ยวกับความแตกต่างของการแปลงข้อมูล เราจะตีความสิ่งเหล่านั้นในระดับการวัดดั้งเดิมได้อย่างไร (ค่าเฉลี่ยของค่าที่แปลงไม่ใช่ค่าเฉลี่ยที่แปลงแล้ว) กล่าวอีกนัยหนึ่งคือการใช้การแปลงผกผันของการประมาณค่าเฉลี่ยบนมาตราส่วนที่แปลงแล้วไม่ได้ให้ค่าประมาณของค่าเฉลี่ยบนมาตราส่วนดั้งเดิม ฉันสามารถทำการอนุมานเกี่ยวกับค่ามัธยฐานในกรณีนี้ได้หรือไม่? มีการเปลี่ยนแปลงที่จะอนุญาตให้ฉันกลับไปที่ค่าเฉลี่ย (ในระดับเดิม) หรือไม่? คำถามนี้ถูกโพสต์ครั้งแรกเป็นความคิดเห็นที่นี่

4
จะทำอย่างไรเมื่อค่าเฉลี่ยของสองตัวอย่างแตกต่างกันอย่างมีนัยสำคัญ แต่ความแตกต่างนั้นเล็กเกินไปที่จะสำคัญ
ฉันมีสองตัวอย่าง (ในทั้งสองกรณี) ค่าเฉลี่ยต่างกันประมาณสองเท่าของค่ามาตรฐานรวม dev ส่งผลให้มูลค่าอยู่ที่ประมาณ 10 ขณะที่มันเป็นเรื่องที่ดีที่จะได้รู้ว่าเราได้แสดงให้เห็นแน่ชัดว่าหมายถึงจะไม่เหมือนกันนี้ดูเหมือนว่าฉันจะถูกผลักดันโดย n ขนาดใหญ่ เมื่อดูที่ฮิสโตแกรมของข้อมูลฉันไม่รู้สึกว่าเช่น p-value เล็ก ๆ เป็นตัวแทนของข้อมูลจริงๆและโดยสุจริตไม่รู้สึกสะดวกสบายในการอ้างอิง ฉันอาจถามคำถามผิด สิ่งที่ฉันคิดคือ: ตกลงวิธีการที่แตกต่างกัน แต่ไม่สำคัญว่าในขณะที่การกระจายการแบ่งปันที่ทับซ้อนกันอย่างมีนัยสำคัญ?Tn≈70n≈70n \approx 70TTT นี่คือสิ่งที่การทดสอบแบบเบย์มีประโยชน์หรือไม่ ถ้าเป็นที่ที่เหมาะสำหรับการเริ่มต้น googling สักหน่อยไม่ได้ให้ประโยชน์อะไรเลย แต่ฉันอาจไม่ถามคำถามที่ถูกต้อง หากนี่เป็นสิ่งที่ผิดใครมีคำแนะนำใด ๆ หรือนี่เป็นเพียงจุดสำหรับการอภิปรายซึ่งต่างจากการวิเคราะห์เชิงปริมาณ

1
T-test สองตัวอย่างพร้อมข้อมูลถ่วงน้ำหนัก
ฉันต้องการทำการทดสอบสองตัวอย่างเพื่อทดสอบความแตกต่างระหว่างสองตัวอย่างอิสระซึ่งแต่ละตัวอย่างปฏิบัติตามสมมติฐานของการทดสอบ T (การแจกแจงแต่ละครั้งสามารถสันนิษฐานได้ว่าเป็นอิสระและกระจายตัวเหมือนปกติพร้อมความแปรปรวนเท่ากัน) . ความซับซ้อนเพียงอย่างเดียวจากการทดสอบสองตัวอย่างขั้นพื้นฐานคือข้อมูลมีน้ำหนัก ฉันกำลังใช้ค่าเฉลี่ยถ่วงน้ำหนักและส่วนเบี่ยงเบนมาตรฐาน แต่น้ำหนักของ N นั้นจะทำให้ขนาดของกลุ่มตัวอย่างพองขึ้นจริงดังนั้นจึงมีอคติกับผลลัพธ์ มันเป็นเพียงกรณีของการแทนที่ Ns ถ่วงน้ำหนักด้วย Ns ถ่วงน้ำหนัก?
13 t-test 

1
นัยสำคัญทางสถิติของความแตกต่างระหว่างระยะทาง
ฉันมีเวกเตอร์มากกว่า 3,000 ตัวบนกริดสองมิติพร้อมการกระจายแบบไม่ต่อเนื่องโดยประมาณ เวกเตอร์คู่หนึ่งตอบสนองเงื่อนไขที่แน่นอน หมายเหตุ: เงื่อนไขนี้ใช้ได้กับคู่เวกเตอร์เท่านั้นไม่ใช่กับเวกเตอร์แต่ละตัว ฉันมีรายการประมาณ 1,500 คู่ดังกล่าวลองเรียกมันว่ากลุ่ม 1 กลุ่มที่ 2 มีคู่เวกเตอร์อื่น ๆ ทั้งหมด ฉันต้องการตรวจสอบว่าระยะห่างระหว่างเวกเตอร์ในคู่ในกลุ่ม 1 นั้นมีขนาดเล็กกว่าระยะทางเฉลี่ยระหว่างสองเวกเตอร์หรือไม่ ฉันจะทำสิ่งนั้นได้อย่างไร การทดสอบทางสถิติ : ทฤษฎีบทขีด จำกัด กลางสามารถใช้กับกรณีของฉันได้หรือไม่? นั่นคือฉันสามารถใช้ตัวอย่างระยะทางและใช้การทดสอบ t ของนักเรียนเพื่อเปรียบเทียบวิธีของตัวอย่างที่ปฏิบัติตามเงื่อนไขด้วยวิธีการตัวอย่างที่ไม่ตรงตามเงื่อนไขหรือไม่ มิฉะนั้นการทดสอบทางสถิติใดที่เหมาะสมที่นี่ ขนาดตัวอย่างและจำนวนตัวอย่าง : ฉันเข้าใจว่ามีสองตัวแปรที่นี่สำหรับแต่ละกลุ่มสองฉันต้องใช้ตัวอย่างnขนาดmและหาค่าเฉลี่ยของตัวอย่างแต่ละตัวอย่าง มีวิธีใดหลักการในการเลือกnและm ? พวกเขาควรมีขนาดใหญ่ที่สุด หรือควรให้น้อยที่สุดเท่าที่จะเป็นไปได้ตราบใดที่พวกเขาแสดงนัยสำคัญทางสถิติ? พวกเขาควรจะเหมือนกันสำหรับแต่ละกลุ่มหรือไม่ หรือควรใหญ่กว่าสำหรับกลุ่ม 2 ซึ่งมีจำนวนคู่เวกเตอร์มากกว่านี้

1
การประเมินผลของ“ ประมาณปกติ” สำหรับการทดสอบที
ฉันกำลังทดสอบวิธีการที่เท่าเทียมกันโดยใช้การทดสอบ t ของ Welch การแจกแจงพื้นฐานอยู่ไกลจากปกติ (บิดเบือนมากกว่าตัวอย่างในการสนทนาที่เกี่ยวข้องที่นี่ ) ฉันสามารถรับข้อมูลเพิ่มเติมได้ แต่ต้องการวิธีที่มีหลักการในการพิจารณาว่าจะทำเช่นไร มีฮิวริสติกที่ดีสำหรับการประเมินว่าการแจกตัวอย่างเป็นที่ยอมรับหรือไม่? การเบี่ยงเบนใด ๆ จากภาวะปกติที่เกี่ยวข้องกับอะไรมากที่สุด มีวิธีการอื่น ๆ - เช่นอาศัยช่วงความเชื่อมั่นบูตสำหรับสถิติตัวอย่าง - ซึ่งจะทำให้รู้สึกมากขึ้น?

1
t.test ส่งคืนข้อผิดพลาด“ data เป็นค่าคงที่”
R version 3.1.1 (2014-07-10) -- "Sock it to Me" > bl <- c(140, 138, 150, 148, 135) > fu <- c(138, 136, 148, 146, 133) > t.test(fu, bl, alternative = "two.sided", paired = TRUE) Error in t.test.default(fu, bl, alternative = "two.sided", paired = TRUE) : data are essentially constant จากนั้นฉันเปลี่ยนอักขระเพียงชุดเดียวในชุดข้อมูลของฉัน: …
12 r  t-test 

5
จะทำการใส่ค่าในจุดข้อมูลจำนวนมากได้อย่างไร?
ฉันมีชุดข้อมูลที่มีขนาดใหญ่มากและมีค่าสุ่มประมาณ 5% หายไป ตัวแปรเหล่านี้มีความสัมพันธ์ซึ่งกันและกัน ตัวอย่างชุดข้อมูล R ต่อไปนี้เป็นเพียงตัวอย่างของเล่นที่มีข้อมูลที่สัมพันธ์กันจำลอง set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep ="") rownames(xmat) <- paste("sample", 1:200, sep = "") #M variables are correlated N <- 2000000*0.05 # 5% random missing values inds …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
วิธีการทดสอบ bootstrap เพื่อเปรียบเทียบค่าเฉลี่ยของสองตัวอย่าง?
ฉันมีตัวอย่างที่บิดเบี้ยวสองตัวอย่างและพยายามใช้การบูตสแตรปเพื่อเปรียบเทียบค่าเฉลี่ยของพวกเขาโดยใช้สถิติที ขั้นตอนที่ถูกต้องในการทำคืออะไร? กระบวนการที่ฉันใช้ ฉันกังวลเกี่ยวกับความเหมาะสมของการใช้ข้อผิดพลาดมาตรฐานของข้อมูลต้นฉบับ / การสังเกตในขั้นตอนสุดท้ายเมื่อฉันรู้ว่านี่ไม่ใช่การกระจายแบบปกติ นี่คือขั้นตอนของฉัน: Bootstrap - สุ่มเลือกตัวอย่างพร้อมเปลี่ยน (N = 1,000) คำนวณเสื้อสถิติสำหรับแต่ละบูตเพื่อสร้างเสื้อกระจาย: T( b ) = ( X)¯¯¯¯ข1- X¯¯¯¯ข2) - ( X¯¯¯¯1- X¯¯¯¯2)σ2x b 1/ n+ σ2x b 2/ n-------------√T(b)=(X¯b1−X¯b2)−(X¯1−X¯2)σxb12/n+σxb22/n T(b) = \frac{(\overline{X}_{b1}-\overline{X}_{b2})-(\overline{X}_1-\overline{X}_2) }{\sqrt{ \sigma^2_{xb1}/n + \sigma^2_{xb2}/n }} ประมาณค่าช่วงความเชื่อมั่น t โดยรับและ1 - α / 2เปอร์เซ็นต์ของการแจกแจงแบบ tα / 2α/2\alpha/21 …

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
ข้อสมมติฐานเชิงบรรทัดฐานอะไรบ้างที่จำเป็นสำหรับการทดสอบแบบไม่มีคู่ แล้วพวกเขาจะพบกันเมื่อไหร่?
หากเราต้องการทำการทดสอบแบบจับคู่ความต้องการคือ (ถ้าฉันเข้าใจอย่างถูกต้อง) ว่าความแตกต่างเฉลี่ยระหว่างหน่วยการวัดที่ตรงกันจะถูกกระจายตามปกติ ในการทดสอบ t-test แบบคู่ซึ่งเป็นข้อต่อ (AFAIK) ในความต้องการว่าความแตกต่างระหว่างหน่วยการวัดที่ตรงกันจะถูกกระจายตามปกติ (แม้ว่าการกระจายตัวของกลุ่มเปรียบเทียบทั้งสองกลุ่มจะไม่ปกติ) อย่างไรก็ตามในการทดสอบแบบไม่จับคู่เราไม่สามารถพูดคุยเกี่ยวกับความแตกต่างระหว่างหน่วยที่ตรงกันดังนั้นเราต้องการให้การสังเกตจากทั้งสองกลุ่มเป็นเรื่องปกติเพื่อให้ความแตกต่างของค่าเฉลี่ยของพวกเขาเป็นเรื่องปกติ ซึ่งทำให้ฉันคำถามของฉัน: เป็นไปได้หรือไม่สำหรับการแจกแจงแบบไม่ปกติสองแบบเพื่อให้ความแตกต่างของค่าเฉลี่ยถูกกระจายตามปกติ (และตอบสนองความต้องการที่จำเป็นของเราในการดำเนินการทดสอบ t ที่ไม่มีคู่กับพวกเขา - อีกครั้ง - เท่าที่ฉันเข้าใจ) อัปเดต: (ขอบคุณทุกคำตอบ) ฉันเห็นว่ากฎทั่วไปที่เรากำลังมองหาคือความแตกต่างของค่าเฉลี่ยจะเป็นเรื่องปกติซึ่งน่าจะเป็นข้อสันนิษฐานที่ดี (ต่ำกว่าพอ n) เนื่องจาก CLT นี่เป็นสิ่งที่น่าอัศจรรย์สำหรับฉัน (ไม่น่าแปลกใจเพียงแค่น่าอัศจรรย์) สำหรับวิธีการนี้สำหรับการทดสอบแบบไม่ใช้คู่ แต่ไม่ได้ผลสำหรับการทดสอบตัวอย่างแบบเดี่ยว นี่คือรหัส R เพื่อแสดง: n1 <- 10 n2 <- 10 mean1 <- 50 mean2 <- 50 R <- 10000 # diffs …

2
ความแตกต่างระหว่าง t-test และ ANOVA ในการถดถอยเชิงเส้น
ฉันสงสัยว่าความแตกต่างระหว่าง t-test และ ANOVA ในการถดถอยเชิงเส้นคืออะไร t-test เพื่อทดสอบว่าหนึ่งในความชันและการสกัดกั้นใดมีค่าเป็นศูนย์หรือไม่ในขณะที่ ANOVA เพื่อทดสอบว่าความชันทั้งหมดมีค่าเป็นศูนย์หรือไม่ นี่เป็นข้อแตกต่างระหว่างพวกเขาเหรอ? ในการถดถอยเชิงเส้นอย่างง่ายนั่นคือมีตัวแปรตัวทำนายเพียงตัวเดียวเท่านั้น t-test และ ANOVA มีความเทียบเท่าหรือไม่และถ้าใช่วิธีการที่พวกเขาใช้สถิติที่แตกต่างกัน (t-test ใช้ t-statistic และ ANOVA ใช้ F-statistic)?

1
test vs -tests?
ฉันพยายามคิดให้ชัดเจนว่าอะไรคือความแตกต่างระหว่างการทดสอบและการทดสอบztttzzz เท่าที่ฉันสามารถบอกได้ว่าสำหรับการทดสอบทั้งสองคลาสเราใช้สถิติการทดสอบเดียวกันซึ่งเป็นรูปแบบบางอย่าง b^−Cseˆ(b^)b^−Cse^(b^)\frac{\hat{b} - C}{\widehat{\operatorname{se}}(\hat{b})} ที่เป็นตัวอย่างสถิติคือการอ้างอิงบางอย่าง (ที่ตั้ง) ค่าคงที่ (ซึ่งขึ้นอยู่กับรายการของการทดสอบ) และเป็นมาตรฐาน ข้อผิดพลาดของ{ข} C ^ SE (ข )ขb^b^\hat{b}CCCseˆ(b^)se^(b^)\widehat{\operatorname{se}}(\hat{b})b^b^\hat{b} แตกต่างเพียงแล้วระหว่างทั้งสองชั้นของการทดสอบก็คือว่าในกรณีของ -tests สถิติการทดสอบข้างต้นดังต่อไปนี้ -distribution (สำหรับตัวอย่างที่กำหนดบางองศาของเสรีภาพ ) ในขณะที่ในกรณีของ -tests, สถิติการทดสอบเดียวกันดังต่อไปนี้การกระจายมาตรฐานปกติ1) (นี่เป็นการชี้ให้เห็นว่าการเลือกของ -test หรือ -test นั้นควบคุมโดยตัวอย่างที่มีขนาดใหญ่พอหรือไม่)t d z N ( 0 , 1 ) z tttttttdddZZzยังไม่มีข้อความ( 0 , 1 )ยังไม่มีข้อความ(0,1)\mathcal{N}(0, 1)ZZzเสื้อเสื้อt ถูกต้องหรือไม่

1
ฉันสามารถใช้การทดสอบแบบจับคู่เมื่อตัวอย่างแจกตามปกติ แต่ความแตกต่างไม่ได้หรือไม่
ฉันมีข้อมูลจากการทดลองที่ฉันใช้การรักษาสองแบบที่แตกต่างกันในสภาพเริ่มต้นที่เหมือนกันโดยจะสร้างจำนวนเต็มตั้งแต่ 0 ถึง 500 ในแต่ละกรณีเป็นผลลัพธ์ ฉันต้องการใช้การทดสอบแบบจับคู่เพื่อระบุว่าผลที่เกิดจากการรักษาทั้งสองนั้นแตกต่างกันอย่างมีนัยสำคัญหรือไม่ ผลลัพธ์ของแต่ละกลุ่มการรักษาจะกระจายตามปกติ แต่ความแตกต่างระหว่างแต่ละคู่จะไม่ได้รับการแจกแจงตามปกติ (ไม่สมมาตร + หางยาวหนึ่งอัน) ฉันสามารถใช้การทดสอบแบบจับคู่ในกรณีนี้ได้หรือไม่หรือมีการสันนิษฐานว่าละเมิดกฎเกณฑ์ซึ่งหมายความว่าฉันควรใช้การทดสอบแบบไม่อิงพารามิเตอร์ในบางประเภทหรือไม่?

2
จำนวนการสังเกตขั้นต่ำสำหรับการถดถอยเชิงเส้นหลายครั้ง
ฉันกำลังถดถอยเชิงเส้นหลายเส้น ฉันมีการสังเกตการณ์ 21 ครั้งและตัวแปร 5 ตัว เป้าหมายของฉันคือการค้นหาความสัมพันธ์ระหว่างตัวแปร มีข้อมูลของฉันเพียงพอหรือไม่ที่จะทำการถดถอยหลายครั้ง? ผลการทดสอบทีเผยว่าตัวแปร 3 ตัวของฉันไม่มีนัยสำคัญ ฉันจำเป็นต้องทำการถดถอยอีกครั้งด้วยตัวแปรที่สำคัญ (หรือการถดถอยครั้งแรกของฉันเพียงพอที่จะได้ข้อสรุป) เมทริกซ์ความสัมพันธ์ของฉันมีดังนี้ var 1 var 2 var 3 var 4 var 5 Y var 1 1.0 0.0 0.0 -0.1 -0.3 -0.2 var 2 0.0 1.0 0.4 0.3 -0.4 -0.4 var 3 0.0 0.4 1.0 0.7 -0.7 -0.6 var …

2
เป็นความผิดหรือไม่ที่จะใช้ ANOVA แทนที่จะใช้ t-test เพื่อเปรียบเทียบสองวิธี?
ฉันมีการกระจายเงินเดือนและฉันต้องการเปรียบเทียบความแตกต่างของค่าเฉลี่ยสำหรับชายและหญิง ฉันรู้ว่ามีนักเรียน T-test สำหรับเปรียบเทียบสองวิธี แต่หลังจากแนะนำ ANOVA ฉันได้รับการวิจารณ์ว่า ANOVA นั้นสำหรับเปรียบเทียบมากกว่าสองวิธี มีอะไรผิดพลาดในการใช้มันเพื่อเปรียบเทียบเพียง 2 หมายความว่าอย่างไร

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.