คำถามติดแท็ก t-test

การทดสอบเพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างสองตัวอย่างหรือค่าเฉลี่ยของตัวอย่างหนึ่งค่า (หรือค่าพารามิเตอร์ประมาณ) กับค่าที่ระบุ หรือที่เรียกว่า "การทดสอบนักเรียน t" หลังจากนามแฝงของนักประดิษฐ์

4
t-test ที่แข็งแกร่งสำหรับค่าเฉลี่ย
ฉันกำลังพยายามทดสอบ nullเทียบกับทางเลือกทางเลือกสำหรับตัวแปรสุ่มซึ่งมีระดับความเบ้เล็กน้อยถึงปานกลางและความผิดปกติของตัวแปรสุ่ม ตามคำแนะนำของวิลคอกซ์ใน 'การแนะนำเบื้องต้นเกี่ยวกับการประมาณค่าที่ทนทานและการทดสอบสมมติฐาน' ฉันได้ดูการทดสอบตามค่าเฉลี่ยที่ถูกตัดค่ามัธยฐานและค่าประมาณ M ของสถานที่ตั้ง (ขั้นตอนเดียว "วิลค็อกซ์") การทดสอบที่มีประสิทธิภาพเหล่านี้มีประสิทธิภาพเหนือกว่ามาตรฐาน t-test ในแง่ของพลังเมื่อทดสอบกับการกระจายที่ไม่เบ้E[X]=0E[X]=0E[X] = 0E[X]>0E[X]>0E[X] > 0XXX อย่างไรก็ตามเมื่อทำการทดสอบด้วยการแจกแจงแบบเบ้การทดสอบด้านเดียวเหล่านี้มีความเสรีมากเกินไปหรือมากเกินไปที่จะอนุรักษ์ภายใต้สมมติฐานว่างขึ้นอยู่กับว่าการแจกแจงนั้นเอียงไปทางซ้ายหรือขวาเอียงตามลำดับ ตัวอย่างเช่นเมื่อมีการสังเกต 1,000 ครั้งการทดสอบตามค่ามัธยฐานจะปฏิเสธจริง ~ 40% ของเวลาที่ระดับ 5% เล็กน้อย เหตุผลนี้ชัดเจนสำหรับการแจกแจงแบบเบ้ค่ามัธยฐานและค่าเฉลี่ยต่างกัน อย่างไรก็ตามในใบสมัครของฉันฉันต้องทดสอบค่าเฉลี่ยไม่ใช่ค่ามัธยฐานไม่ใช่ค่าเฉลี่ยที่ถูกตัดทอน t-test เวอร์ชันที่แข็งแกร่งกว่านี้จริง ๆ แล้วทำการทดสอบหาค่าเฉลี่ยหรือไม่ โดยหลักการแล้วกระบวนการนี้จะทำงานได้ดีในกรณีที่ไม่มีการเอียงและมีความรุนแรงสูงเช่นกัน การทดสอบ 'ขั้นตอนเดียว' เกือบจะดีพอโดยที่พารามิเตอร์ 'bend' ตั้งค่าค่อนข้างสูง แต่มีประสิทธิภาพน้อยกว่าการทดสอบค่าเฉลี่ยที่ถูกตัดเมื่อไม่มีความลาดเอียงและมีปัญหาบางอย่างในการรักษาระดับการปฏิเสธภายใต้ความเบ้ . พื้นหลัง:เหตุผลที่ฉันสนใจค่าเฉลี่ยและไม่ใช่ค่ามัธยฐานคือการทดสอบจะถูกใช้ในการสมัครทางการเงิน ตัวอย่างเช่นหากคุณต้องการทดสอบว่าพอร์ตโฟลิโอมีผลตอบแทนที่คาดหวังในเชิงบวกหรือไม่ค่าเฉลี่ยนั้นเหมาะสมจริง ๆ เพราะถ้าคุณลงทุนในพอร์ตโฟลิโอคุณจะได้รับผลตอบแทนทั้งหมด (ซึ่งเป็นค่าเฉลี่ยคูณด้วยจำนวนตัวอย่าง) แทนซ้ำกันของค่ามัธยฐาน นั่นคือผมสนใจเกี่ยวกับผลรวมของดึงจาก RV XnnnnnnXXX

2
ทำความเข้าใจเกี่ยวกับการทดสอบ t สำหรับการถดถอยเชิงเส้น
ฉันกำลังพยายามหาวิธีการทดสอบสมมติฐานบางอย่างเกี่ยวกับการถดถอยเชิงเส้น (สมมติฐานว่างไม่มีความสัมพันธ์) ทุกคำแนะนำและหน้าในเรื่องที่ฉันพบดูเหมือนจะใช้การทดสอบ t แต่ฉันไม่เข้าใจความหมายของการทดสอบการถดถอยเชิงเส้น การทดสอบแบบทียกเว้นว่าฉันมีความเข้าใจผิดอย่างสมบูรณ์หรือแบบจำลองทางจิตถูกใช้เพื่อเปรียบเทียบประชากรสองคน แต่ regressor และ regressand ไม่ใช่ตัวอย่างของประชากรที่คล้ายกันและอาจไม่ได้เป็นหน่วยเดียวกันดังนั้นจึงไม่มีเหตุผลที่จะเปรียบเทียบมัน ดังนั้นเมื่อใช้ t-test ในการถดถอยเชิงเส้นสิ่งที่เราทำจริง ๆ ?

3
การถดถอยโลจิสติกหรือการทดสอบ T?
กลุ่มบุคคลตอบคำถามหนึ่งข้อ คำตอบอาจเป็น "ใช่" หรือ "ไม่" ผู้วิจัยต้องการทราบว่าอายุนั้นเกี่ยวข้องกับประเภทของคำตอบหรือไม่ ความสัมพันธ์ถูกประเมินโดยทำการถดถอยโลจิสติกโดยอายุเป็นตัวแปรอธิบายและประเภทของคำตอบ (ใช่ไม่ใช่) เป็นตัวแปรตาม มันถูกแยกจากกันโดยการคำนวณอายุเฉลี่ยของกลุ่มที่ตอบว่า "ใช่" และ "ไม่" ตามลำดับและทำการทดสอบTเพื่อเปรียบเทียบค่าเฉลี่ย การทดสอบทั้งสองดำเนินการตามคำแนะนำของบุคคลที่แตกต่างกันและไม่มีการทดสอบใดที่แน่นอนว่าเป็นวิธีที่เหมาะสม ในมุมมองของคำถามการวิจัยซึ่งจะเป็นการทดสอบที่ดีกว่า สำหรับการทดสอบสมมติฐานค่า p ไม่มีนัยสำคัญ (การถดถอย) และนัยสำคัญ (การทดสอบ T) ตัวอย่างน้อยกว่า 20 ราย

8
ขนาดตัวอย่างขั้นต่ำสำหรับการทดสอบทีไม่มีคู่
มี "กฎ" เพื่อกำหนดขนาดตัวอย่างขั้นต่ำที่จำเป็นสำหรับการทดสอบ t- ถูกต้องหรือไม่ ตัวอย่างเช่นการเปรียบเทียบจะต้องดำเนินการระหว่างค่าเฉลี่ยของ 2 ประชากร มี 7 จุดข้อมูลจากประชากรหนึ่งและเพียง 2 จุดข้อมูลจากที่อื่น น่าเสียดายที่การทดสอบมีราคาแพงมากและใช้เวลานานและการได้รับข้อมูลเพิ่มเติมนั้นไม่สามารถทำได้ สามารถใช้การทดสอบ t ได้ไหม? ทำไมหรือทำไมไม่? โปรดระบุรายละเอียด (ไม่ทราบความแปรปรวนของประชากรและการกระจาย) หากไม่สามารถใช้การทดสอบ t ได้จะสามารถใช้การทดสอบแบบไม่มีพารามิเตอร์ (Mann Whitney) ได้หรือไม่? ทำไมหรือทำไมไม่?

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
ฉันควรใช้ t-test กับข้อมูลที่มีการบิดเบือนสูงหรือไม่ ขอหลักฐานทางวิทยาศาสตร์
ฉันมีตัวอย่างจากชุดข้อมูลที่มีการบิดเบือนสูง (ดูคล้ายการแจกแจงแบบเอ็กซ์โปเนนเชียล) เกี่ยวกับการมีส่วนร่วมของผู้ใช้ (เช่น: จำนวนโพสต์) ที่มีขนาดต่างกัน (แต่ไม่น้อยกว่า 200) และฉันต้องการเปรียบเทียบค่าเฉลี่ย สำหรับสิ่งนั้นฉันใช้การทดสอบ t สองแบบที่ไม่มีการจับคู่ (และการทดสอบ t กับปัจจัยของ Welch เมื่อตัวอย่างมีความแปรปรวนต่างกัน) อย่างที่ฉันได้ยินมาว่าสำหรับกลุ่มตัวอย่างที่มีขนาดใหญ่จริง ๆ มันไม่สำคัญว่ากลุ่มตัวอย่างจะไม่แจกแจงแบบปกติ มีคนกำลังตรวจสอบสิ่งที่ฉันทำบอกว่าการทดสอบที่ฉันใช้ไม่เหมาะกับข้อมูลของฉัน พวกเขาแนะนำให้บันทึกการแปลงตัวอย่างของฉันก่อนใช้การทดสอบ t ฉันเป็นผู้เริ่มต้นดังนั้นฉันจึงสับสนในการตอบคำถามการวิจัยของฉันด้วย "บันทึกการเข้าร่วมการวัด" พวกเขาผิดหรือเปล่า? ฉันผิดหรือเปล่า? หากพวกเขาคิดผิดมีหนังสือหรือเอกสารทางวิทยาศาสตร์ที่ฉันสามารถอ้างอิง / แสดงได้หรือไม่? หากฉันผิดฉันควรใช้การทดสอบแบบใด

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

1
มีข้อแตกต่างระหว่างคำว่า“ paired t-test” และ“ pairwise t-test” หรือไม่?
การทดสอบจับคู่แบบคู่คืออะไรและภายใต้สถานการณ์ใดที่ฉันควรใช้การทดสอบแบบจับคู่ มีความแตกต่างระหว่าง paired t-test และ pairwise t-test หรือไม่

2
คำอธิบายสำหรับองศาอิสระที่ไม่ใช่จำนวนเต็มในการทดสอบ t กับผลต่างที่ไม่เท่ากัน
ขั้นตอนการทดสอบ SPSS รายงานการวิเคราะห์ 2 เมื่อเปรียบเทียบวิธีอิสระ 2 วิธีการวิเคราะห์หนึ่งที่มีความแปรปรวนเท่ากันและหนึ่งที่มีผลต่างไม่เท่ากัน องศาอิสระ (df) เมื่อถือว่าผลต่างเท่ากันนั้นถือเป็นค่าจำนวนเต็มเสมอ (และเท่ากับ n-2) df เมื่อความแปรปรวนที่เท่ากันจะไม่ถือว่าไม่ใช่จำนวนเต็ม (เช่น 11.467) และไม่มีที่ไหนใกล้ n-2 ฉันกำลังหาคำอธิบายเกี่ยวกับตรรกะและวิธีการที่ใช้ในการคำนวณ df ที่ไม่ใช่จำนวนเต็มเหล่านี้

2
รายงานองศาอิสระสำหรับ Welch t-test
เวลช์ t-test การแปรปรวนไม่เท่ากัน (หรือเรียกว่าเวลช์-Satterthwaite หรือเวลช์-Aspin) โดยทั่วไปมีองศาที่ไม่ใช่จำนวนเต็มของเสรีภาพ องศาความอิสระเหล่านี้จะถูกอ้างเมื่อรายงานผลการทดสอบได้อย่างไร? "มันเป็นเรื่องธรรมดาที่จะปัดเศษให้เป็นจำนวนเต็มที่ใกล้ที่สุดก่อนที่จะปรึกษาตารางมาตรฐาน t" ตามแหล่งต่าง ๆ * - ซึ่งสมเหตุสมผลตามทิศทางของการปัดเศษนี้เป็นแบบอนุรักษ์นิยม ** ซอฟต์แวร์ทางสถิติที่เก่ากว่าจะทำเช่นนี้เช่นกัน 6 ) และบางเครื่องคิดเลขออนไลน์ยังคงทำ หากมีการใช้ขั้นตอนนี้การรายงานระดับความอิสระที่โค้งมนจะเหมาะสม (แม้ว่าการใช้ซอฟต์แวร์ที่ดีกว่านั้นอาจเหมาะสมกว่า!) แต่แพ็คเกจที่ทันสมัยส่วนใหญ่ใช้ประโยชน์จากส่วนที่เป็นเศษส่วนดังนั้นในกรณีนี้ดูเหมือนว่าควรจะอ้างถึงส่วนที่เป็นเศษส่วน ฉันไม่เห็นว่าการอ้างถึงทศนิยมมากกว่าสองตำแหน่งนั้นเหมาะสมหรือไม่เนื่องจากการมีอิสระในระดับหนึ่งพันครั้งจะส่งผลกระทบเพียงเล็กน้อยต่อค่าp เมื่อมองไปรอบ ๆ Google scholar ฉันสามารถดูเอกสารที่อ้างถึง df เป็นจำนวนเต็มทศนิยมหนึ่งตำแหน่งหรือทศนิยมสองตำแหน่ง มีแนวทางใดบ้างเกี่ยวกับความแม่นยำในการใช้งาน? นอกจากนี้หากซอฟต์แวร์ใช้ส่วนที่เป็นเศษส่วนแบบเต็มควร df ที่ยกมาจะถูกปัดเศษลงตามจำนวนตัวเลขที่ต้องการ (เช่นถึง 1 dp หรือ→ 7เป็นจำนวนทั้งหมด) ตามความเหมาะสมกับการคำนวณแบบอนุรักษ์นิยม หรือตามที่ฉันคิดว่าเหมาะสมกว่าฉันปัดเศษตามอัตภาพ ( ใกล้ที่สุด ) ดังนั้น7.5845 ... → 7.6ถึง 1 dp …

1
Kolmogorov – Smirnov test กับ t-test
ฉันมีความยากลำบากในการเข้าใจการตีความของการทดสอบ KS ตัวอย่าง 2 ตัวและมันแตกต่างจากการทดสอบแบบปกติระหว่าง 2 กลุ่ม ให้บอกว่าฉันมีชายและหญิงทำงานบางอย่างและฉันรวบรวมคะแนนจากงานนั้น เป้าหมายสูงสุดของฉันคือการพิจารณาว่าเพศชายและเพศหญิงปฏิบัติงานต่างกันหรือไม่ สิ่งหนึ่งที่ฉันทำได้คือทดสอบระหว่าง 2 กลุ่ม อีกสิ่งหนึ่งที่ฉันทำได้คือคำนวณ ECDF สำหรับชายและหญิงพล็อตและทำการทดสอบ KS 2 ตัวอย่าง ฉันจะได้รับสิ่งนี้: การทดสอบ KS สมมติฐานว่างสำหรับการทดสอบ KS คือการแจกแจงคะแนนต่อเนื่อง 2 ชุดมาจากประชากรเดียวกัน เมื่อทำการทดสอบ KS ฉันได้รับ: D = 0.18888, p-value = 0.04742 ก่อนอื่นฉันต้องการตรวจสอบว่าการตีความผลลัพธ์ของฉันถูกต้อง ที่นี่ฉันจะปฏิเสธสมมติฐานว่างและบอกว่าการแจกแจงคะแนนชายและหญิงมาจากประชากรที่แตกต่างกัน หรือกล่าวอีกนัยหนึ่งการกระจายของคะแนนชายและหญิงนั้นแตกต่างกัน โดยเฉพาะอย่างยิ่งเพศชายมักจะมีโอกาสสูงที่จะได้คะแนนต่ำกว่าในงานนี้และนั่นคือความแตกต่างระหว่าง 2 เพศที่ฉันตีความจากเนื้อเรื่อง t-test ตอนนี้ที่การทดสอบจะทดสอบความแตกต่างระหว่างชายและหญิงหมายถึงตัวแปรคะแนน ให้จินตนาการถึงกรณีที่การแสดงของผู้ชายนั้นแย่กว่าผู้หญิงในงานนี้ ในกรณีดังกล่าวการกระจายของคะแนนชายจะมุ่งไปที่ค่าเฉลี่ยต่ำในขณะที่การแจกแจงคะแนนหญิงจะอยู่กึ่งกลางค่าเฉลี่ยสูง สถานการณ์นี้จะสอดคล้องกับพล็อตด้านบนเนื่องจากผู้ชายจะมีโอกาสสูงที่จะได้รับคะแนนต่ำกว่า หากการทดสอบเสื้อยืดออกมามีนัยสำคัญฉันจะสรุปได้ว่าคะแนนผู้หญิงโดยเฉลี่ยสูงกว่าเพศชายอย่างมีนัยสำคัญ หรือในแง่ของประชากรคะแนนหญิงมาจากประชากรที่มีค่าเฉลี่ยสูงกว่าประชากรชายซึ่งฟังดูคล้ายกับข้อสรุปของแคนซัสว่ามาจากประชากรที่แตกต่างกัน ความแตกต่างคืออะไร? ดังนั้นข้อสรุปฉันจะวาดทั้งใน …

3
เมื่อทำ t-test สำหรับความสำคัญของค่าสัมประสิทธิ์การถดถอยทำไมเป็นจำนวนองศาของเสรีภาพ
ฉันอ่านที่นี่ว่าคือจำนวนองศาอิสระที่ฉันควรใช้เมื่อทำการทดสอบ t สำหรับความสำคัญของสัมประสิทธิ์การถดถอย แต่ฉันไม่เข้าใจว่าทำไม ความเข้าใจของฉันคือการทดสอบแบบ t โดยทั่วไปแล้วจะมีอิสระในระดับn - 1องศาn−p−1n−p−1n-p-1n−1n−1n-1

2
ตัวอย่างอิสระ t-test: จริง ๆ แล้วข้อมูลจำเป็นต้องแจกให้กับกลุ่มตัวอย่างขนาดใหญ่หรือไม่
สมมุติว่าฉันต้องการทดสอบว่าตัวอย่างอิสระสองตัวอย่างมีค่าเฉลี่ยต่างกันหรือไม่ ฉันรู้ว่าการกระจายพื้นฐานคือไม่ปกติ ถ้าฉันเข้าใจถูกต้องสถิติทดสอบของฉันคือค่าเฉลี่ยและสำหรับขนาดตัวอย่างที่มีขนาดใหญ่พอค่าเฉลี่ยควรกระจายตามปกติแม้ว่าตัวอย่างจะไม่ได้ การทดสอบความสำคัญเชิงพารามิเตอร์ควรจะใช้ได้ในกรณีนี้ใช่ไหม ฉันได้อ่านข้อมูลที่ขัดแย้งและสับสนเกี่ยวกับเรื่องนี้ดังนั้นฉันขอขอบคุณการยืนยัน (หรือคำอธิบายว่าทำไมฉันถึงผิด) นอกจากนี้ฉันได้อ่านแล้วว่าสำหรับกลุ่มตัวอย่างที่มีขนาดใหญ่ฉันควรใช้ค่าสถิติ z แทนค่าสถิติ แต่ในทางปฏิบัติการแจกแจงแบบ t จะมาบรรจบกับการแจกแจงแบบปกติและสถิติทั้งสองควรเหมือนกันไม่ใช่หรือ? แก้ไข : ด้านล่างนี้เป็นแหล่งข้อมูลที่อธิบายการทดสอบ z พวกเขาทั้งสองระบุว่าประชากรจะต้องกระจายตามปกติ: ที่นี่มันบอกว่า "โดยไม่คำนึงถึงประเภทของการทดสอบ Z- ใช้มันสันนิษฐานว่าประชากรจากตัวอย่างที่วาดเป็นเรื่องปกติ" และที่นี่ข้อกำหนดสำหรับการทดสอบ z ถูกแสดงรายการเป็น "การกระจายสองแบบปกติ แต่เป็นประชากรอิสระσเป็นที่รู้จัก"

1
เท่าไหร่ขนาดเล็กสามารถ
อินโทร:หลังจากที่สังเกตเห็นความสนใจที่ได้รับในวันนี้จากคำถามนี้ " ANOVA จะมีความสำคัญหรือไม่หากไม่มีการทดสอบแบบ pairwise t? " ฉันคิดว่าฉันอาจสามารถ reframe ในวิธีที่น่าสนใจซึ่งสมควรได้รับคำตอบของตัวเอง . ความหลากหลายของผลไม่ลงรอยกัน (มูลค่าที่ตรา) สามารถเกิดขึ้นเมื่อนัยสำคัญทางสถิติเป็นที่เข้าใจกันว่าเป็นขั้วที่เรียบง่ายและตัดสินบนพื้นฐานเพียงของซึ่งเป็นสูงกว่าpppหรือααα\alpha@ Glen_b คำตอบสำหรับคำถามข้างต้นแสดงตัวอย่างที่มีประโยชน์ของกรณีที่: ANOVA FFFทดสอบสร้างpF&lt;.05pF&lt;.05p_F<.05สำหรับหนึ่งตัวแปรอิสระ (IV) กับสี่ระดับ แต่ pt&gt;.08pt&gt;.08p_t>.08สำหรับทุกสองตัวอย่างttt -tests ที่เปรียบเทียบความแตกต่างในตัวแปรเดียวกัน (DV) ในหมู่สังเกตสอดคล้องกับคู่ของ IV สี่แต่ละระดับ กรณีที่คล้ายกันเกิดขึ้นแม้จะมีการแก้ไข Bonferroni สำหรับการเปรียบเทียบแบบคู่หลังด้วยคำถามนี้: การวัดซ้ำของ Anova มีความสำคัญ แต่การเปรียบเทียบหลาย ๆ ครั้งกับการแก้ไข Bonferroni ไม่ได้เป็นเช่นนั้นหรือ? กรณีที่กล่าวถึงก่อนหน้านี้ที่มีการทดสอบแตกต่างกันเล็กน้อยในการถดถอยหลายครั้งก็มีอยู่: ทำไมจึงเป็นไปได้ที่จะได้รับสถิติ F อย่างมีนัยสำคัญ (p &lt;.001) แต่การทดสอบ t regressor ไม่สำคัญ? : …


โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.