คำถามติดแท็ก t-test

การทดสอบเพื่อเปรียบเทียบค่าเฉลี่ยของตัวอย่างสองตัวอย่างหรือค่าเฉลี่ยของตัวอย่างหนึ่งค่า (หรือค่าพารามิเตอร์ประมาณ) กับค่าที่ระบุ หรือที่เรียกว่า "การทดสอบนักเรียน t" หลังจากนามแฝงของนักประดิษฐ์

3
วิธีรับช่วงความมั่นใจในการเปลี่ยนแปลงประชากร r-square
ตัวอย่างง่ายๆสมมติว่ามีตัวแบบถดถอยเชิงเส้นสองแบบ รุ่นที่ 1 มีสามทำนาย, x1a, x2bและx2c แบบจำลอง 2 มีตัวทำนายสามตัวจากแบบจำลอง 1 และสองตัวทำนายเพิ่มเติมx2aและx2b มีสมการถดถอยที่ประชากรประชากรแปรปรวนอธิบายคือเป็น สำหรับรุ่นที่ 1 และρ 2 ( 2 )สำหรับรุ่น 2. แปรปรวนเพิ่มขึ้นอธิบายโดยรุ่น 2 ในประชากรที่อยู่Δ ρ 2 = ρ 2 ( 2 ) - ρ 2 ( 1 )ρ2(1)ρ(1)2\rho^2_{(1)}ρ2(2)ρ(2)2\rho^2_{(2)}Δρ2=ρ2(2)−ρ2(1)Δρ2=ρ(2)2−ρ(1)2\Delta\rho^2 = \rho^2_{(2)} - \rho^2_{(1)} ฉันสนใจในการได้รับข้อผิดพลาดมาตรฐานและช่วงความเชื่อมั่นสำหรับประมาณการของ 2 ในขณะที่ตัวอย่างเกี่ยวข้องกับตัวทำนาย 3 และ 2 ตามลำดับความสนใจงานวิจัยของฉันเกี่ยวข้องกับตัวทำนายจำนวนต่าง ๆ (เช่น …

1
การทดสอบการเปลี่ยนรูปเป็นการเปรียบเทียบตัวอย่างเดี่ยวกับค่าเฉลี่ย
เมื่อผู้คนทำการทดสอบการเปลี่ยนรูปเพื่อเปรียบเทียบตัวอย่างเดียวกับค่าเฉลี่ย (เช่นคุณอาจทำกับการทดสอบการเปลี่ยนรูป) วิธีการจัดการค่าเฉลี่ยเป็นอย่างไร ฉันได้เห็นการใช้งานที่ใช้ค่าเฉลี่ยและตัวอย่างสำหรับการทดสอบการเปลี่ยนรูป แต่ก็ไม่มีความชัดเจนในสิ่งที่พวกเขากำลังทำจริงภายใต้ประทุน มีวิธีที่มีความหมายในการทำแบบทดสอบการเปลี่ยนรูป (เช่น t-test) สำหรับตัวอย่างหนึ่งกับค่าเฉลี่ยที่สมมติหรือไม่? หรือมิฉะนั้นพวกเขาเพียงแค่เริ่มต้นการทดสอบที่ไม่ใช่การเปลี่ยนแปลงภายใต้ประทุน? (เช่นแม้จะเรียกใช้ฟังก์ชันการเรียงสับเปลี่ยนหรือตั้งค่าสถานะทดสอบการเปลี่ยนรูปแบบ แต่การเริ่มต้นเป็นมาตรฐาน t-test หรือฟังก์ชั่นที่คล้ายกัน) ในการทดสอบการเปลี่ยนรูปสองตัวอย่างมาตรฐานหนึ่งกลุ่มจะมีสองกลุ่มและสุ่มการกำหนดป้ายกำกับ อย่างไรก็ตามสิ่งนี้จัดการได้อย่างไรเมื่อ "กลุ่ม" หนึ่งมีค่าเฉลี่ยที่สันนิษฐาน เห็นได้ชัดว่าค่าเฉลี่ยที่สันนิษฐานนั้นไม่มีขนาดตัวอย่างในตัวมันเอง ดังนั้นวิธีทั่วไปในการทำงานค่าเฉลี่ยในรูปแบบการเปลี่ยนแปลงคืออะไร? ตัวอย่าง "หมายถึง" ถือว่าเป็นจุดเดียวหรือไม่? กลุ่มตัวอย่างมีขนาดเท่ากันหรือไม่ ตัวอย่างขนาดไม่ จำกัด ? เนื่องจากค่าเฉลี่ยที่สันนิษฐานไว้คือสมมุติว่า - ฉันบอกว่าในทางเทคนิคจะมีการสนับสนุนที่ไม่มีที่สิ้นสุดหรือการสนับสนุนใดก็ตามที่คุณต้องการสมมติ อย่างไรก็ตามสิ่งเหล่านี้ไม่เป็นประโยชน์อย่างมากสำหรับการคำนวณจริง ตัวอย่างขนาดเท่ากันที่มีค่าทั้งหมดเท่ากับค่าเฉลี่ยดูเหมือนจะเป็นสิ่งที่ทำในบางครั้งด้วยการทดสอบบางอย่าง (เช่นคุณเพียงแค่เติมอีกครึ่งหนึ่งของคู่ด้วยตำแหน่งที่สมมติ) มันสมเหตุสมผลดีเนื่องจากเป็นตัวอย่างที่มีความยาวเท่ากันคุณจะเห็นว่าค่าเฉลี่ยที่คุณสันนิษฐานนั้นถูกต้องโดยไม่มีความแปรปรวนหรือไม่ ดังนั้นคำถามของฉันคือ: ในทางปฏิบัติจริง ๆ แล้วผู้คนเลียนแบบการสุ่มเปลี่ยนรูปแบบป้ายกำกับการทดสอบเมื่อชุดที่สองเป็นค่าเฉลี่ย ถ้าเป็นเช่นนั้นผู้คนจะจัดการกับการสุ่มป้ายกำกับเมื่อพวกเขาทำเช่นนี้ได้อย่างไร

2
ค่าเดียวนี้ตรงกับการแจกแจงนั้นหรือไม่
นี่รู้สึกเหมือนเป็นคำถามที่ไร้เดียงสา แต่ฉันมีปัญหาในการดูคำตอบ ฉันมี 30 ชุดหนึ่งค่า ฉันได้รับค่าที่ 31 อย่างอิสระ สมมติฐานที่ว่างเปล่าคือค่าที่ 31 เป็นส่วนหนึ่งของการแจกแจงแบบเดียวกัน ทางเลือกคือมันแตกต่างกัน ฉันต้องการค่า p หรือค่าความน่าจะเป็นบางประเภท ฉันมีความคิดบางอย่าง: นี่คล้ายกับต้องการทำแบบทดสอบสองตัวอย่าง - ยกเว้นว่าสำหรับตัวอย่างที่สองฉันมีเพียงค่าเดียวและค่า 30 ค่าไม่จำเป็นต้องกระจายแบบปกติ หากแทนการวัด 30 รายการฉันมีการวัด 10,000 ตำแหน่งอันดับของการวัดเดี่ยวสามารถให้ข้อมูลที่เป็นประโยชน์ได้ ฉันจะคำนวณความน่าจะเป็นหรือค่า p นี้ได้อย่างไร ขอบคุณ! Yannick

4
รูปแบบประวัติเหตุการณ์แบบไม่ต่อเนื่อง (การอยู่รอด) ใน R
ฉันกำลังพยายามปรับโมเดลที่ไม่ต่อเนื่องใน R แต่ฉันไม่แน่ใจว่าจะทำอย่างไร ฉันได้อ่านแล้วว่าคุณสามารถจัดระเบียบตัวแปรตามในแถวต่างกันหนึ่งตัวสำหรับแต่ละการสังเกตเวลาและการใช้glmฟังก์ชั่นที่มีลิงค์ logit หรือ cloglog ในแง่นี้ฉันมีสามคอลัมน์: ID, Event(1 หรือ 0 ในแต่ละช่วงเวลา) และTime Elapsed(ตั้งแต่จุดเริ่มต้นของการสังเกต) รวมทั้ง covariates อื่น ๆ ฉันจะเขียนรหัสเพื่อให้พอดีกับรุ่นได้อย่างไร ตัวแปรตามคืออะไร ฉันเดาว่าฉันสามารถใช้Eventเป็นตัวแปรตามและรวมTime Elapsedอยู่ใน covariates แต่สิ่งที่เกิดขึ้นกับID? ฉันต้องการมันไหม ขอบคุณ
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

2
ขนาดตัวอย่างที่เล็กและไม่สมดุลสำหรับสองกลุ่ม - จะทำอย่างไร?
ฉันมีข้อมูลสำหรับสองกลุ่ม (ตัวอย่างเช่น) ฉันต้องการเปรียบเทียบ แต่ขนาดตัวอย่างทั้งหมดมีขนาดเล็ก (n = 29) และไม่สมดุลอย่างยิ่ง (n = 22 vs n = 7) ข้อมูลเหล่านี้ยากต่อการรวบรวมและมีราคาแพงดังนั้นในขณะที่ 'รวบรวมข้อมูลเพิ่มเติม' เนื่องจากวิธีการแก้ปัญหาที่ชัดเจนนั้นไม่มีประโยชน์ในกรณีนี้ มีการวัดตัวแปรที่แตกต่างกันจำนวนหนึ่ง (วันที่ออกเดินทางวันที่เดินทางมาถึงระยะเวลาของการย้ายถิ่นเป็นต้น) ดังนั้นจึงมีการทดสอบหลายรายการซึ่งบางส่วนของผลต่างนั้นแตกต่างกันมาก (ตัวอย่างขนาดเล็กที่มีความแปรปรวนสูงกว่า) ในขั้นต้นเพื่อนร่วมงานได้ทำการทดสอบแบบ t บนข้อมูลเหล่านี้และบางรายการมีนัยสำคัญทางสถิติกับ P <0.001 และอีกอันไม่สำคัญกับ P = 0.069 ตัวอย่างบางส่วนถูกแจกจ่ายตามปกติ แต่บางกลุ่มก็ไม่ได้ การทดสอบบางอย่างเกี่ยวข้องกับการออกเดินทางครั้งใหญ่จากความแปรปรวน 'เท่ากัน' ฉันมีคำถามหลายข้อ: การทดสอบ t เหมาะสมที่นี่ ถ้าไม่ทำไม สิ่งนี้ใช้เฉพาะกับการทดสอบที่สมมติฐานของความปกติและความเสมอภาคของผลต่างมีความพึงพอใจหรือไม่ ทางเลือกที่เหมาะสมคืออะไร บางทีการทดสอบการเปลี่ยนรูป? ความแปรปรวนไม่เท่ากันทำให้เกิดข้อผิดพลาด Type I ได้อย่างไร แต่อย่างไร และขนาดตัวอย่างที่เล็กและไม่สมดุลนั้นมีผลกระทบอย่างไรกับข้อผิดพลาด Type …

2
เป็นองศาอิสระทำไมหาคู่จับคู่ -test จำนวนคู่ลบ 1 หรือไม่
ฉันเคยรู้จัก "องศาอิสระ" ในฐานะซึ่งคุณมีโมเดลเชิงเส้น\ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} พร้อม\ mathbf {y } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R})เมทริกซ์การออกแบบพร้อมอันดับr , \ boldsymbol {\ beta} \ in …

1
คำถามเกี่ยวกับสมมติฐานทั่วไปของ t-test
สำหรับการทดสอบ t ตามข้อความส่วนใหญ่มีข้อสันนิษฐานว่าโดยทั่วไปข้อมูลประชากรจะถูกกระจายออกไป ฉันไม่เห็นว่าทำไม t-test ไม่เพียงต้องการให้การกระจายตัวตัวอย่างของค่าเฉลี่ยตัวอย่างแจกจ่ายตามปกติไม่ใช่ประชากรใช่หรือไม่ หากเป็นกรณีที่การทดสอบ t ในที่สุดต้องการความเป็นมาตรฐานในการแจกแจงตัวอย่างประชากรก็จะมีลักษณะเหมือนการกระจายตัวใช่ไหม? ตราบใดที่มีขนาดตัวอย่างที่เหมาะสม นั่นไม่ใช่ทฤษฎีบทขีด จำกัด กลางหรือไม่? (ฉันหมายถึงที่นี่เพื่อทดสอบตัวอย่างหนึ่งตัวอย่างหรือเป็นอิสระ)

1
ผลงานของนักเรียน (Gosset) ในการกำหนดแบบทดสอบ t-test คืออะไร?
คำถามล่าสุด , คำถามที่เกี่ยวข้องและแหล่งที่มาอ้างว่าทำเมื่อเร็ว ๆ นี้ผมทราบว่ายังไม่มีข้อความ- 1N−1N-1การแก้ไขสำหรับการประมาณการตัวอย่างความแปรปรวนของประชากรจะเรียกว่าการแก้ไขของ Bessel เบสเซิลเสียชีวิตในปี 1846 ( การอ้างอิงวิกิพีเดีย ) และการทดสอบ t ถูกตีพิมพ์ในปี 1908 ( การอ้างอิงวิกิพีเดีย ) ด้วยเหตุผลบางอย่างฉันคิดเสมอว่าการมีส่วนร่วมของ Gosset (หรือที่รู้จักว่านักเรียน) ในการกำหนด t-test คือการใช้ยังไม่มีข้อความ- 1N−1N-1 ในการคำนวณ s2s2s^2. ดูเหมือนว่าการมีส่วนร่วมนี้จะเป็นของ Bessel อย่างชัดเจน ในหลอดเลือดดำนี้ฉันถามว่าอะไรคือผลงานของ Gosset ในการจัดทำแบบทดสอบ

4
เหตุใดจึงต้องมีการทดสอบแบบ t เนื่องจากเรามีการทดสอบ z
ใครสามารถให้คำอธิบายว่าทำไมการทดสอบแบบทดสอบ "เกิดขึ้น"? ฉันถูกสอนให้ใช้การทดสอบ t เมื่อคุณไม่ทราบค่าเบี่ยงเบนมาตรฐานของประชากร (เช่นคุณรู้ค่าเบี่ยงเบนมาตรฐานของตัวอย่างของคุณ) แต่ฉันไม่แน่ใจว่าทำไมจึงทำให้แตกต่างจากการทดสอบ z .

1
การทดสอบ Tukey HSD จะเป็นสัญญาณได้อย่างไรมากกว่าค่า P ที่ไม่ถูกต้องของ t.test
ฉันมาโดยโพสต์ " การเปรียบเทียบ Pairwise แบบโพสต์ทูของ ANOVA สองทาง " (ตอบกลับโพสต์นี้ ) ซึ่งแสดงสิ่งต่อไปนี้: dataTwoWayComparisons <- read.csv("http://www.dailyi.org/blogFiles/RTutorialSeries/dataset_ANOVA_TwoWayComparisons.csv") model1 <- aov(StressReduction~Treatment+Age, data =dataTwoWayComparisons) summary(model1) # Treatment is signif pairwise.t.test(dataTwoWayComparisons$StressReduction, dataTwoWayComparisons$Treatment, p.adj = "none") # no signif pair TukeyHSD(model1, "Treatment") # mental-medical is the signif pair. (เอาท์พุทที่แนบมาร้อง) ใครช่วยอธิบายหน่อยได้ไหมว่าทำไม Tukey HSD ถึงสามารถจับคู่ที่สำคัญได้ในขณะที่ t-test ที่จับคู่ (ปรับค่าไม่ได้) ไม่สามารถทำเช่นนั้นได้? …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.