คำถามติดแท็ก experiment-design

การศึกษาวิธีจัดโครงสร้างของแบบฝึกหัดการรวบรวมข้อมูลที่มีการเปลี่ยนแปลง

16
หนังสือที่แนะนำเกี่ยวกับการออกแบบการทดสอบ
คำแนะนำของแผงหนังสือเกี่ยวกับการออกแบบการทดลองคืออะไร ตามหลักการแล้วหนังสือควรจะยังคงอยู่ในรูปแบบสิ่งพิมพ์หรือเป็นสื่ออิเล็กทรอนิกส์แม้ว่าจะไม่เป็นไปได้เสมอไป หากคุณรู้สึกว่าต้องการเพิ่มคำสองสามคำเกี่ยวกับสิ่งที่ดีเกี่ยวกับหนังสือเล่มนั้นก็คงจะดีเช่นกัน นอกจากนี้ตั้งเป้าหมายสำหรับหนังสือหนึ่งเล่มต่อคำตอบเพื่อให้การลงคะแนนสามารถช่วยเรียงลำดับข้อเสนอแนะ (Community Wiki โปรดแก้ไขคำถามหากคุณสามารถทำให้ดีขึ้นได้!)

4
การวิเคราะห์ความแปรปรวนของข้อมูลทวินาม
ฉันกำลังวิเคราะห์ชุดข้อมูลการทดลอง ข้อมูลประกอบด้วยเวกเตอร์คู่ของประเภทการรักษาและผลลัพธ์ทวินาม: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... ในคอลัมน์ผลลัพธ์ 1 หมายถึงความสำเร็จและ 0 หมายถึงความล้มเหลว ฉันต้องการทราบว่าการรักษาแตกต่างกันอย่างมีนัยสำคัญผลลัพธ์ มีการรักษา 4 แบบที่แตกต่างกันในแต่ละการทดลองซ้ำหลายครั้ง (2000 ครั้งต่อการรักษาแต่ละครั้ง) คำถามของฉันคือฉันสามารถวิเคราะห์ผลลัพธ์ไบนารีโดยใช้ ANOVA ได้หรือไม่ หรือฉันควรใช้การทดสอบไคสแควร์เพื่อตรวจสอบข้อมูลทวินาม? ดูเหมือนว่าไคสแควร์จะถือว่าสัดส่วนจะแบ่งเท่า ๆ กันซึ่งไม่ใช่กรณี อีกแนวคิดหนึ่งคือการสรุปข้อมูลโดยใช้สัดส่วนของความสำเร็จต่อความล้มเหลวสำหรับการรักษาแต่ละครั้งและจากนั้นใช้การทดสอบสัดส่วน ฉันอยากรู้อยากเห็นคำแนะนำของคุณสำหรับการทดสอบที่เหมาะสมสำหรับการทดลองความสำเร็จ / ล้มเหลวแบบทวินามเหล่านี้

3
ถ้าตัวอย่างแบบสุ่มของคุณไม่ได้เป็นตัวแทนอย่างชัดเจนล่ะ
เกิดอะไรขึ้นถ้าคุณใช้ตัวอย่างที่สุ่มและคุณสามารถเห็นมันได้อย่างชัดเจนไม่ได้เป็นตัวแทนเช่นเดียวกับในคำถามที่ผ่านมา ตัวอย่างเช่นถ้าการกระจายตัวของประชากรควรมีความสมมาตรประมาณ 0 และตัวอย่างที่คุณวาดแบบสุ่มนั้นมีการสังเกตเชิงบวกและลบที่ไม่สมดุลและความไม่สมดุลนั้นมีนัยสำคัญทางสถิตินั่นจะทำให้คุณอยู่ที่ไหน คุณสามารถสร้างประโยคที่สมเหตุสมผลเกี่ยวกับประชากรจากกลุ่มตัวอย่างที่มีอคติได้อย่างไร การกระทำที่เหมาะสมในสถานการณ์เช่นนี้คืออะไร? การวิจัยของเรามีความสำคัญเมื่อเราสังเกตเห็นความไม่สมดุลนี้หรือไม่?

4
ข้อผิดพลาดในการออกแบบการทดลอง: หลีกเลี่ยงการทดลองที่ตายแล้ว
ฉันเจอคำพูดนี้หลายครั้ง: การปรึกษานักสถิติหลังจากการทดลองเสร็จสิ้นมักจะเป็นเพียงการขอให้เขาทำการทดสอบชันสูตรศพ บางทีเขาอาจพูดได้ว่าการทดลองเสียชีวิตจากอะไร - โรนัลด์ฟิชเชอร์ (2481) สำหรับฉันดูเหมือนว่าอาจจะเกรงใจเล็กน้อย ตัวอย่างเดียวที่ฉันเคยพบอธิบายว่าการทดลองตายโดยไม่มีการออกแบบที่ดีคือการขาดการควบคุมหรือการควบคุมที่ไม่ดี ตัวอย่างเช่นการทดลองที่ควบคุมการใช้ปุ๋ย แต่ไม่สามารถควบคุมสภาพแวดล้อมที่จำเป็นสำหรับการใช้งาน อาจเป็นเพียงฉัน แต่ดูเหมือนว่าการอ่านอย่างรวดเร็วในส่วน Wikipedia เกี่ยวกับหลักการออกแบบของ Fisherจะครอบคลุมฐานส่วนใหญ่ ในฐานะนักสถิติคุณเห็นการออกแบบปัญหาที่เกี่ยวข้องกับการทดสอบกับข้อมูลบ่อยเพียงใด พวกมันเกี่ยวข้องกับปัจจัยบางอย่างที่ฟิชเชอร์พูดถึงเสมอหรือมีข้อผิดพลาดร้ายแรงอื่น ๆ ที่เราไม่ควรมองหานักวิทยาศาสตร์ที่ผ่านการฝึกอบรมทางสถิติหรือไม่?

4
ตัวแปรอิสระ = ตัวแปรสุ่ม?
ฉันสับสนเล็กน้อยหากตัวแปรอิสระ (เรียกอีกอย่างว่าตัวทำนายหรือคุณสมบัติ) ในแบบจำลองทางสถิติตัวอย่างเช่นในการถดถอยเชิงเส้นเป็นตัวแปรสุ่มหรือไม่?XXXY=β0+β1XY=β0+β1XY=\beta_0+\beta_1 X

10
คุณมีคำแนะนำสำหรับหนังสือเกี่ยวกับสถิติประยุกต์ที่สอนด้วยตนเองในระดับบัณฑิตศึกษาหรือไม่?
ฉันเรียนวิชาสถิติหลายหลักสูตรในวิทยาลัย แต่ฉันพบว่าการศึกษาของฉันเป็นไปตามทฤษฎีมาก ฉันสงสัยว่ามีผู้ใดที่มีข้อความในสถิติประยุกต์ (ระดับบัณฑิตศึกษา) ที่คุณแนะนำหรือเคยมีประสบการณ์ที่ดีมาก่อนหรือไม่

4
เกิดอะไรขึ้นกับการสุ่มหลอก (บางคน)
ฉันเจอการศึกษาที่ผู้ป่วยซึ่งอายุมากกว่า 50 ปีถูกสุ่มหลอกโดยปีเกิด ถ้าปีเกิดเป็นเลขคู่ให้ดูแลเป็นปกติถ้าจำนวนคี่แทรกแซง ง่ายต่อการติดตั้งใช้งานยากกว่าที่จะล้มล้าง (ง่ายต่อการตรวจสอบสิ่งที่ผู้ป่วยควรได้รับ) รักษาความทรงจำได้ง่าย แต่ถึงกระนั้นฉันไม่ชอบมันฉันรู้สึกว่าการสุ่มที่เหมาะสมจะดีกว่า แต่ฉันไม่สามารถอธิบายได้ว่าทำไม ฉันคิดผิดหรือรู้สึกว่ามีเหตุผลที่ดีที่จะชอบการสุ่มแบบ "ของจริง" หรือไม่?

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
บล็อกในการออกแบบการทดลองคืออะไร
ฉันมีคำถามสองข้อเกี่ยวกับแนวคิดของบล็อกในการออกแบบการทดลอง: (1) ความแตกต่างระหว่างบล็อกและปัจจัยคืออะไร (2) ฉันพยายามอ่านหนังสือบางเล่ม แต่มีบางอย่างที่ไม่ชัดเจน: ดูเหมือนว่าผู้แต่งมักจะคิดว่าไม่มีการโต้ตอบระหว่าง "block factor" กับปัจจัยอื่น ๆ มันถูกต้องหรือไม่และถ้าเป็นเพราะอะไร

2
คุณ“ ควบคุม” สำหรับปัจจัย / ตัวแปรอย่างไร
เพื่อความเข้าใจของฉัน "การควบคุม" สามารถมีความหมายสองอย่างในสถิติ กลุ่มควบคุม: ในการทดสอบจะไม่มีการรักษาให้กับสมาชิกของกลุ่มควบคุม ตัวอย่าง: ยาหลอกเทียบกับยา: คุณให้ยาแก่กลุ่มหนึ่งและไม่ให้อีกกลุ่มหนึ่ง (กลุ่มควบคุม) ซึ่งเรียกอีกอย่างว่า "การทดลองที่ควบคุม" การควบคุมตัวแปร: เทคนิคการแยกเอฟเฟกต์ของตัวแปรอิสระเฉพาะ ชื่ออื่นที่ให้กับเทคนิคนี้คือ "การบัญชีสำหรับ", "การถือค่าคงที่", "การควบคุมสำหรับ", ตัวแปรบางตัว ตัวอย่างเช่น: ในการศึกษาดูฟุตบอล (เหมือนหรือไม่ชอบ) คุณอาจต้องการใช้เอฟเฟกต์ของเพศเมื่อเราคิดว่าเพศเป็นสาเหตุของความลำเอียงนั่นคือผู้ชายอาจชอบมากกว่าผู้หญิง ดังนั้นคำถามของฉันมีไว้สำหรับจุด (2) สองคำถาม: คุณ "ควบคุม" / "บัญชีสำหรับ" ตัวแปรโดยทั่วไปได้อย่างไร ใช้เทคนิคอะไร (ในแง่ของการถดถอยกรอบ ANOVA) ในตัวอย่างด้านบนการเลือกชายและหญิงจะเป็นการควบคุมแบบสุ่มหรือไม่? นั่นคือ "การสุ่ม" เป็นหนึ่งในเทคนิคในการควบคุมเอฟเฟกต์อื่น ๆ หรือไม่?

3
อะไรคือความแตกต่างระหว่าง“ การทดสอบทางสถิติ” และ“ แบบจำลองเชิงสถิติ”?
ฉันกำลังติดตาม AW van der Vaart, สถิติแบบอะซิติกติก (1998) เขาพูดถึงการทดลองทางสถิติโดยอ้างว่าพวกเขาแตกต่างจากแบบจำลองทางสถิติ แต่เขาไม่ได้กำหนด คำถามของฉัน: (1) การทดลองทางสถิติคืออะไร (2) แบบจำลองทางสถิติและ (3) ส่วนประกอบสำคัญที่มักจะทำให้การทดลองทางสถิติแตกต่างจากแบบจำลองทางสถิติใด ๆ เสมอ?

3
มีวิธีการทั่วไปในการจำลองข้อมูลจากสูตรหรือการวิเคราะห์หรือไม่?
การจำลองข้อมูลจากกรอบข้อมูลการออกแบบการทดลอง ด้วยการมุ่งเน้นไปที่ R (แม้ว่าภาษาอื่น ๆ จะดีมาก) ในการออกแบบการทดสอบหรือการสำรวจการจำลองข้อมูลและการวิเคราะห์ข้อมูลจำลองนี้สามารถให้ข้อมูลเชิงลึกที่ยอดเยี่ยมเกี่ยวกับข้อดีและจุดอ่อนของการออกแบบ วิธีการดังกล่าวยังเป็นสิ่งจำเป็นต่อความเข้าใจและการใช้การทดสอบทางสถิติที่เหมาะสม อย่างไรก็ตามกระบวนการนี้มีแนวโน้มที่จะค่อนข้างน่าเบื่อและหลายคนถูกพาข้ามขั้นตอนสำคัญนี้ในการทดสอบหรือสำรวจ แบบจำลองทางสถิติและการทดสอบมีข้อมูลส่วนใหญ่ที่จำเป็นในการจำลองข้อมูล (รวมถึงข้อสันนิษฐานหรือคำสั่งที่ชัดเจนของการกระจาย) ด้วยรูปแบบการวิเคราะห์ (และสมมติฐานที่เกี่ยวข้องเช่นความเป็นปกติและความสมดุล) ระดับของปัจจัยและการวัดความสำคัญ (เช่น p-value) ฉันต้องการได้รับข้อมูลจำลอง (ในอุดมคติที่มีฟังก์ชันทั่วไปคล้าย พิมพ์ (), คาดการณ์ (), จำลอง ()) เป็นกรอบการจำลองแบบทั่วไปที่เป็นไปได้หรือไม่? ถ้าเป็นเช่นนั้นกรอบดังกล่าวสามารถใช้ได้ในปัจจุบัน? ตัวอย่างฉันต้องการฟังก์ชั่นเช่น: sim(aov(response~factor1+factor2*factor3), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", "B", "C"), factor3=c("A", "B", "C"))) เช่นเวอร์ชันทั่วไปของ: sim.lm<-function(){ library(DoE.base) design<-fac.design(nlevels=c(10,3,3), factor.names=c("factor1", "factor2", "factor3"), replications=3, randomize=F) response<-with(design, as.numeric(factor1)+ …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
ตำรา / การอ่านเกี่ยวกับสิ่งที่ต้องทำเมื่อคุณไม่สามารถสร้างการทดสอบในอุดมคติได้?
การฝึกอบรมทางสถิติของฉันมีรากฐานมาจากสถิติทางคณิตศาสตร์และการเรียนวิธีการเหล่านี้ใน MS ของฉันค่อนข้างน่าตกใจในขณะนี้ ขณะนี้เป็นเรื่องยากสำหรับฉันที่จะสามารถเข้าใจวิธีการ "ใช้งาน" เหล่านี้เนื่องจากฉันไม่มีประสบการณ์ในอุตสาหกรรม หนึ่งในหัวข้อที่เราได้พูดถึงในชั้นเรียนวิธีการของฉันคือแนวคิดของการออกแบบการทดลอง ตัวอย่างเช่นฉันต้องการทำการทดลองเกี่ยวกับประสิทธิผลของโปรแกรมการศึกษาที่อ้างว่าเพิ่มคะแนนการทดสอบของนักเรียน K-12 ในชั้นเรียนวิธีการพวกเขาได้สอนสิ่งต่อไปนี้เพื่อติดตามปัญหาดังกล่าว: ตรวจสอบให้แน่ใจว่าคุณมีคำถามการวิจัยที่ดีวิธีการรวบรวมข้อมูลที่ดีการทดลองแบบสุ่มกลุ่มการรักษาที่เป็นเนื้อเดียวกัน ไม่) ขนาดเท่ากันอย่างสมบูรณ์และจากนั้นเรียกใช้การทดสอบ (หรือการทดสอบสมมติฐานที่ไม่ใช่พารามิเตอร์) และมันก็ดีและสวยหรูใช่ไหม?เสื้อเสื้อt ฉันมีศรัทธาเล็กน้อยว่านี่คือวิธีการทำงานในความเป็นจริง ฉันได้เรียนรู้แล้วว่าคุณอาจต้องทำการสุ่มตัวอย่างเพื่อความสะดวก แต่นอกจากนั้นฉันก็ไม่รู้ว่าจะใช้การออกแบบการทดลองอะไรนอกจากสิ่งที่ฉันเรียนรู้จากตำรา มีหนังสือเล่มไหนอ่าน ฯลฯ ที่สำรวจปัญหาเหล่านี้ในทางปฏิบัติ (และในอุดมคติแล้วก็ไม่ควรปัดเศษคณิตศาสตร์ - ฉันไม่ต้องการการพิสูจน์อย่างละเอียดของทุกสิ่ง แต่ฉันไม่ต้องการบอกว่าทุกอย่างคือ " ชัดเจน "ตัวอย่างเช่น)?

3
ฟิชเชอร์หมายถึงอะไรโดยอ้างนี้?
ฉันเห็นข้อความที่โด่งดังนี้ทุกที่ แต่ไม่เข้าใจส่วนที่ถูกเน้นทุกครั้ง คนที่ 'ปฏิเสธ' สมมติฐานเป็นการชั่วคราวเป็นเรื่องของการฝึกฝนเป็นนิสัยเมื่อความสำคัญอยู่ที่ระดับ 1% หรือสูงกว่าจะถูกเข้าใจผิดในการตัดสินใจเช่นนั้นไม่เกิน 1% เพราะเมื่อสมมติฐานถูกต้องเขาจะถูกเข้าใจผิดในเพียง 1% ของกรณีเหล่านี้และเมื่อมันไม่ถูกต้องเขาจะไม่ผิดในการปฏิเสธ [... ] อย่างไรก็ตามการคำนวณนั้นเป็นเรื่องไร้สาระทางวิชาการเพราะในความเป็นจริงไม่มีนักวิทยาศาสตร์คนใดมีระดับความสำคัญคงที่ซึ่งปีต่อปีและในทุกสถานการณ์เขาปฏิเสธสมมติฐาน; เขาค่อนข้างจะทำให้จิตใจของเขากับแต่ละกรณีโดยเฉพาะในแง่ของหลักฐานและความคิดของเขาไม่ควรลืมว่ากรณีที่เลือกใช้การทดสอบนั้นเป็นชุดที่เลือกอย่างชัดเจนและไม่สามารถระบุเงื่อนไขการเลือกแม้สำหรับผู้ปฏิบัติงานคนเดียว และในการโต้แย้งที่ใช้มันจะผิดกฎหมายอย่างชัดเจนสำหรับคนที่จะเลือกระดับความสำคัญที่แท้จริงที่ระบุโดยการทดลองโดยเฉพาะราวกับว่ามันเป็นนิสัยตลอดชีวิตของเขาที่จะใช้เพียงแค่ระดับนี้ (วิธีการทางสถิติและการอนุมานทางวิทยาศาสตร์, 1956, p. 42-45) โดยเฉพาะอย่างยิ่งฉันไม่เข้าใจ เหตุใดจึงถูกเลือกให้ทำการทดสอบ "เลือกอย่างสูง"? สมมติว่าคุณสงสัยว่าความสูงเฉลี่ยของคนในพื้นที่นั้นน้อยกว่า 165 ซม. หรือไม่และตัดสินใจทำการทดสอบ ขั้นตอนมาตรฐานเท่าที่ฉันรู้คือการสุ่มตัวอย่างจากพื้นที่และวัดความสูง วิธีนี้จะถูกเลือกอย่างมาก? สมมติว่าคดีได้รับการคัดสรรมาอย่างดี แต่สิ่งนี้เกี่ยวข้องกับการเลือกระดับนัยสำคัญอย่างไร ลองพิจารณาตัวอย่างข้างต้นอีกครั้งถ้าวิธีการสุ่มตัวอย่างของคุณ (สิ่งที่ฉันคิดว่าฟิชเชอร์หมายถึงเงื่อนไขการเลือก ) จะเบ้และคนที่มีความสูงก็ช่วยให้งานวิจัยทั้งหมดพังลงและการกำหนดระดับนัยสำคัญ พีพีp

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.