คำถามติดแท็ก controlling-for-a-variable

5
“ การควบคุมตัวแปรอื่น ๆ ” ได้อย่างไร?
นี่คือบทความที่กระตุ้นคำถามนี้: ความกระวนกระวายทำให้เราอ้วนหรือไม่? ฉันชอบบทความนี้และแสดงให้เห็นอย่างชัดเจนถึงแนวคิดของ "การควบคุมตัวแปรอื่น ๆ " (IQ, อาชีพ, รายได้, อายุ, ฯลฯ ) เพื่อแยกความสัมพันธ์ที่แท้จริงระหว่างตัวแปร 2 ตัวที่มีปัญหา คุณช่วยอธิบายให้ฉันฟังว่าคุณควบคุมตัวแปรในชุดข้อมูลทั่วไปได้อย่างไร? เช่นหากคุณมี 2 คนที่มีระดับความอดทนและ BMI เหมือนกัน แต่มีรายได้ต่างกันคุณจะจัดการกับข้อมูลเหล่านี้อย่างไร คุณแบ่งกลุ่มพวกเขาออกเป็นกลุ่มย่อยต่าง ๆ ที่มีรายได้ความอดทนและค่าดัชนีมวลกายใกล้เคียงกันหรือไม่? แต่ท้ายที่สุดก็มีตัวแปรหลายสิบตัวที่จะควบคุม (IQ, อาชีพ, รายได้, อายุ, ฯลฯ ) จากนั้นคุณจะรวมกลุ่มย่อย 100 กลุ่มเหล่านี้ได้อย่างไร ในความเป็นจริงฉันมีความรู้สึกว่าวิธีนี้กำลังเห่าต้นไม้ที่ไม่ถูกต้องตอนนี้ที่ฉันพูดด้วยวาจาแล้ว ขอบคุณที่ส่องแสงบางอย่างที่ฉันตั้งใจจะทำตอนนี้สองสามปีที่ผ่านมา ... !

3
“ ความเท่าเทียมกันอย่างอื่น” หมายถึงอะไรในการถดถอยหลายครั้ง?
เมื่อเราทำการถดถอยหลายครั้งและบอกว่าเรากำลังดูการเปลี่ยนแปลงเฉลี่ยในตัวแปรสำหรับการเปลี่ยนแปลงในตัวแปรถือค่าคงที่ตัวแปรอื่น ๆ ทั้งหมดค่าใดที่เราถือตัวแปรคงที่ที่? หมายความว่าอย่างไร ศูนย์? มีค่าไหม?yyyxxx ฉันอยากจะคิดว่ามันมีค่า แค่มองหาคำอธิบาย หากใครมีหลักฐานก็คงจะดีเช่นกัน

2
คุณ“ ควบคุม” สำหรับปัจจัย / ตัวแปรอย่างไร
เพื่อความเข้าใจของฉัน "การควบคุม" สามารถมีความหมายสองอย่างในสถิติ กลุ่มควบคุม: ในการทดสอบจะไม่มีการรักษาให้กับสมาชิกของกลุ่มควบคุม ตัวอย่าง: ยาหลอกเทียบกับยา: คุณให้ยาแก่กลุ่มหนึ่งและไม่ให้อีกกลุ่มหนึ่ง (กลุ่มควบคุม) ซึ่งเรียกอีกอย่างว่า "การทดลองที่ควบคุม" การควบคุมตัวแปร: เทคนิคการแยกเอฟเฟกต์ของตัวแปรอิสระเฉพาะ ชื่ออื่นที่ให้กับเทคนิคนี้คือ "การบัญชีสำหรับ", "การถือค่าคงที่", "การควบคุมสำหรับ", ตัวแปรบางตัว ตัวอย่างเช่น: ในการศึกษาดูฟุตบอล (เหมือนหรือไม่ชอบ) คุณอาจต้องการใช้เอฟเฟกต์ของเพศเมื่อเราคิดว่าเพศเป็นสาเหตุของความลำเอียงนั่นคือผู้ชายอาจชอบมากกว่าผู้หญิง ดังนั้นคำถามของฉันมีไว้สำหรับจุด (2) สองคำถาม: คุณ "ควบคุม" / "บัญชีสำหรับ" ตัวแปรโดยทั่วไปได้อย่างไร ใช้เทคนิคอะไร (ในแง่ของการถดถอยกรอบ ANOVA) ในตัวอย่างด้านบนการเลือกชายและหญิงจะเป็นการควบคุมแบบสุ่มหรือไม่? นั่นคือ "การสุ่ม" เป็นหนึ่งในเทคนิคในการควบคุมเอฟเฟกต์อื่น ๆ หรือไม่?

3
เมื่อใดที่ไม่เหมาะสมที่จะควบคุมตัวแปร?
ฉันนึกถึงตัวอย่างที่ไร้เดียงสาอย่างน้อยหนึ่งข้อ สมมติว่าฉันต้องการศึกษาความสัมพันธ์ระหว่าง X และ Z ฉันยังสงสัยว่า Y มีผลกับ Z ดังนั้นฉันจึงควบคุมสำหรับ Y อย่างไรก็ตามเมื่อปรากฎว่าไม่รู้จักฉัน X ทำให้ Y และ Y ทำให้ Z ดังนั้นโดยการควบคุม สำหรับ Y ฉัน "ปกปิด" ความสัมพันธ์ระหว่าง X และ Z เนื่องจาก X เป็นอิสระจาก Z ที่ให้ Y ในตัวอย่างก่อนหน้านี้มันอาจเป็นกรณีที่ความสัมพันธ์ที่ฉันควรศึกษาอยู่ระหว่าง X และ Y และ Y และ Z อย่างไรก็ตามถ้าฉันรู้เรื่องดังกล่าวมาก่อนฉันจะไม่ทำวิทยาศาสตร์ใน สถานที่แรก การศึกษาที่ฉันทำตอนนี้ชี้ให้เห็นว่าไม่มีความสัมพันธ์ระหว่าง X และ Z ซึ่งไม่ใช่กรณีที่ .... …

4
การเพิ่มความแม่นยำของเครื่องไล่ระดับสีจะลดลงเมื่อจำนวนการทำซ้ำเพิ่มขึ้น
ฉันกำลังทดลองกับอัลกอริทึมของเครื่องเร่งการไล่ระดับสีผ่านcaretแพ็คเกจใน R ใช้ชุดข้อมูลการรับสมัครวิทยาลัยขนาดเล็กฉันใช้รหัสต่อไปนี้: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
เมื่อเราเปรียบเทียบกลุ่มกับตัวแปรควบคุมเราควรใช้การทดสอบความเท่ากันหรือไม่
ในเอกสารจำนวนมากที่พิจารณาถึงการรักษาและผลลัพธ์ฉันเห็นตาราง (โดยปกติคือ "ตารางที่ 1") ของสิ่งที่อาจเรียกว่าตัวแปรที่สร้างความรำคาญ (มักเป็นประชากร, เงื่อนไขทางการแพทย์บางครั้ง) พร้อมการทดสอบความสำคัญและข้อความเช่น "กลุ่มต่างๆ ไม่มีความแตกต่างอย่างมีนัยสำคัญใน XXXXX ดูที่ตาราง " ดังนั้นเป้าหมายที่ชัดเจนคือการแสดงให้เห็นว่ากลุ่มที่ได้รับมอบหมายให้รักษาที่แตกต่างกันมีความคล้ายคลึงกัน อย่างไรก็ตามนี่ดูเหมือนว่าฉันจะชอบ "ยอมรับโมฆะ" และสิ่งที่เราควรจะทำ (หรือเรียกร้องให้ทำ) คือการทดสอบความเท่าเทียมกัน สิ่งนี้สามารถนำไปใช้กับการทดลองแบบสุ่มหรือการศึกษาเชิงสังเกตการณ์ ฉันทำอะไรบางอย่างหายไปหรือเปล่า

1
อะไรคือความแตกต่างระหว่างการควบคุมตัวแปรในตัวแบบการถดถอยกับการควบคุมตัวแปรในการออกแบบการศึกษาของคุณ?
ฉันคิดว่าการควบคุมตัวแปรในการออกแบบการศึกษาของคุณนั้นมีประสิทธิภาพมากขึ้นในการลดข้อผิดพลาดได้มากกว่าการควบคุมมันในแบบจำลองการถดถอยของคุณ ใครบางคนจะอธิบายอย่างเป็นทางการว่า "การควบคุม" สองอย่างนี้มีความแตกต่างกันอย่างไร มีประสิทธิภาพอย่างไรเมื่อเปรียบเทียบกับการลดข้อผิดพลาดและให้การคาดการณ์ที่แม่นยำยิ่งขึ้น

3
การเชื่อมโยงระหว่างวิธีเช่นการจับคู่และการควบคุมสถิติสำหรับตัวแปรคืออะไร?
บ่อยครั้งในบทความวิจัยที่คุณอ่านนักวิจัยได้ควบคุมตัวแปรบางอย่าง สิ่งนี้สามารถทำได้โดยวิธีการต่าง ๆ เช่นการจับคู่การบล็อก ฯลฯ แต่ฉันคิดเสมอว่าการควบคุมตัวแปรนั้นเป็นสิ่งที่ทำในเชิงสถิติโดยการวัดตัวแปรหลายอย่างที่อาจมีอิทธิพลและทำการวิเคราะห์เชิงสถิติเกี่ยวกับตัวแปรเหล่านั้นซึ่งสามารถทำได้ทั้งในการทดลองจริงและเสมือนจริง ตัวอย่างเช่นคุณจะมีแบบสำรวจหรือแบบทดสอบอื่นที่คุณวัดตัวแปรอิสระและตัวแปรที่อาจทำให้สับสนและทำการวิเคราะห์บางอย่าง เป็นไปได้ที่จะควบคุมตัวแปรในการทดลองเสมือนหรือไม่? การเชื่อมโยงระหว่างวิธีเช่นการจับคู่และการควบคุมสถิติสำหรับตัวแปรคืออะไร?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.