คำถามติดแท็ก random-allocation

4
เกิดอะไรขึ้นกับการสุ่มหลอก (บางคน)
ฉันเจอการศึกษาที่ผู้ป่วยซึ่งอายุมากกว่า 50 ปีถูกสุ่มหลอกโดยปีเกิด ถ้าปีเกิดเป็นเลขคู่ให้ดูแลเป็นปกติถ้าจำนวนคี่แทรกแซง ง่ายต่อการติดตั้งใช้งานยากกว่าที่จะล้มล้าง (ง่ายต่อการตรวจสอบสิ่งที่ผู้ป่วยควรได้รับ) รักษาความทรงจำได้ง่าย แต่ถึงกระนั้นฉันไม่ชอบมันฉันรู้สึกว่าการสุ่มที่เหมาะสมจะดีกว่า แต่ฉันไม่สามารถอธิบายได้ว่าทำไม ฉันคิดผิดหรือรู้สึกว่ามีเหตุผลที่ดีที่จะชอบการสุ่มแบบ "ของจริง" หรือไม่?

2
การโยนเหรียญเป็นวิธีที่ยุติธรรมในการสุ่มกลุ่มเป็นสองกลุ่มหรือไม่?
ดังนั้นตัวฉันและลุงของฉันจึงโต้เถียงกันว่าการพลิกเหรียญเป็นการสุ่มอย่างแท้จริงหรือไม่ ฉันโต้เถียงมันไม่ใช่เพราะในความเป็นจริงเหรียญ tosser มักจะจัดการเหรียญดังนั้นผลไม่ใช่ 50/50 ดังนั้นจึงไม่ใช่ทางเลือกที่ดีสำหรับเทคนิคการสุ่มสำหรับการมอบหมายกลุ่มในการทดลองทางคลินิก อย่างไรก็ตามเขาระบุว่ามันเป็นความไม่สมบูรณ์แบบนาทีในการโยนเหรียญที่สร้างแบบแผน ดังนั้นเขาจึงตั้งสมมติฐานเครื่องจักรที่จะสามารถโยนเหรียญที่ยุติธรรมได้ตลอดกาลและวางมันไว้บนหัวและพูดตามตรงฉันก็แค่ต้องการใครสักคนมาโต้แย้งเรื่องนี้กับฉัน การโยนเหรียญเป็นวิธีที่ยุติธรรมในการสุ่มกลุ่มเป็นสองกลุ่มหรือไม่?

2
การสุ่มมีความน่าเชื่อถือกับกลุ่มตัวอย่างขนาดเล็กหรือไม่
Jerome Cornfield ได้เขียน: หนึ่งในผลไม้ที่ดีที่สุดของการปฏิวัติของชาวประมงคือความคิดของการสุ่มและนักสถิติที่เห็นด้วยกับสิ่งอื่น ๆ น้อยได้เห็นด้วยอย่างน้อยในเรื่องนี้ แต่แม้จะมีข้อตกลงนี้และแม้จะมีการใช้ขั้นตอนการจัดสรรแบบสุ่มในทางคลินิกและในรูปแบบอื่น ๆ ของการทดลอง แต่สถานะทางตรรกะของมันก็คือฟังก์ชันที่แน่นอนที่มันทำนั้นยังคงคลุมเครือ ทุ่งนาเจอโรม (1976) "ผลงานล่าสุดกับระเบียบวิธีการทดลองทางคลินิก" วารสารระบาดวิทยาแห่งอเมริกา 104 (4): 408–421 ในเว็บไซต์นี้และในวรรณคดีที่หลากหลายฉันมักเห็นการอ้างสิทธิ์ที่มั่นใจเกี่ยวกับพลังของการสุ่ม คำศัพท์ที่แข็งแกร่งเช่น "มันกำจัดปัญหาของตัวแปรที่รบกวน" เป็นเรื่องปกติ ดูที่นี่ยกตัวอย่างเช่น อย่างไรก็ตามมีการทดลองหลายครั้งด้วยตัวอย่างเล็ก ๆ (3-10 ตัวอย่างต่อกลุ่ม) สำหรับเหตุผลเชิงปฏิบัติ / จริยธรรม นี่เป็นเรื่องธรรมดามากในการวิจัยพรีคลินิกโดยใช้สัตว์และเซลล์เพาะเลี้ยงและนักวิจัยมักรายงานค่า p เพื่อสนับสนุนข้อสรุปของพวกเขา สิ่งนี้ทำให้ฉันสงสัยว่าการสุ่มตัวอย่างทำได้ดีเพียงใดในการสร้างสมดุลให้กับขอบเขต สำหรับพล็อตนี้ฉันจำลองสถานการณ์เปรียบเทียบกลุ่มการรักษาและกลุ่มควบคุมด้วยความสับสนที่สามารถรับสองค่าด้วยโอกาส 50/50 (เช่น type1 / type2, ชาย / หญิง) มันแสดงให้เห็นการกระจายตัวของ "% ไม่สมดุล" (ความแตกต่างใน # ของ type1 ระหว่างการรักษาและตัวอย่างการควบคุมหารด้วยขนาดตัวอย่าง) …

3
มีตัวอย่างอะไรของตัวแปรที่ซ่อนอยู่ในการทดลองที่มีการควบคุมในสิ่งพิมพ์?
ในบทความนี้: ตัวแปรที่ซุ่มซ่อน: บางตัวอย่าง Brian L. Joiner ฉบับสถิติชาวอเมริกัน 35, ฉบับที่ 4, พ.ย. , 1981 227-233 Brian Joiner อ้างว่า "การสุ่มไม่ใช่ยาครอบจักรวาล" ตรงข้ามกับข้อความทั่วไปเช่นข้อความด้านล่าง: การทดสอบที่ออกแบบมาอย่างดีประกอบด้วยคุณสมบัติการออกแบบที่ช่วยให้นักวิจัยสามารถกำจัดตัวแปรภายนอกซึ่งเป็นคำอธิบายสำหรับความสัมพันธ์ที่สังเกตได้ระหว่างตัวแปรอิสระกับตัวแปรตาม ตัวแปรภายนอกเหล่านี้เรียกว่าตัวแปรซุ่มซ่อน ข้อความที่นำมาจากคำถามนี้และไม่มีแหล่งที่มา แต่จากประสบการณ์ของฉันมันเป็นตัวแทนของทัศนคติที่แพร่หลาย: ตัวอย่างของ Lurking Variable และสังเกตการณ์ที่มีอิทธิพล ตัวอย่างหนึ่งที่ให้ไว้คือเมื่อทำการทดสอบความปลอดภัย (การก่อมะเร็งโดยเฉพาะ) ของสีย้อมอาหารสีแดง # 40 บนสัตว์ฟันแทะในอายุเจ็ดสิบผลของตำแหน่งกรงก็พบว่าทำให้การศึกษาสับสน ตอนนี้ฉันได้อ่านบทความวารสารมากมายที่ศึกษาการก่อมะเร็งในสัตว์ฟันแทะ การอภิปรายเพิ่มเติมของการศึกษาเหล่านี้สามารถพบได้ที่นี่: กรณีศึกษาสถิติในกระบวนการกำกับดูแล: การทดลอง FD&C Red No. 40 ฉันไม่พบรุ่นที่ไม่ได้ชำระเงิน แต่นี่เป็นข้อความที่ตัดตอนมา: ในการประชุมเดือนมกราคมเรานำเสนอการวิเคราะห์เบื้องต้น (14) ที่เปิดเผยความสัมพันธ์ที่แข็งแกร่งระหว่างแถวกรงและอัตราการเสียชีวิต RE (reticulo-endothelial tumor) ซึ่งมีความหลากหลายตั้งแต่ …

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
การสุ่มตัวอย่างแบบไม่สุ่ม
ฉันประหลาดใจเล็กน้อยที่เห็นโฆษณาทางจิตวิทยาสำหรับการมีส่วนร่วมในการศึกษาทดลอง แน่นอนคนที่ตอบสนองต่อโฆษณาเหล่านี้จะไม่สุ่มตัวอย่างแบบสุ่มและดังนั้นจึงเป็นประชากรที่เลือกด้วยตนเอง เนื่องจากเป็นที่รู้จักกันว่าการสุ่มเลือกแก้ปัญหาการเลือกตนเองฉันสงสัยว่าการสุ่มตัวอย่างของกลุ่มตัวอย่างที่ไม่สุ่มเปลี่ยนอะไรจริงหรือไม่ คุณคิดอย่างไร ? และเราควรทำอะไรจากการทดลองทางจิตวิทยาทั้งหมดเหล่านี้จากตัวอย่างที่เลือกมาอย่างหนัก

1
คัดค้านการสุ่ม
ในการทดลองทางคลินิก - มุมมองวิธีการ , Steven Piantadosi เขียน (ch.13, p. 334): ในบทที่ 2 ฉันสังเกตเห็นการคัดค้านการสุ่มโดย Abel และ Koch (1997) และ Urbach (1993) และชี้ให้เห็นคุณค่าของการศึกษาข้อกังวลและข้อผิดพลาดที่น่าจะเกิดขึ้น พวกเขาปฏิเสธการสุ่มเป็น หมายถึงการตรวจสอบการทดสอบทางสถิติบางอย่าง พื้นฐานสำหรับการอนุมานสาเหตุ การอำนวยความสะดวกในการกำบังและ วิธีการสมดุลกลุ่มเปรียบเทียบ ตามฉัน (1) - (4) เป็นประโยชน์ของการสุ่ม ดังนั้นทำไมAbel, KochและUrbachปฏิเสธการสุ่มบนพื้นฐานของข้อโต้แย้งเหล่านั้น?

3
การมอบหมายแบบสุ่ม: ทำไมต้องกังวล
การมอบหมายแบบสุ่มมีค่าเพราะช่วยให้มั่นใจได้ถึงความเป็นอิสระในการรักษาจากผลลัพธ์ที่อาจเกิดขึ้น นั่นคือวิธีที่จะนำไปสู่การประมาณการแบบไม่เอนเอียงของผลการรักษาโดยเฉลี่ย แต่รูปแบบการมอบหมายอื่น ๆ สามารถมั่นใจได้อย่างเป็นระบบในการรักษาจากผลลัพธ์ที่เป็นไปได้อย่างเป็นระบบ แล้วทำไมเราต้องสุ่มมอบหมาย? กล่าวอีกนัยหนึ่งอะไรคือข้อดีของการมอบหมายแบบสุ่มเหนือแผนการมอบหมายที่ไม่ใช่การสุ่มที่นำไปสู่การอนุมานที่ไม่เอนเอียง? ให้เป็นเวกเตอร์ของการกำหนดการรักษาซึ่งแต่ละองค์ประกอบคือ 0 (หน่วยที่ไม่ได้รับมอบหมายให้ทำการรักษา) หรือ 1 (หน่วยที่กำหนดให้การรักษา) ในบทความ JASA, Angrist, Imbens และ Rubin (1996, 446-47)บอกว่าการมอบหมายการรักษานั้นเป็นการสุ่มถ้าสำหรับ\ mathbf {c}และ\ mathbf {c'} ทุกอย่างที่\ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '}โดยที่\ iotaเป็น เวกเตอร์คอลัมน์ที่มีองค์ประกอบทั้งหมดเท่ากับ 1ZZ\mathbf{Z}ZiZiZ_iPr(Z=c)=Pr(Z=c′)Pr(Z=c)=Pr(Z=c′)\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})cc\mathbf{c}c′c′\mathbf{c'}ιTc=ιTc′ιTc=ιTc′\iota^T\mathbf{c} …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.