คำถามติดแท็ก experiment-design

การศึกษาวิธีจัดโครงสร้างของแบบฝึกหัดการรวบรวมข้อมูลที่มีการเปลี่ยนแปลง

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
ITT และ ATE ต่างกันอย่างไร
ฉันมีปัญหาในการทำความเข้าใจตัวประมาณค่าต่าง ๆ ที่สามารถใช้ในการประเมินผลกระทบ ฉันรู้ว่าตัวประมาณความตั้งใจในการปฏิบัติ (ITT) เปรียบเทียบความแตกต่างระหว่างบุคคลที่มีสิทธิ์โดยไม่ต้องใช้โปรแกรมและบุคคลที่มีสิทธิ์เข้าร่วมโปรแกรม อย่างไรก็ตามฉันคิดว่าผลการรักษาโดยเฉลี่ย (ATE) ก็วัดเช่นเดียวกัน อย่างไรก็ตามดูเหมือนว่า ATE จะพิจารณาการปฏิบัติตาม ดังนั้นจึงเปรียบเทียบผลลัพธ์ระหว่างผู้ที่มีคุณสมบัติเหมาะสมกับการเข้ารับการรักษากับผู้ที่ไม่มีคุณสมบัติ ถูกต้องหรือไม่

4
ใครถูกใครสถิติหรือศัลยแพทย์?
พิจารณากรณีที่อธิบายไว้ด้านล่างจาก Peacock (1972) ข้อความนี้ดูเหมือนจะบ่งบอกว่านักสถิติรุ่นเยาว์กำลังสร้างข้อความที่ฉลาดและถูกต้อง แต่เขาคือ?

1
ทำไมในละตินกำลังสองแถวการรักษาและคอลัมน์จึงถูกกล่าวว่าเป็นมุมฉาก
ฉันเคยได้ยิน "orthogonal" ในพื้นที่ของรูปทรงเรขาคณิตเสมอ (โปรดทราบว่าฉันไม่ใช่เจ้าของภาษาอังกฤษ) ฉันไม่เข้าใจสิ่งต่อไปนี้สำหรับสี่เหลี่ยมละติน (คำพูดจากหนังสือข้อความ): ทุกการรักษา (ABCD) จะปรากฏขึ้นหนึ่งครั้งในแต่ละแถว ดังนั้นการรักษาและแถวเป็นมุมฉาก ... แถวและคอลัมน์เป็นมุมฉากกับการรักษา 12341ABคD2BคDA3คDAB4DABค12341ABCD2BCDA3CDAB4DABC\begin{matrix}\,&1&2&3&4\\1&A&B&C&D\\2&B&C&D&A\\3&C&D&A&B\\4&D&A&B&C\end{matrix} orthogonality มีความหมายอะไรที่นี่?

1
หนังสือ / แหล่งข้อมูลเกี่ยวกับการทดลองขั้นสูงคืออะไรดี?
ฉันกำลังมองหาแหล่งข้อมูล (ไม่จำเป็นต้องเป็นหนังสือเล่มเดียว) ที่จะครอบคลุมกรณีที่ท้าทายมากขึ้นของการออกแบบการทดลองและการวิเคราะห์เชิงสถิติ บางกรณีที่ฉันต้องการได้รับความคุ้มครอง: 1. กรณีที่หน่วยของการสุ่มแตกต่างจากหน่วยการวิเคราะห์ ตัวอย่าง: ฉันเรียกใช้แพลตฟอร์มอีคอมเมิร์ซกับผู้ขาย M และผู้ซื้อ N ฉันต้องการแนะนำการรักษาในระดับผู้ขาย แต่สนใจในความน่าจะเป็นของผู้ซื้อที่ทำการซื้อ ผู้ซื้อทั่วไปจะไปที่ร้านค้าหลายแห่งในเซสชัน 2. ตัวแปรผลลัพธ์มีความเบ้สูง ตัวอย่าง: ฉันเรียกใช้ศูนย์บริการและฉันต้องการลองแจ้งให้ลูกค้าป้อนรหัสลูกค้าก่อนถึงตัวแทน ฉันหวังว่าจะลดระยะเวลาเฉลี่ยของการโทรศัพท์ การกระจายสายโทรศัพท์เบ้อย่างมาก 3. กลุ่มการรักษามีการกระจายรูปร่างแตกต่างกัน ตัวอย่าง: ศูนย์บริการเดียวกัน แต่ตอนนี้การรักษาของฉันทำงานได้ดีขึ้นมากสำหรับการโทรสั้นและแย่กว่าเล็กน้อยสำหรับการโทรนาน วิธีที่ถูกต้องในการวิเคราะห์นี้คืออะไร? 4. การรักษาทำให้กลุ่มของฉันไม่สมดุล ตัวอย่าง: แพลตฟอร์มอีคอมเมิร์ซเดียวกับใน1แต่ตอนนี้ฉันต้องการทดสอบด้วยกลไกการจัดอันดับที่แตกต่างกัน โดยได้รับมอบหมายให้อยู่ในอันดับที่น่าพอใจมากขึ้นผู้ขายอาจต้องการขึ้นราคาเพิ่มสินค้าคงคลังเปลี่ยนกลยุทธ์ทางการตลาด ฯลฯ ในลักษณะที่จะทำให้ตัวแปรเหล่านั้นแตกต่างกันอย่างเป็นระบบสำหรับการรักษาที่แตกต่างกัน

1
หลักสูตรระดับบัณฑิตศึกษาในการออกแบบการทดลองควรครอบคลุมอะไรบ้าง
ฉันถูกขอให้เสนอหลักสูตรในการออกแบบการทดลองสำหรับนักศึกษาระดับบัณฑิตศึกษาขั้นสูงด้านพืชไร่และนิเวศวิทยา ฉันไม่เคยเรียนหลักสูตรนี้มาก่อนและรู้สึกประหลาดใจที่พบว่าหลักสูตรนี้อาจมีชื่อว่า "Beyond one-way ANOVA" มากกว่าและมันครอบคลุมเนื้อหาที่ฉันได้เรียนในหลักสูตรระดับบัณฑิตศึกษาขั้นสูงเกี่ยวกับสถิติสำหรับการทดลองทางการเกษตร (เช่น RCBD, ละตินสแควร์, ความคมชัด, การวัดซ้ำและ covariates) บางทีฉันอาจสับสนด้วยชื่อ "การออกแบบการทดลอง" มากกว่า "การวิเคราะห์ผลลัพธ์การทดลอง" ฉันมีความคิดบางอย่างเกี่ยวกับสิ่งที่หลักสูตรดังกล่าวควรมีและขอขอบคุณข้อเสนอแนะเกี่ยวกับวิธีการนี้อาจรวมเข้ากับหลักสูตรสถิติที่ตรงกับความต้องการของนักเรียนในขณะที่นำเสนอทางเลือกที่ทันสมัย ตัวอย่างเช่นฉันไม่สามารถจินตนาการการสอนให้นักเรียนใช้ความแตกต่างเชิงเส้นและสมการกำลังสองกับ ANOVA ที่บังคับให้จัดประเภทของตัวแปรต่อเนื่องเมื่อฉันสามารถสอนพวกเขาเพื่อเปรียบเทียบแบบจำลองการถดถอยกับฟังก์ชันเชิงเส้นและกำลังสอง ในกรณีที่สองพวกเขาจะได้เรียนรู้วิธีจัดการกับปัจจัยที่ไม่ได้กำหนดค่าโดยสิ้นเชิงแบบทดลอง ถ้ามีอะไรฉันอาจเปรียบเทียบทั้งสองแนวทาง ถ้าฉันจะสอนหลักสูตรใน "การออกแบบการทดลอง" ฉันอยากจะเน้นแนวคิดพื้นฐานที่เป็นอิสระจากแบบจำลองทางสถิติที่นำไปใช้และนั่นจะแปลปัญหาอื่น ๆ ให้กว้างขึ้น สิ่งนี้จะช่วยให้นักเรียนมีความยืดหยุ่นในการใช้วิธีการทางสถิติที่ทันสมัย แนวคิดที่เกี่ยวข้องบางอย่างที่ไม่ปรากฏในหลักสูตรที่มีอยู่ ได้แก่ : แบบลำดับชั้นและแบบผสม (ซึ่งฉันเข้าใจ ANOVA และญาติเป็นตัวอย่าง) การเปรียบเทียบแบบจำลอง (เช่นเพื่อแทนที่ความแตกต่าง) ใช้โมเดลเชิงพื้นที่แทนบล็อกเป็น 'ปัจจัย' การจำลองแบบการสุ่มและ IID ความแตกต่างระหว่างการทดสอบสมมติฐานการแฮ็ก p และการจดจำรูปแบบ การวิเคราะห์พลังงานผ่านการจำลอง (เช่นการกู้คืนพารามิเตอร์จากชุดข้อมูลจำลอง) ลงทะเบียนล่วงหน้า การใช้ความรู้เดิมจากการศึกษาที่ตีพิมพ์และหลักการทางวิทยาศาสตร์ มีหลักสูตรที่ใช้แนวทางดังกล่าวหรือไม่? ตำราตำราเล่มใดที่มีจุดสนใจเช่นนี้?

1
การทดสอบที่ดีมีประโยชน์และมีลักษณะเฉพาะสำหรับการออกแบบเชิงสถิติของการทดลอง
มีปรากฏการณ์มากกว่าที่การออกแบบการทดลองอาจนำไปใช้มากกว่าที่จะมีกลยุทธ์การออกแบบที่ถูกต้องทางเลือก สิ่งนี้ควรเป็นจริงแม้ว่าจะมีหลายวิธีในการออกแบบการทดสอบอย่างถูกต้อง อะไรคือ "ปัญหา" ที่ดีที่สุดที่แสดงให้เห็นถึงคุณค่าและความแตกต่างของการออกแบบการทดลองที่ดีที่สุด (A, D, E, C, V, phi, .... ) คุณสามารถจัดหาหนังสือลิงก์บทความข้อมูลอ้างอิงหรือความคิดเห็นเชิงประจักษ์ที่ขับเคลื่อนไปด้วยดีอย่างน้อยได้หรือไม่?

3
การมอบหมายแบบสุ่ม: ทำไมต้องกังวล
การมอบหมายแบบสุ่มมีค่าเพราะช่วยให้มั่นใจได้ถึงความเป็นอิสระในการรักษาจากผลลัพธ์ที่อาจเกิดขึ้น นั่นคือวิธีที่จะนำไปสู่การประมาณการแบบไม่เอนเอียงของผลการรักษาโดยเฉลี่ย แต่รูปแบบการมอบหมายอื่น ๆ สามารถมั่นใจได้อย่างเป็นระบบในการรักษาจากผลลัพธ์ที่เป็นไปได้อย่างเป็นระบบ แล้วทำไมเราต้องสุ่มมอบหมาย? กล่าวอีกนัยหนึ่งอะไรคือข้อดีของการมอบหมายแบบสุ่มเหนือแผนการมอบหมายที่ไม่ใช่การสุ่มที่นำไปสู่การอนุมานที่ไม่เอนเอียง? ให้เป็นเวกเตอร์ของการกำหนดการรักษาซึ่งแต่ละองค์ประกอบคือ 0 (หน่วยที่ไม่ได้รับมอบหมายให้ทำการรักษา) หรือ 1 (หน่วยที่กำหนดให้การรักษา) ในบทความ JASA, Angrist, Imbens และ Rubin (1996, 446-47)บอกว่าการมอบหมายการรักษานั้นเป็นการสุ่มถ้าสำหรับ\ mathbf {c}และ\ mathbf {c'} ทุกอย่างที่\ iota ^ T \ mathbf {c} = \ iota ^ T \ mathbf {c '}โดยที่\ iotaเป็น เวกเตอร์คอลัมน์ที่มีองค์ประกอบทั้งหมดเท่ากับ 1ZZ\mathbf{Z}ZiZiZ_iPr(Z=c)=Pr(Z=c′)Pr(Z=c)=Pr(Z=c′)\Pr(\mathbf{Z} = \mathbf{c}) = \Pr(\mathbf{Z} = \mathbf{c'})cc\mathbf{c}c′c′\mathbf{c'}ιTc=ιTc′ιTc=ιTc′\iota^T\mathbf{c} …

2
ANOVA แบบแยกส่วนที่มีสองปัจจัยเหมือนกับ ANOVA แบบสองทางที่มีการวัดซ้ำในปัจจัยเดียวหรือไม่
ANOVA แบบ "แยกส่วน" ที่มีสองปัจจัยเหมือนกับ ANOVA แบบสองทางที่มีการวัดซ้ำในปัจจัยเดียวหรือไม่ ถ้าไม่ความแตกต่างคืออะไร?

1
ฉันควรสลับข้อมูลของฉันอีกครั้งหรือไม่
เรามีตัวอย่างชีวภาพชุดหนึ่งที่ค่อนข้างแพง เราวางตัวอย่างเหล่านี้ผ่านชุดการทดสอบเพื่อสร้างข้อมูลที่ใช้สำหรับสร้างแบบจำลองการทำนาย เพื่อจุดประสงค์นี้เราได้แบ่งกลุ่มตัวอย่างเป็นชุดฝึกอบรม (70%) และชุดทดสอบ (30%) เราสร้างแบบจำลองได้สำเร็จและนำไปใช้กับชุดการทดสอบเพื่อค้นหาว่าประสิทธิภาพนั้น "น้อยกว่าความเหมาะสม" ผู้ทำการทดลองต้องการปรับปรุงการทดสอบทางชีวภาพเพื่อสร้างแบบจำลองที่ดีขึ้น โดยมีเงื่อนไขว่าเราไม่สามารถรับตัวอย่างใหม่ได้คุณขอแนะนำให้เราสุ่มตัวอย่างใหม่เพื่อสร้างชุดการฝึกอบรมและการตรวจสอบความถูกต้องใหม่หรือติดกับส่วนเดิม (เราไม่มีข้อบ่งชี้ว่าการแบ่งนั้นเป็นปัญหาอย่างหนึ่ง)

3
จะทำอย่างไรกับตัวแปรที่สับสน?
ฉันต้องทำการทดสอบ ก่อนอื่นให้ฉันอธิบายสถานการณ์ปัจจุบัน บริษัท ที่ฉันทำงานคือโรงภาพยนตร์ มีส่วนของเกมที่ผู้คนที่รอหนังสามารถผ่านเวลาโดยการเล่นเกม ผู้คนสามารถชำระเงินได้โดยใช้บัตรสมาชิกแบบชำระเงินล่วงหน้าเท่านั้น น่าเสียดายที่ส่วนเกมนี้ไม่ได้สร้างยอดขายมากพอ เรากำลังพยายามหาสาเหตุ สมมติฐานของฉันคือถ้าเรารับเงินสดเป็นเงินการขายจะเพิ่มขึ้น แผนของฉันคือการมีกลุ่มทดลองและกลุ่มควบคุม กลุ่มทดลองจะยอมรับการชำระเงินสดกลุ่มควบคุมไม่ ยอดขายของทั้งสองกลุ่มมีการนับก่อนและหลังการทดสอบ สิ่งที่ยากเกี่ยวกับเรื่องนี้คือฉันไม่สามารถหาวิธีแยกปัจจัย 'การจ่ายเงินสด' จากปัจจัยอื่น: เมื่อภาพยนตร์ที่เล่นในโรงภาพยนตร์ดีผู้คนจำนวนมากจะมาและยอดขายก็จะเพิ่มขึ้นเช่นกัน โรงภาพยนตร์แต่ละแห่งมีเพียงส่วนหนึ่งของการเล่นเกมเท่านั้นฉันไม่สามารถแยกมันออกเป็นสองส่วนได้ (ส่วนหนึ่งรับเงินสดและอีกส่วนไม่ได้) หากหลายเว็บไซต์ยอมรับเงินสดและหลายเว็บไซต์ไม่ทำฉันไม่คิดว่าฉันสามารถเปรียบเทียบผลลัพธ์ได้โดยตรงเนื่องจากผู้เข้าชมแตกต่างกันจำนวนหน่วยการเล่นเกมจะแตกต่างกัน ฉันกำลังมองหาข้อเสนอแนะเพื่อแยกตัวแปร 'การชำระเงินสด' หรืออาจเป็นแนวทางอื่นทั้งหมด

1
คุณสมบัติที่พึงประสงค์และไม่พึงประสงค์ของสี่เหลี่ยมละตินในการทดลอง?
การค้นหาคร่าวๆพบว่าสี่เหลี่ยมละตินถูกนำมาใช้อย่างกว้างขวางในการออกแบบการทดลอง ในช่วงปริญญาเอกของฉันฉันได้ศึกษาคุณสมบัติทางทฤษฎีต่าง ๆ ของละตินสแควร์ (จาก combinatorics มุมมองของ -) แต่ไม่มีความเข้าใจอย่างลึกซึ้งว่ามันเกี่ยวกับสี่เหลี่ยมละตินที่ทำให้พวกเขาเหมาะกับการออกแบบการทดลอง ฉันเข้าใจว่าสี่เหลี่ยมลาตินนั้นดีที่ช่วยให้นักสถิติสามารถศึกษาสถานการณ์ได้อย่างมีประสิทธิภาพซึ่งมีสองปัจจัยที่แตกต่างกันใน "ทิศทาง" ที่แตกต่างกัน แต่ฉันก็ค่อนข้างมั่นใจว่าจะมีเทคนิคอื่น ๆ อีกมากมายที่สามารถใช้ได้ โดยเฉพาะอย่างยิ่งเกี่ยวกับสี่เหลี่ยมละตินที่ทำให้เหมาะกับการออกแบบการทดลองมากน้อยเพียงใดการออกแบบอื่นไม่มี นอกจากนี้ยังมีสี่เหลี่ยมละตินจำนวนหนึ่งให้เลือกดังนั้นคุณเลือกสี่เหลี่ยมละตินใด ฉันเข้าใจว่าการเลือกหนึ่งแบบสุ่มเป็นสิ่งสำคัญ แต่ก็ยังคงมีสี่เหลี่ยมจัตุรัสละตินบางอันที่ไม่เหมาะกับการเรียกใช้การทดลองมากกว่าคนอื่น ๆ (เช่นตาราง Cayley ของกลุ่มวงจร) นี่ทำให้เกิดคำถามต่อไปนี้ คุณสมบัติของสี่เหลี่ยมละตินนั้นเป็นที่ต้องการและคุณสมบัติของสี่เหลี่ยมละตินนั้นไม่เป็นที่ต้องการสำหรับการออกแบบการทดลอง
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.