คำถามติดแท็ก ancova

การวิเคราะห์ความแปรปรวนร่วม นี่เป็นกรณีพิเศษของการถดถอยเชิงเส้นแบบพหุคูณซึ่งใช้ในการตั้งค่าแบบ ANOVA ที่มีความแปรปรวนร่วมต่อเนื่องบางชนิดนอกเหนือจากการถดถอยเชิงหมวดหมู่

5
แนวปฏิบัติที่ดีที่สุดเมื่อวิเคราะห์การออกแบบการควบคุมการรักษาก่อนโพสต์
ลองนึกภาพการออกแบบทั่วไปต่อไปนี้: ผู้เข้าร่วม 100 คนจะถูกจัดสรรแบบสุ่มให้กับการรักษาหรือกลุ่มควบคุม ตัวแปรตามคือตัวเลขและวัดก่อนและหลังการรักษา สามตัวเลือกที่ชัดเจนสำหรับการวิเคราะห์ข้อมูลดังกล่าวคือ: ทดสอบกลุ่มตามผลการโต้ตอบเวลาใน ANOVA ผสม ทำ ANCOVA โดยมีเงื่อนไขเหมือนกับ IV และการวัดล่วงหน้าเป็น covariate และ post post เป็น DV ทำการทดสอบ t โดยมีเงื่อนไขว่าเป็น IV และโพสต์คะแนนการเปลี่ยนแปลงล่วงหน้าเป็น DV คำถาม: วิธีที่ดีที่สุดในการวิเคราะห์ข้อมูลดังกล่าวคืออะไร? มีเหตุผลที่จะชอบวิธีหนึ่งมากกว่าอีกวิธีหนึ่งหรือไม่?

2
การถดถอยแบบหลายครั้งสามารถ“ ควบคุม” ตัวแปรได้อย่างไร
เราทุกคนคุ้นเคยกับการศึกษาเชิงสังเกตการณ์ที่พยายามสร้างการเชื่อมโยงเชิงสาเหตุระหว่างตัวทำนาย X แบบไม่มีการสุ่มกับผลลัพธ์โดยรวมถึงผู้ที่อาจเกิดขึ้นได้ทั้งหมดในรูปแบบการถดถอยหลายแบบ ด้วยเหตุนี้“ การควบคุมเพื่อ” ผู้รบกวนทุกคนการโต้แย้งจึงทำให้เราแยกผลของตัวทำนายผลประโยชน์ ฉันกำลังพัฒนาความรู้สึกไม่สบายที่เพิ่มขึ้นด้วยความคิดนี้โดยส่วนใหญ่อ้างอิงจากคำพูดที่ไม่ได้ทำโดยอาจารย์ของชั้นเรียนสถิติของฉัน พวกเขาตกอยู่ในประเภทหลักสองสาม: 1. คุณสามารถควบคุมค่าความแปรปรวนร่วมที่คุณคิดและวัดได้เท่านั้น นี่เป็นสิ่งที่ชัดเจน แต่ฉันสงสัยว่าจริงๆแล้วมันอันตรายที่สุดและไม่สามารถเอาชนะได้ทั้งหมด 2. วิธีการได้นำไปสู่ข้อผิดพลาดที่น่าเกลียดในอดีต ยกตัวอย่างเช่นPetitti & Freedman (2005)อภิปรายว่าการศึกษาเชิงสังเกตการณ์ที่ปรับค่าทางสถิติมานานหลายทศวรรษได้ผลสรุปที่ไม่ถูกต้องเกี่ยวกับผลของการบำบัดทดแทนฮอร์โมนต่อความเสี่ยงของโรคหัวใจ ภายหลัง RCTs พบผลกระทบที่ตรงกันข้ามเกือบ 3. ความสัมพันธ์ของตัวทำนายผลสามารถทำงานได้อย่างแปลกประหลาดเมื่อคุณควบคุมผู้ร่วมทุน Yu-Kang Tu, Gunnell, & Gilthorpe (2008) หารือเกี่ยวกับอาการที่แตกต่างกันบางอย่างรวมถึงความขัดแย้งของลอร์ด, ความขัดแย้งของซิมป์สันและตัวแปรต้าน 4. เป็นการยากสำหรับแบบจำลองเดียว (การถดถอยแบบหลายจุด) เพื่อปรับให้เพียงพอสำหรับ covariates และแบบจำลองความสัมพันธ์ของผลลัพธ์ของตัวทำนายพร้อมกัน ฉันเคยได้ยินเรื่องนี้เป็นเหตุผลสำหรับความเหนือกว่าของวิธีการเช่นคะแนนความชอบและการแบ่งชั้นของผู้สับสน แต่ฉันไม่แน่ใจว่าฉันเข้าใจจริงๆ 5. แบบจำลองของ ANCOVA กำหนดให้ค่าความแปรปรวนร่วมและตัวทำนายความสนใจเป็นอิสระ แน่นอนว่าเราปรับสำหรับคนสับสนเพราะแม่นยำเพราะสัมพันธ์กับตัวทำนายความสนใจดังนั้นดูเหมือนว่าแบบจำลองจะไม่ประสบความสำเร็จในกรณีที่แน่นอนเมื่อเราต้องการมันมากที่สุด อาร์กิวเมนต์ไปที่การปรับที่เหมาะสมสำหรับการลดเสียงรบกวนในการทดลองแบบสุ่มเท่านั้น Miller & Chapman, 2001ให้รีวิวที่ยอดเยี่ยม ดังนั้นคำถามของฉันคือ: …

4
โควาเรียตที่ไม่มีนัยสำคัญทางสถิติควร 'เก็บไว้ใน' เมื่อสร้างแบบจำลองหรือไม่?
ฉันมีโควาเรียร์หลายตัวในการคำนวณแบบจำลองและไม่ใช่ทั้งหมดที่มีนัยสำคัญทางสถิติ ฉันควรลบสิ่งที่ไม่ใช่หรือไม่ คำถามนี้อธิบายถึงปรากฏการณ์ แต่ไม่ตอบคำถามของฉัน: จะตีความผลกระทบที่ไม่สำคัญของ covariate ใน ANCOVA อย่างไร ไม่มีอะไรในคำตอบสำหรับคำถามนั้นที่ชี้ให้เห็นว่ามีการแปรผันที่ไม่สำคัญออกไปแม้ว่าตอนนี้ฉันมีแนวโน้มที่จะเชื่อว่าพวกเขาควรจะอยู่ต่อไปก่อนที่จะอ่านคำตอบนั้น ยังสามารถอธิบายความแปรปรวนบางอย่าง (และช่วยให้แบบจำลอง) โดยไม่จำเป็นต้องอธิบายจำนวนเกินกว่าขีด จำกัด บางอย่าง (ค่าขีด จำกัด นัยสำคัญซึ่งฉันเห็นว่าไม่สามารถใช้ได้กับ covariates) มีอีกคำถามหนึ่งในประวัติย่อที่คำตอบดูเหมือนจะบ่งบอกว่า covariates ควรเก็บไว้โดยไม่คำนึงถึงความสำคัญ แต่ก็ไม่ชัดเจนในเรื่องนั้น (ฉันต้องการเชื่อมโยงกับคำถามนั้น แต่ฉันไม่สามารถติดตามได้อีกในตอนนี้) ดังนั้น ... โควาเรียต์ที่ไม่แสดงว่ามีนัยสำคัญทางสถิติควรถูกเก็บไว้ในการคำนวณสำหรับโมเดลหรือไม่? (ฉันได้แก้ไขคำถามนี้เพื่อชี้แจงว่า covariates ไม่เคยอยู่ในรูปแบบผลลัพธ์โดยการคำนวณอยู่ดี) หากต้องการเพิ่มความซับซ้อนจะเกิดอะไรขึ้นถ้าค่าความแปรปรวนร่วมมีความสำคัญทางสถิติสำหรับชุดย่อยบางส่วนของข้อมูล (ชุดย่อยที่ต้องดำเนินการแยกต่างหาก) ฉันจะเริ่มต้นที่จะรักษา covariate มิฉะนั้นจะต้องใช้โมเดลที่แตกต่างกันหรือคุณจะมี covariate ที่มีนัยสำคัญทางสถิติหายไปในกรณีใดกรณีหนึ่ง หากคุณมีคำตอบสำหรับคดีแยกนี้เช่นกันโปรดพูดถึงมัน

1
องศาอิสระเป็นหมายเลขที่ไม่ใช่จำนวนเต็มหรือไม่
เมื่อฉันใช้ GAM มันให้ DF ที่เหลือกับฉันคือ (บรรทัดสุดท้ายในรหัส) นั่นหมายความว่าอย่างไร? นอกเหนือไปจากตัวอย่างของ GAM โดยทั่วไปแล้วจำนวนองศาความเป็นอิสระจะเป็นจำนวนที่ไม่ใช่จำนวนเต็มหรือไม่26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 1.2445 6.0516 (Dispersion Parameter for gaussian family taken to be 6.6717) Null Deviance: 1126.047 on 31 degrees …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

6
เป็นทรัพยากรที่ดีที่จะเข้าใจ ANOVA และ ANCOVA หรือไม่
ฉันกำลังทำการทดลองสำหรับกระดาษและฉันกำลังมองหาหนังสือ / เว็บไซต์ที่น่าสนใจเพื่อทำความเข้าใจอย่างถูกต้องว่า ANOVA และ ANCOVA ทำงานอย่างไร ฉันมีพื้นฐานทางคณิตศาสตร์ที่ดีดังนั้นฉันไม่จำเป็นต้องมีคำอธิบายที่หยาบคาย ฉันต้องการทราบวิธีพิจารณาว่าจะใช้ ANOVA แทน ANCOVA เมื่อใด

3
เมื่อใดที่ควรใช้การถดถอยแบบหลายครั้งพร้อมการเข้ารหัสแบบดัมมี่กับ ANCOVA
เมื่อเร็ว ๆ นี้ฉันวิเคราะห์การทดสอบที่จัดการกับตัวแปรเด็ดขาด 2 อันและอีกหนึ่งตัวแปรต่อเนื่องโดยใช้ ANCOVA อย่างไรก็ตามผู้ตรวจทานแนะนำว่าการถดถอยหลายครั้งด้วยตัวแปรเด็ดขาดที่เข้ารหัสเป็นตัวแปรดัมมี่เป็นการทดสอบที่เหมาะสมกว่าสำหรับการทดสอบด้วยตัวแปรเด็ดขาดและต่อเนื่อง เมื่อใดจึงจะเหมาะสมที่จะใช้ ANCOVA กับการถดถอยหลายครั้งพร้อมตัวแปรจำลองและฉันควรพิจารณาปัจจัยใดบ้างในการเลือกระหว่างการทดสอบทั้งสอง ขอขอบคุณ.

4
ตัวอย่างข้อมูลที่ดีจำเป็นต้องใช้กับ covariate รับผลกระทบจากการรักษา
ฉันได้ดูชุดข้อมูล R จำนวนมากการโพสต์ใน DASL และที่อื่น ๆ และฉันไม่พบตัวอย่างที่ดีของชุดข้อมูลที่น่าสนใจมากมายที่แสดงการวิเคราะห์ความแปรปรวนร่วมสำหรับข้อมูลการทดลอง มีชุดข้อมูล "ของเล่น" จำนวนมากที่มีข้อมูลที่ประดิษฐ์ไว้ในตำราเรียน ฉันต้องการตัวอย่างที่: ข้อมูลเป็นของจริงพร้อมเรื่องราวที่น่าสนใจ มีปัจจัยการรักษาอย่างน้อยหนึ่งปัจจัยและสองตัวแปรร่วม covariate อย่างน้อยหนึ่งตัวได้รับผลกระทบจากปัจจัยการรักษาอย่างน้อยหนึ่งอย่างและอย่างใดอย่างหนึ่งไม่ได้รับผลกระทบจากการรักษา ทดลองมากกว่าการสังเกตโดยเฉพาะอย่างยิ่ง พื้นหลัง เป้าหมายที่แท้จริงของฉันคือการหาตัวอย่างที่ดีในการเขียนบทความสั้น ๆ สำหรับแพ็คเกจ R ของฉัน แต่เป้าหมายที่ใหญ่กว่าคือผู้คนจำเป็นต้องเห็นตัวอย่างที่ดีเพื่อแสดงให้เห็นถึงความกังวลที่สำคัญในการวิเคราะห์ความแปรปรวนร่วม พิจารณาสถานการณ์ที่สร้างขึ้นต่อไปนี้ (และโปรดเข้าใจว่าความรู้ของฉันเกี่ยวกับการเกษตรเป็นเรื่องที่ตื้นที่สุด) เราทำการทดลองที่ปุ๋ยถูกสุ่มไปยังแปลงและปลูกพืช หลังจากระยะเวลาการเจริญเติบโตที่เหมาะสมเราเก็บเกี่ยวพืชผลและวัดลักษณะคุณภาพ - นั่นคือตัวแปรตอบสนอง แต่เรายังบันทึกปริมาณน้ำฝนทั้งหมดในช่วงที่ปลูกและความเป็นกรดของดินในช่วงที่มีการเก็บเกี่ยว - และแน่นอนว่ามีการใช้ปุ๋ย ดังนั้นเราจึงมีโควาเรียสองตัวและการบำบัด วิธีปกติในการวิเคราะห์ข้อมูลที่ได้จะเป็นแบบจำลองเชิงเส้นตรงกับการรักษาเป็นปัจจัยและผลเสริมสำหรับ covariates จากนั้นจะสรุปผลลัพธ์หนึ่งคำสั่ง "ปรับหมายถึง" (AKA หมายถึงกำลังสองน้อยที่สุด) ซึ่งเป็นการทำนายจากแบบจำลองสำหรับแต่ละปุ๋ยที่ปริมาณน้ำฝนเฉลี่ยและความเป็นกรดของดินเฉลี่ย 3 สิ่งนี้ทำให้ทุกอย่างเท่าเทียมกันเพราะเมื่อเราเปรียบเทียบผลลัพธ์เหล่านี้เรามีปริมาณน้ำฝนและค่าความเป็นกรดคงที่ แต่นี่อาจเป็นสิ่งที่ผิดที่ต้องทำเพราะปุ๋ยอาจส่งผลกระทบต่อความเป็นกรดของดินรวมถึงการตอบสนอง สิ่งนี้ทำให้การปรับหมายถึงทำให้เข้าใจผิดเพราะผลการรักษารวมถึงผลกระทบต่อความเป็นกรด วิธีหนึ่งในการจัดการสิ่งนี้คือการเอากรดออกจากแบบจำลองจากนั้นวิธีการปรับปริมาณน้ำฝนจะให้การเปรียบเทียบที่เป็นธรรม แต่ถ้าความเป็นกรดมีความสำคัญความเป็นธรรมนี้มาพร้อมกับราคาที่ดีในการเพิ่มความแปรปรวนที่เหลือ มีวิธีแก้ไขโดยใช้ความเป็นกรดที่ปรับแล้วในแบบจำลองแทนที่จะเป็นค่าดั้งเดิม การปรับปรุงที่จะเกิดขึ้นในแพคเกจ R ฉันlsmeansจะทำให้เรื่องนี้อย่างจริงจังง่าย …

4
วิธีการทำ ANCOVA ใน R
ฉันต้องการทำการวิเคราะห์ ANCOVA ของข้อมูลที่เกี่ยวข้องกับความหนาแน่นของ epiphytes ของพืช ตอนแรกฉันอยากจะรู้ว่ามีความแตกต่างของความหนาแน่นของพืชระหว่างสองลาดหนึ่ง N และหนึ่ง S แต่ฉันมีข้อมูลอื่น ๆ เช่นระดับความสูงการเปิดกว้างของหลังคาและความสูงของพืชโฮสต์ ฉันรู้ว่าโควาเรียตของฉันจะต้องเป็นเนินเขาทั้งสอง (N และ S) ฉันสร้างแบบจำลองนี้ที่ทำงานใน R และแม้ว่าฉันจะไม่รู้ว่ามันทำงานได้ดีหรือไม่ นอกจากนี้ผมอยากจะรู้ว่าสิ่งที่แตกต่างคือถ้าผมใช้สัญลักษณ์หรือ+* model1 <- aov(density~slope+altitude+canopy+height) summary(model1) model1
17 r  ancova 

1
วิธีการเลือกระหว่าง ANOVA และ ANCOVA ในการทดลองออกแบบ?
ฉันกำลังทำการทดลองซึ่งมีสิ่งต่อไปนี้: DV: ปริมาณการใช้ชิ้น (ต่อเนื่องหรืออาจจัดเป็นหมวดหมู่) IV: ข้อความเพื่อสุขภาพ, ข้อความที่ไม่แข็งแรง, ไม่มีข้อความ (กลุ่มควบคุม) (3 กลุ่มที่ผู้คนได้รับมอบหมายแบบสุ่ม - หมวดหมู่) นี่คือข้อความที่จัดการเกี่ยวกับความสมบูรณ์ของชิ้น ตัวแปร IV ต่อไปนี้ถือได้ว่าเป็นตัวแปรที่แตกต่างของแต่ละบุคคล: Impulsivity (ซึ่งอาจเป็นหมวดหมู่เช่น. สูงเทียบกับต่ำหรือต่อเนื่องและวัดโดยขนาด) การตั้งค่ารสหวาน (นอกจากนี้ยังวัดโดยแบบสอบถามซึ่งมี 3 ตัวเลือกให้เลือกสำหรับแต่ละคำถาม) ค่าดัชนีมวลกาย - ผู้เข้าร่วมจะได้รับการชั่งน้ำหนักวัดตาม (ซึ่งอาจพิจารณาได้ทั้งหมวดหมู่หรือต่อเนื่อง) เนื่องจากกลุ่มจะได้รับการสุ่มให้เป็นหนึ่งใน 3 กลุ่มฉันคิดว่าฉันกำลังทำ ANOVA บางประเภทและอาจใช้ Factorial ANOVA เนื่องจากฉันสนใจว่า IV มีผลต่อ DV มากที่สุด แต่ยังมีปฏิสัมพันธ์ระหว่าง IV ด้วยเช่นกัน มีความสัมพันธ์ระหว่างชุดค่าผสมบางอย่าง แต่ฉันไม่แน่ใจในเรื่องนี้อย่างสมบูรณ์เนื่องจากต้องการทราบว่าเป็นการดีที่สุดหรือไม่ที่จะให้ IV มีหมวดหมู่ทั้งหมดหรือต่อเนื่องหรือผสมกัน หรือ ANCOVA เป็นไปได้หรือแม้กระทั่งการถดถอย …

1
สมมติฐานของโมเดลเชิงเส้นทั่วไป
ฉันสร้างโมเดลเชิงเส้นแบบทั่วไปพร้อมตัวแปรตอบกลับเดียว (กระจายต่อเนื่อง / ปกติ) และตัวแปรอธิบาย 4 ตัว (3 ตัวซึ่งเป็นปัจจัยและตัวที่สี่คือจำนวนเต็ม) ฉันใช้การแจกแจงข้อผิดพลาดแบบเกาส์กับฟังก์ชั่นลิงค์ตัวตนแล้ว ขณะนี้ฉันกำลังตรวจสอบว่าแบบจำลองเป็นไปตามสมมติฐานของโมเดลเชิงเส้นทั่วไปซึ่ง ได้แก่ : ความเป็นอิสระของ Y ฟังก์ชั่นลิงค์ที่ถูกต้อง สเกลที่ถูกต้องของการวัดตัวแปรอธิบาย ไม่มีข้อสังเกตที่มีอิทธิพล คำถามของฉันคือฉันจะตรวจสอบว่าแบบจำลองตรงตามสมมติฐานเหล่านี้ได้อย่างไร ดูเหมือนว่าจุดเริ่มต้นที่ดีที่สุดคือการวางแผนการตอบสนองต่อตัวแปรอธิบายแต่ละตัว อย่างไรก็ตามตัวแปรอธิบาย 3 ตัวนั้นจัดอยู่ในหมวดหมู่ (ที่มีระดับ 1-4) ดังนั้นฉันควรมองหาอะไรในแปลง นอกจากนี้ฉันต้องตรวจสอบความหลากหลายและความสัมพันธ์ระหว่างตัวแปรอธิบายหรือไม่? ถ้าใช่ฉันจะทำสิ่งนี้กับตัวแปรอธิบายอย่างละเอียดได้อย่างไร

4
โพสต์การทดสอบใน ANCOVA
คำถาม: วิธีการที่ดีในการดำเนินการทดสอบหลังความแตกต่างระหว่างกลุ่มหมายถึงหลังจากการปรับผลกระทบของ covariate คืออะไร? ตัวอย่างต้นแบบ: สี่กลุ่มผู้เข้าร่วม 30 คนต่อกลุ่ม (เช่นประชากรจิตวิทยาคลินิกสี่คน) ตัวแปรตามคือตัวเลข (เช่นคะแนนเชาวน์ปัญญา) Covariate เป็นตัวเลข (เช่นดัชนีสถานะทางเศรษฐกิจและสังคม) คำถามวิจัยเกี่ยวข้องว่าคู่ของกลุ่มใดมีความแตกต่างอย่างมีนัยสำคัญกับตัวแปรตามหลังจากการควบคุมสำหรับค่า covariate คำถามที่เกี่ยวข้อง : วิธีการที่ต้องการคืออะไร? มีการนำไปใช้งานอะไรบ้างใน R มีการอ้างอิงทั่วไปเกี่ยวกับวิธีการเปลี่ยนแปลงของโควารีเอตสำหรับการดำเนินการทดสอบโพสต์เฉพาะกิจหรือไม่?

1
ฉันจะรวมเอานวัตกรรมล้ำสมัยที่การสังเกตที่ 48 ในโมเดล ARIMA ของฉันได้อย่างไร
ฉันกำลังทำงานกับชุดข้อมูล หลังจากใช้เทคนิคการระบุตัวแบบบางอย่างฉันก็ออกมาพร้อมกับแบบจำลอง ARIMA (0,2,1) ผมใช้detectIOฟังก์ชั่นในแพคเกจTSAในการวิจัยที่จะตรวจพบนวัตกรรมขอบเขต (IO) ที่สังเกต 48th ของชุดข้อมูลเดิมของฉัน ฉันจะรวมค่าผิดปกตินี้ไว้ในแบบจำลองของฉันเพื่อที่ฉันจะสามารถใช้เพื่อวัตถุประสงค์ในการพยากรณ์ได้อย่างไร ฉันไม่ต้องการใช้แบบจำลอง ARIMAX เนื่องจากฉันอาจไม่สามารถคาดการณ์ได้จากสิ่งนั้นใน R มีวิธีอื่นที่ฉันสามารถทำได้หรือไม่ นี่คือค่านิยมของฉันตามลำดับ: VALUE <- scan() 4.6 4.5 4.4 4.5 4.4 4.6 4.7 4.6 4.7 4.7 4.7 5.0 5.0 4.9 5.1 5.0 5.4 5.6 5.8 6.1 6.1 6.5 6.8 7.3 7.8 8.3 8.7 9.0 9.4 9.5 9.5 …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
เป็นที่ยอมรับหรือไม่ที่เรียกใช้โมเดลเชิงเส้นสองชุดในชุดข้อมูลเดียวกัน
สำหรับการถดถอยเชิงเส้นที่มีหลายกลุ่ม (กลุ่มธรรมชาติที่กำหนดเบื้องต้น) เป็นที่ยอมรับหรือไม่ที่จะเรียกใช้สองรุ่นที่แตกต่างกันในชุดข้อมูลเดียวกันเพื่อตอบคำถามสองข้อต่อไปนี้ แต่ละกลุ่มมีความชันที่ไม่เป็นศูนย์และการสกัดกั้นที่ไม่ใช่ศูนย์และพารามิเตอร์สำหรับแต่ละกลุ่มภายในการถดถอยกลุ่มคืออะไร? มีไม่ว่าจะเป็นสมาชิกกลุ่มแนวโน้มที่ไม่เป็นศูนย์และการสกัดกั้นที่ไม่เป็นศูนย์หรือไม่และพารามิเตอร์สำหรับการถดถอยแบบกลุ่มนี้คืออะไร? ใน R, รุ่นแรกจะเป็นเพื่อให้ค่าสัมประสิทธิ์ประมาณอาจตีความได้โดยตรงขณะที่ตัดและความลาดชันสำหรับแต่ละรุ่นที่สองจะเป็นlm(y ~ group + x:group - 1) group.Thelm(y ~ x + 1) ทางเลือกจะเป็นlm(y ~ x + group + x:group + 1)ซึ่งส่งผลในตารางสรุปค่าสัมประสิทธิ์ที่ซับซ้อนภายในกลุ่มลาดและดักต้องคำนวณจากความแตกต่างในลาดและดักจากการอ้างอิงบางส่วน นอกจากนี้คุณต้องเรียงลำดับกลุ่มใหม่และเรียกใช้แบบจำลองเป็นครั้งที่สองต่อไปเพื่อรับค่า p สำหรับความแตกต่างของกลุ่มสุดท้าย (บางครั้ง) สิ่งนี้ใช้สองรุ่นแยกกันส่งผลเสียต่อการอนุมานในทางใดทางหนึ่งหรือการปฏิบัติตามมาตรฐานนี้หรือไม่? ในการพิจารณาเรื่องนี้ให้พิจารณาว่า x เป็นปริมาณยาและกลุ่มที่มีเชื้อชาติต่างกัน อาจเป็นเรื่องที่น่าสนใจที่จะทราบความสัมพันธ์ของการตอบสนองต่อขนาดยาสำหรับแพทย์เฉพาะทางหรือยาที่ใช้ในการแข่งขัน แต่บางครั้งก็น่าสนใจที่จะทราบความสัมพันธ์ของการตอบสนองต่อยาสำหรับประชากรทั้งหมด (มนุษย์) โดยไม่คำนึงถึงเชื้อชาติสำหรับเจ้าหน้าที่สาธารณสุข นี่เป็นเพียงตัวอย่างของวิธีการที่คนอาจสนใจทั้งภายในกลุ่มและระหว่างการถดถอยกลุ่ม ความสัมพันธ์ระหว่างปริมาณและการตอบสนองควรเป็นเชิงเส้นหรือไม่ไม่ใช่สิ่งสำคัญ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.