คำถามติดแท็ก r

ใช้แท็กนี้สำหรับคำถาม * on-topic * ที่ (a) เกี่ยวข้องกับ `R` ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่เพียงแค่ * เกี่ยวกับวิธีการใช้` R '

1
การถดถอยโลจิสติก glmnet สามารถจัดการตัวแปรตัวประกอบ (หมวดหมู่) ได้โดยตรงโดยไม่ต้องใช้ตัวแปรจำลองหรือไม่? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน3 ปีที่ผ่านมา ฉันกำลังสร้างการถดถอยโลจิสติกใน R โดยใช้วิธี LASSO ด้วยฟังก์ชั่นcv.glmnetสำหรับการเลือกlambdaและglmnetสำหรับรุ่นสุดท้าย ฉันรู้ข้อเสียทั้งหมดเกี่ยวกับการเลือกรุ่นอัตโนมัติแล้ว แต่ฉันต้องทำต่อไป ปัญหาของฉันคือฉันต้องรวมตัวแปรปัจจัย (หมวดหมู่) ในแบบจำลองมีวิธีใดที่จะทำได้โดยไม่ต้องสร้างตัวแปรจำลองจำนวนมากหรือไม่ ตัวแปรนี้เกือบทุกสายและไม่ใช่ตัวเลข

1
เอฟเฟกต์แบบสุ่มด้วยการสังเกตเพียง 1 ครั้งจะส่งผลอย่างไรต่อโมเดลเชิงเส้นผสมทั่วไป
ฉันมีชุดข้อมูลที่ตัวแปรที่ฉันต้องการใช้เป็นเอฟเฟกต์แบบสุ่มมีการสังเกตเพียงครั้งเดียวสำหรับบางระดับ จากคำตอบของคำถามก่อนหน้านี้ฉันได้รวบรวมว่าโดยหลักการแล้วสิ่งนี้สามารถทำได้ ฉันสามารถใส่โมเดลผสมกับวัตถุที่มีเพียง 1 การสังเกตได้หรือไม่ โมเดลดักจับแบบสุ่ม - หนึ่งการวัดต่อหนึ่งเรื่อง อย่างไรก็ตามในลิงค์ที่สองคำตอบแรกจะระบุว่า: "... สมมติว่าคุณไม่ได้ใช้GLMMรุ่นผสมเชิงเส้นทั่วไปที่ในกรณีนั้นปัญหาของการกระจายตัวเกินเข้ามาเล่น" ฉันกำลังพิจารณาใช้ GLMM แต่ฉันไม่เข้าใจจริงๆว่าระดับเอฟเฟกต์แบบสุ่มด้วยการสังเกตเพียงครั้งเดียวจะส่งผลกระทบต่อโมเดลได้อย่างไร นี่คือตัวอย่างหนึ่งในโมเดลที่ฉันพยายามทำ ฉันกำลังศึกษานกและฉันต้องการจำลองผลกระทบของประชากรและฤดูกาลตามจำนวนการหยุดระหว่างการย้ายถิ่น ฉันต้องการใช้เอฟเฟกต์แบบสุ่มเพราะสำหรับบางคนฉันมีข้อมูลมากถึง 5 ปี library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", …

3
CDF ปกติใดของการแจกแจงแบบแปรผันตามตัวแปรสุ่มเบต้า
สมมติว่าคุณกำหนด: X∼Beta(α,β)X∼Beta(α,β)X\sim\mbox{Beta}(\alpha,\beta) Y∼Φ−1(X)Y∼Φ−1(X)Y\sim \Phi^{-1}(X) ที่Φ−1Φ−1\Phi^{-1}เป็นสิ่งที่ตรงกันข้ามของCDF ของการกระจายแบบปกติมาตรฐาน คำถามของฉันคือมีการกระจายง่ายที่YYYต่อไปนี้หรือที่สามารถใกล้เคียงกับYYY ? ฉันถามเพราะฉันสงสัยอย่างมากจากผลการจำลอง (แสดงด้านล่าง) ที่YYYเปลี่ยนเป็นการแจกแจงแบบปกติเมื่อαα\alphaและββ\betaสูง แต่ฉันไม่รู้ว่าทำไมมันถึงเป็นคณิตศาสตร์ (แน่นอนว่าเมื่อα=1;β=1α=1;β=1\alpha=1;\beta=1 , XXXจะเหมือนกันและYYYจะเป็นมาตรฐานปกติ แต่ทำไมมันจะเป็นจริงสำหรับค่าที่สูงขึ้น?) หากไม่มาบรรจบกันเพื่อปกติสิ่งที่จะพารามิเตอร์ของการที่เป็นปกติในแง่ของαα\alphaและββ\beta ? (ฉันคาดหวังว่าค่าเฉลี่ยจะเป็นΦ−1(αα+β)Φ−1(αα+β)\Phi^{-1}(\frac{\alpha}{\alpha+\beta})เนื่องจากเป็นการเปลี่ยนแปลงของโหมด แต่ฉันไม่รู้ค่าเบี่ยงเบนมาตรฐาน) (วางวิธีอื่นนี้อาจจะถามว่า "ไม่Φ(Norm(μ,σ))Φ(Norm(μ,σ))\Phi(\mbox{Norm}(\mu, \sigma))บรรจบกับการกระจายเบต้าสำหรับทิศทางของบางμμ\muและσσ\sigma " ผมไม่แน่ใจว่าไม่ว่าจะเป็นเรื่องง่ายที่จะตอบ) ผลการจำลอง ที่นี่ฉันแสดงเหตุผลที่ฉันสงสัยว่าผลที่ได้เป็นเรื่องปกติ (เนื่องจากฉันไม่สามารถสำรองด้วยคณิตศาสตร์) การจำลองการสามารถทำได้ใน R กับและ ตัวอย่างเช่นการเลือกพารามิเตอร์สูงα = 3000และβ = 7000 :YYYqnormrnormα=3000α=3000\alpha=3000β=7000β=7000\beta=7000 hist(qnorm(rbeta(5000, 3000, 7000))) สิ่งนี้ดูปกติqqnormและการทดสอบ Shapiro-Wilk (ซึ่งปกติคือสมมุติฐานว่าง) แนะนำเช่น: qqnorm(qnorm(rbeta(5000, 3000, 7000))) shapiro.test(qnorm(rbeta(5000, 3000, 7000))) …

2
ผลลัพธ์ที่แตกต่างจาก RandomForest ผ่าน caret และแพ็คเกจ RandomForest พื้นฐาน
ฉันสับสนเล็กน้อย: ผลลัพธ์ของโมเดลที่ได้รับการฝึกอบรมผ่านคาเร็ตจะแตกต่างจากโมเดลในแพ็คเกจดั้งเดิมอย่างไร ฉันอ่านว่าจำเป็นต้องมีการประมวลผลล่วงหน้าก่อนการทำนายด้วย FinalModel ของ RandomForest พร้อมชุดคาเร็ตหรือไม่? แต่ฉันไม่ได้ใช้ preprocessing ใด ๆ ที่นี่ ฉันฝึกป่าสุ่มที่แตกต่างกันโดยใช้ชุดคาเร็ตและปรับแต่งค่า mtry ที่แตกต่างกัน > cvCtrl = trainControl(method = "repeatedcv",number = 10, repeats = 3, classProbs = TRUE, summaryFunction = twoClassSummary) > newGrid = expand.grid(mtry = c(2,4,8,15)) > classifierRandomForest = train(case_success ~ ., data = train_data, trControl = cvCtrl, …

1
จาก exp (สัมประสิทธิ์) ถึงอัตราต่อรองและการตีความใน Logistic Regression พร้อมปัจจัย
ฉันใช้การถดถอยเชิงเส้นตรงของการยอมรับเข้าเรียนในวิทยาลัยกับคะแนน SAT และภูมิหลังของครอบครัว / ชาติพันธุ์ ข้อมูลเป็นตัวละคร นี่คือการติดตามคำถามก่อนหน้านี้ตอบแล้ว คำถามที่มุ่งเน้นในการรวบรวมและการตีความอัตราส่วนอัตราต่อรองเมื่อออกจาก SAT คะแนนกันเพื่อความเรียบง่าย ตัวแปรคือAccepted(0 หรือ 1) และBackground("red" หรือ "blue") ฉันตั้งค่าข้อมูลเพื่อให้ผู้คนในพื้นหลัง "สีแดง" มีแนวโน้มที่จะเข้าไป: fit <- glm(Accepted~Background, data=dat, family="binomial") exp(cbind(Odds_Ratio_RedvBlue=coef(fit), confint(fit))) Odds_Ratio_RedvBlue 2.5 % 97.5 % (Intercept) 0.7088608 0.5553459 0.9017961 Backgroundred 2.4480042 1.7397640 3.4595454 คำถาม: 0.7 เป็นอัตราส่วนที่ผิดปกติของบุคคลที่มีพื้นหลังเป็น "สีน้ำเงิน" หรือไม่? ฉันถามสิ่งนี้เพราะฉันได้รับ 0.7 " Backgroundblue" ถ้าฉันเรียกใช้รหัสต่อไปนี้แทน: fit …
14 r  regression  logistic 

3
วิธีการคำนวณการทับซ้อนระหว่างความหนาแน่นของความน่าจะเป็นเชิงประจักษ์
ฉันกำลังมองหาวิธีการคำนวณพื้นที่ทับซ้อนระหว่างการประมาณความหนาแน่นเคอร์เนลสองตัวใน R เป็นการวัดความคล้ายคลึงกันระหว่างสองตัวอย่าง เพื่อชี้แจงในตัวอย่างต่อไปนี้ฉันจะต้องหาปริมาณของพื้นที่ที่ทับซ้อนกันของสีม่วง: library(ggplot2) set.seed(1234) d <- data.frame(variable=c(rep("a", 50), rep("b", 30)), value=c(rnorm(50), runif(30, 0, 3))) ggplot(d, aes(value, fill=variable)) + geom_density(alpha=.4, color=NA) มีการอภิปรายคำถามที่คล้ายกันที่นี่ความแตกต่างที่ฉันต้องทำสำหรับข้อมูลเชิงประจักษ์โดยพลการมากกว่าการแจกแจงปกติที่กำหนดไว้ล่วงหน้า overlapแพคเกจที่อยู่คำถามนี้ แต่เห็นได้ชัดเฉพาะข้อมูลการประทับเวลาซึ่งไม่ทำงานสำหรับฉัน ดัชนี Bray-Curtis (ตามการนำไปใช้ในฟังก์ชั่นveganของบรรจุภัณฑ์vegdist(method="bray")) ก็มีความเกี่ยวข้องเช่นกัน แต่สำหรับข้อมูลที่แตกต่างกันบ้าง ฉันสนใจทั้งวิธีการทางทฤษฎีและฟังก์ชัน R ที่ฉันอาจใช้เพื่อนำไปใช้

1
การทดสอบอัตราส่วนความน่าจะเป็น - lmer R - โมเดลที่ไม่ซ้อนกัน
ฉันกำลังตรวจสอบงานบางอย่างและได้พบกับสิ่งต่อไปนี้ซึ่งดูเหมือนว่าผิดสำหรับฉัน รุ่นสองแบบผสมถูกติดตั้ง (ใน R) โดยใช้ lmer แบบจำลองนั้นไม่ซ้อนกันและถูกเปรียบเทียบโดยการทดสอบอัตราส่วนความน่าจะเป็น ในระยะสั้นนี่คือตัวอย่างที่ทำซ้ำได้ของสิ่งที่ฉันมี: set.seed(105) Resp = rnorm(100) A = factor(rep(1:5,each=20)) B = factor(rep(1:2,times=50)) C = rep(1:4, times=25) m1 = lmer(Resp ~ A + (1|C), REML = TRUE) m2 = lmer(Resp ~ B + (1|C), REML = TRUE) anova(m1,m2) เท่าที่ฉันเห็นสามารถlmerใช้เพื่อคำนวณความน่าจะเป็นและบันทึกanovaการทดสอบความแตกต่างระหว่างแบบจำลองที่ใช้ไคสแควร์กับองศาอิสระทั่วไป ดูเหมือนจะไม่ถูกต้องสำหรับฉัน ถ้ามันถูกต้องไม่มีใครทราบถึงการอ้างอิงใด ๆ ที่แสดงความชอบธรรมนี้หรือไม่? ฉันตระหนักถึงวิธีการที่ใช้แบบจำลอง (Paper …

3
การถ่วงน้ำหนักข้อมูลล่าสุดในโมเดล Random Forest
ฉันกำลังฝึกรูปแบบการจัดหมวดหมู่กับ Random Forest เพื่อแยกแยะระหว่าง 6 หมวดหมู่ ข้อมูลธุรกรรมของฉันมีการสังเกตประมาณ 60k + และตัวแปร 35 ตัว นี่คือตัวอย่างของลักษณะโดยประมาณ _________________________________________________ |user_id|acquisition_date|x_var_1|x_var_2| y_vay | |-------|----------------|-------|-------|--------| |111 | 2013-04-01 | 12 | US | group1 | |222 | 2013-04-12 | 6 | PNG | group1 | |333 | 2013-05-05 | 30 | DE | group2 | |444 | …

1
วิธีการวาดตัวอย่างแบบสุ่มจากการกระจายโดยประมาณที่ไม่ใช่พารามิเตอร์
ฉันมีตัวอย่าง 100 คะแนนที่ต่อเนื่องและเป็นหนึ่งมิติ ฉันประเมินความหนาแน่นแบบไม่อิงพารามิเตอร์โดยใช้วิธีเคอร์เนล ฉันจะสุ่มตัวอย่างจากการแจกแจงโดยประมาณนี้ได้อย่างไร

3
ฉันสามารถสร้างการแจกแจงแบบปกติจากขนาดตัวอย่างและค่า min และ max ได้หรือไม่ ฉันสามารถใช้จุดกึ่งกลางเพื่อกำหนดค่าเฉลี่ยของพร็อกซี
ฉันรู้ว่านี่อาจจะเป็นค่าเช่าเล็กน้อยสถิติ แต่นี่เป็นปัญหาของฉัน ฉันมีข้อมูลช่วงจำนวนมากกล่าวคือขนาดต่ำสุดสูงสุดและตัวอย่างของตัวแปร สำหรับข้อมูลเหล่านี้บางส่วนฉันก็มีค่าเฉลี่ย แต่ไม่มากนัก ฉันต้องการที่จะเปรียบเทียบช่วงเหล่านี้กับแต่ละอื่น ๆ เพื่อหาปริมาณความแปรปรวนของแต่ละช่วงและเพื่อเปรียบเทียบค่าเฉลี่ย ฉันมีเหตุผลที่ดีที่จะสมมติว่าการกระจายนั้นสมมาตรรอบค่าเฉลี่ยและข้อมูลจะมีการแจกแจงแบบเกาส์ ด้วยเหตุนี้ฉันจึงคิดว่าฉันสามารถพิสูจน์ได้ว่าใช้จุดกึ่งกลางของการแจกแจงเป็นพร็อกซีสำหรับค่าเฉลี่ยเมื่อไม่อยู่ สิ่งที่ฉันต้องการทำคือสร้างการแจกแจงใหม่สำหรับแต่ละช่วงจากนั้นใช้สิ่งนั้นเพื่อให้ค่าเบี่ยงเบนมาตรฐานหรือข้อผิดพลาดมาตรฐานสำหรับการแจกแจงนั้น ข้อมูลเดียวที่ฉันมีคือค่าสูงสุดและต่ำสุดที่สังเกตได้จากตัวอย่างและจุดกลางเป็นพร็อกซีสำหรับค่าเฉลี่ย ด้วยวิธีนี้ฉันหวังว่าจะสามารถคำนวณค่าเฉลี่ยถ่วงน้ำหนักสำหรับแต่ละกลุ่มและคำนวณสัมประสิทธิ์การแปรผันสำหรับแต่ละกลุ่มได้เช่นกันตามข้อมูลช่วงที่ฉันมีและสมมติฐานของฉัน (ของการแจกแจงแบบสมมาตรและปกติ) ฉันวางแผนที่จะใช้ R เพื่อทำสิ่งนี้ดังนั้นความช่วยเหลือเกี่ยวกับโค้ดจะได้รับการชื่นชมเช่นกัน

3
การทำความเข้าใจกลุ่มความเชื่อมั่นจากการถดถอยพหุนาม
ฉันพยายามเข้าใจผลลัพธ์ที่เห็นในกราฟด้านล่าง โดยปกติแล้วฉันมักจะใช้ Excel และรับเส้นการถดถอยเชิงเส้น แต่ในกรณีด้านล่างฉันใช้ R และฉันได้รับการถดถอยพหุนามด้วยคำสั่ง: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() ดังนั้นคำถามของฉันถึงกับ: พื้นที่สีเทา (ลูกศร # 1) รอบ ๆ เส้นการถดถอยสีน้ำเงินคืออะไร นี่คือค่าเบี่ยงเบนมาตรฐานของการถดถอยพหุนามหรือไม่? ฉันสามารถพูดได้ไหมว่าสิ่งที่อยู่นอกพื้นที่สีเทา (ลูกศร # 2) คือ 'ผิดเพี้ยน' และอะไรก็ตามที่อยู่ในพื้นที่สีเทา (ลูกศร # 3) อยู่ในส่วนเบี่ยงเบนมาตรฐาน?

3
อัลกอริธึมทรีถดถอยด้วยโมเดลการถดถอยเชิงเส้นในแต่ละใบไม้
ฉบับย่อ:ฉันกำลังมองหาแพ็คเกจ R ที่สามารถสร้างแผนภูมิการตัดสินใจในขณะที่ใบไม้แต่ละใบในแผนผังการตัดสินใจเป็นรูปแบบการถดถอยเชิงเส้นเต็มรูปแบบ AFAIK ไลบรารีrpartสร้างแผนผังการตัดสินใจที่ตัวแปรตามคงที่ในแต่ละใบไม้ มีห้องสมุดอื่น (หรือการrpartตั้งค่าที่ฉันไม่ทราบ) ที่สามารถสร้างต้นไม้ดังกล่าวได้หรือไม่? รุ่นยาว:ฉันกำลังมองหาอัลกอริทึมที่สร้างแผนภูมิการตัดสินใจตามชุดข้อมูลการฝึกอบรม การตัดสินใจแต่ละครั้งในต้นไม้จะแยกข้อมูลการฝึกอบรมออกเป็นสองส่วนตามเงื่อนไขของหนึ่งในตัวแปรอิสระ รูทของทรีมีชุดข้อมูลแบบเต็มและแต่ละไอเท็มในชุดข้อมูลนั้นมีอยู่ในโหนดใบเดียว อัลกอริทึมเป็นดังนี้: เริ่มต้นด้วยชุดข้อมูลแบบเต็มซึ่งเป็นโหนดรูทของทรี เลือกโหนดนี้และเรียกว่าNNNN สร้างรูปแบบการถดถอยเชิงเส้นกับข้อมูลในNNNN หากโมเดลเชิงเส้นของNสูงกว่าขีด จำกัด บางθ R 2 แสดงว่าเราเสร็จด้วยNดังนั้นให้ทำเครื่องหมายNR2R2R^2NNNθR2θR2\theta_{R^2}NNNNNNเป็นใบและข้ามไปยังขั้นตอนที่ 5 ลองตัดสินใจแบบสุ่มและเลือกหนึ่งที่มีอัตราผลตอบแทนที่ดีที่สุดR 2ในโหนดย่อยนี้: nnnR2R2R^2 เลือกตัวแปรอิสระแบบสุ่มเช่นเดียวกับเกณฑ์แบบสุ่มθ iviviv_iθiθi\theta_iฉัน การตัดสินใจแยกชุดข้อมูลของN เป็นสองโหนดใหม่ Nและ~ Nvi≤θivi≤θiv_i \leq \theta_iNNNN^N^\hat{N}N~N~\tilde{N} N สร้างแบบจำลองการถดถอยเชิงเส้นทั้งNและ~ NและคำนวณของพวกเขาR 2 (เรียกพวกเขาrและ~ RN^N^\hat{N}N~N~\tilde{N}R2R2R^2r^r^\hat{r}r~r~\tilde{r} ) จากทั้งหมดที่ tuples ( วีฉัน , θ ฉัน , R , …
14 r  regression  rpart  cart 

1
การถดถอยผลผสมแบบไม่เชิงเส้นใน R
น่าแปลกที่ฉันไม่พบคำตอบของคำถามต่อไปนี้โดยใช้ Google: ฉันมีข้อมูลทางชีววิทยาจากบุคคลหลายคนที่แสดงพฤติกรรมการเจริญเติบโต sigmoid คร่าวๆในเวลา ดังนั้นฉันต้องการจำลองโดยใช้การเติบโตโลจิสติกมาตรฐาน P(t) = k*p0*exp(r*t) / (k+p0*(exp(r*t)-1)) ด้วย p0 เป็นค่าเริ่มต้นที่ t = 0, k เป็นขีด จำกัด เชิงเส้นกำกับที่ t-> infinity และ r เป็นความเร็วในการเติบโต เท่าที่ฉันเห็นฉันสามารถจำลองสิ่งนี้ได้อย่างง่ายดายโดยใช้ nls (ขาดความเข้าใจในส่วนของฉัน: ทำไมฉันถึงไม่สร้างแบบจำลองบางอย่างที่คล้ายกันโดยใช้ logit regression แบบมาตรฐานโดยการปรับขนาดเวลาและข้อมูล EDIT: ขอบคุณ Nick สัดส่วน แต่ไม่ค่อยhttp://www.stata-journal.com/article.html?article=st0147 . คำถามต่อไปเกี่ยวกับแทนเจนต์นี้คือถ้าแบบจำลองสามารถจัดการค่าผิดปกติ> 1) ตอนนี้ฉันต้องการอนุญาตให้แก้ไขบางอย่าง (ส่วนใหญ่เป็นหมวดหมู่) และสุ่มบางอย่าง (ID แต่ละตัวและอาจเป็น ID การศึกษา) ในพารามิเตอร์สามตัวคือ k, …

1
ตัวประมาณค่ามัธยฐานเป็นกลางลดค่าเบี่ยงเบนสัมบูรณ์หรือไม่
นี่คือการติดตาม แต่ยังเป็นคำถามที่แตกต่างกันของหนึ่งก่อนหน้านี้ของฉัน ฉันอ่านวิกิพีเดียว่า " เครื่องมือประมาณค่ากลางจะช่วยลดความเสี่ยงในส่วนที่เกี่ยวกับฟังก์ชั่นการสูญเสียค่าเบี่ยงเบนสัมบูรณ์ดังที่ Laplace ได้สังเกตไว้" อย่างไรก็ตามผลลัพธ์การจำลอง Monte Carlo ของฉันไม่สนับสนุนอาร์กิวเมนต์นี้ ผมถือว่าตัวอย่างจากระบบปกติประชากรโดยที่μและσเป็นค่าเฉลี่ยของบันทึกและ log-sd, β = exp ( μ ) = 50X1,X2,...,XN∼LN(μ,σ2)X1,X2,...,XN∼LN(μ,σ2)X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)μμ\muσσ\sigmaβ= ประสบการณ์( μ ) = 50β=ประสบการณ์⁡(μ)=50\beta = \exp(\mu)=50 ประมาณการทางเรขาคณิต-เฉลี่ยเป็นประมาณการค่ามัธยฐาน-เป็นกลางสำหรับประชากรเฉลี่ย ,ประสบการณ์( μ )ประสบการณ์⁡(μ)\exp(\mu) ที่μและσมีการเข้าสู่ระบบหมายและเข้าสู่ระบบ SD, μและ σมี MLEs สำหรับμและσβ^จีเอ็ม= ประสบการณ์( μ^) = ประสบการณ์( บันทึก ∑( Xผม)ยังไม่มีข้อความ) ∼ LN (μ, …

1
นี่เป็นวิธีที่ยอมรับได้ในการวิเคราะห์แบบจำลองเอฟเฟกต์แบบผสมด้วย lme4 ใน R หรือไม่?
ฉันมีชุดข้อมูลการวัดซ้ำ ๆ ที่ไม่สมดุลในการวิเคราะห์และฉันได้อ่านว่าแพคเกจทางสถิติส่วนใหญ่จัดการกับ ANOVA (เช่นผลรวมสี่เหลี่ยมจัตุรัสประเภท III) ผิด ดังนั้นฉันต้องการใช้โมเดลเอฟเฟกต์แบบผสมเพื่อวิเคราะห์ข้อมูลเหล่านี้ ฉันได้อ่านเกี่ยวกับโมเดลมิกซ์Rมากมายแล้ว แต่ฉันยังใหม่กับRโมเดลเอฟเฟกต์แบบผสมและไม่ค่อยมั่นใจว่าฉันกำลังทำสิ่งที่ถูกต้อง โปรดทราบว่าฉันยังไม่สามารถหย่าร้างกับวิธีการ "ดั้งเดิม" ทั้งหมดและยังคงต้องใช้ค่าและค่าการทดสอบหลังการทดสอบพีพีp ฉันต้องการทราบว่าวิธีการต่อไปนี้สมเหตุสมผลหรือไม่หรือหากฉันกำลังทำสิ่งผิดปกติอย่างน่ากลัว นี่คือรหัสของฉัน: # load packages library(lme4) library(languageR) library(LMERConvenienceFunctions) library(coda) library(pbkrtest) # import data my.data <- read.csv("data.csv") # create separate data frames for each DV & remove NAs region.data <- na.omit(data.frame(time=my.data$time, subject=my.data$subject, dv=my.data$dv1)) # output summary of data …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.