คำถามติดแท็ก random-effects-model

พารามิเตอร์ที่เกี่ยวข้องกับระดับของ covariate บางครั้งเรียกว่า "ผลกระทบ" ของระดับ หากระดับที่สังเกตได้แสดงถึงกลุ่มตัวอย่างแบบสุ่มจากชุดของระดับที่เป็นไปได้ทั้งหมดที่เราเรียกว่าเอฟเฟกต์เหล่านี้ "สุ่ม"

5
ควรใช้แบบผสมเอฟเฟกต์เมื่อใด?
ตัวแบบผสมผลกระทบเชิงเส้นเป็นส่วนขยายของตัวแบบการถดถอยเชิงเส้นสำหรับข้อมูลที่รวบรวมและสรุปในกลุ่ม ข้อได้เปรียบที่สำคัญคือสัมประสิทธิ์อาจแตกต่างกันไปตามตัวแปรของกลุ่มหนึ่งตัวหรือมากกว่า อย่างไรก็ตามฉันกำลังดิ้นรนกับเวลาที่จะใช้รูปแบบผสมแบบผสม? ฉันจะทำอย่างละเอียดคำถามของฉันโดยใช้ตัวอย่างของเล่นกับกรณีที่รุนแรง สมมติว่าเราต้องการสร้างแบบจำลองความสูงและน้ำหนักสำหรับสัตว์และเราใช้สปีชีส์เป็นตัวแปรในการจัดกลุ่ม หากกลุ่ม / สายพันธุ์ที่แตกต่างกันแตกต่างกันจริงๆ พูดสุนัขและช้าง ฉันคิดว่าไม่มีจุดใช้โมเดลเอฟเฟกต์แบบผสมเราควรสร้างแบบจำลองสำหรับแต่ละกลุ่ม หากกลุ่ม / สปีชีส์ต่างกันมีความคล้ายคลึงกันจริงๆ พูดว่าสุนัขตัวเมียกับหมาตัวผู้ ฉันคิดว่าเราอาจต้องการใช้เพศเป็นตัวแปรเด็ดขาดในโมเดล ดังนั้นฉันคิดว่าเราควรใช้โมเดลเอฟเฟกต์ผสมในกรณีกลาง? บอกเด็ก ๆ ว่ากลุ่มคือแมวสุนัขกระต่ายพวกมันเป็นสัตว์ขนาดใกล้เคียงกัน แต่ต่างกัน มีข้อโต้แย้งอย่างเป็นทางการใด ๆ ที่จะแนะนำเมื่อใช้โมเดลเอฟเฟกต์แบบผสมเช่นวิธีการวาดเส้น แบบจำลองอาคารสำหรับแต่ละกลุ่ม แบบผสมลักษณะพิเศษ ใช้กลุ่มเป็นตัวแปรเด็ดขาดในการถดถอย ความพยายามของฉัน: วิธีที่ 1 เป็น "รูปแบบที่ซับซ้อน" ที่สุด / มีระดับความเป็นอิสระน้อยลงและวิธีที่ 3 คือรูปแบบที่ง่ายที่สุด "/ ระดับที่อิสระมากขึ้น และโมเดลเอฟเฟกต์ผสมอยู่ตรงกลาง เราอาจพิจารณาจำนวนข้อมูลและข้อมูลที่ซับซ้อนที่เราต้องเลือกแบบจำลองที่เหมาะสมตาม Bais Variance Trade Off

2
ทำไมโมเดลเอฟเฟกต์แบบสุ่มต้องการให้เอฟเฟ็กต์ไม่เกี่ยวข้องกับตัวแปรอินพุตในขณะที่โมเดลเอฟเฟกต์คงที่อนุญาตให้มีความสัมพันธ์กัน?
จากวิกิพีเดีย มีสมมติฐานทั่วไปสองข้อเกี่ยวกับเอฟเฟกต์เฉพาะของแต่ละบุคคล, สมมติฐานเอฟเฟกต์แบบสุ่มและสมมติฐานผลกระทบคงที่ สมมติฐานผลกระทบแบบสุ่ม (ทำในรูปแบบผลกระทบแบบสุ่ม) คือว่าผลกระทบเฉพาะบุคคลจะไม่เกี่ยวข้องกับตัวแปรอิสระ ข้อสันนิษฐานผลกระทบคงที่คือผลกระทบเฉพาะบุคคลมีความสัมพันธ์กับตัวแปรอิสระ หากการสันนิษฐานผลกระทบแบบสุ่มถือแบบจำลองผลกระทบแบบสุ่มมีประสิทธิภาพมากขึ้นกว่าแบบจำลองผลกระทบคงที่ อย่างไรก็ตามหากสมมติฐานนี้ไม่ได้เก็บไว้ (เช่นหากการทดสอบ Durbin – Watson ล้มเหลว) โมเดลเอฟเฟกต์แบบสุ่มจะไม่สอดคล้องกัน ฉันสงสัยว่าทำไมตัวแบบเอฟเฟกต์แบบสุ่มต้องการให้เอฟเฟกต์แบบสุ่มไม่เกี่ยวข้องกับตัวแปรอินพุตในขณะที่โมเดลเอฟเฟกต์แบบคงที่จะทำให้เอฟเฟกต์สัมพันธ์กับตัวแปรอินพุต ขอบคุณ!

1
การทำนายด้วยเอฟเฟกต์แบบสุ่มในเกม mgcv
ฉันสนใจในการสร้างแบบจำลองการจับปลาทั้งหมดโดยใช้ gam ใน mgcv เพื่อสร้างเอฟเฟกต์แบบสุ่มง่าย ๆ สำหรับเรือแต่ละลำ ฉันมีวิชา 98 วิชาดังนั้นฉันคิดว่าฉันจะใช้ gam แทน gamm เพื่อจำลองเอฟเฟกต์แบบสุ่ม แบบจำลองของฉันคือ: modelGOM <- gam(TotalFish ~ factor(SetYear) + factor(SetMonth) + factor(TimePeriod) + s(SST) + s(VesselID, bs = "re", by = dum) + s(Distance, by = TimePeriod) + offset(log(HooksSet)), data = GOM, family = tw(), method = "REML") …

2
การเพิ่มเอฟเฟกต์แบบสุ่มมีผลต่อการประมาณค่าสัมประสิทธิ์
ฉันได้รับการสอนเสมอว่าเอฟเฟกต์แบบสุ่มมีอิทธิพลต่อความแปรปรวน (ข้อผิดพลาด) เท่านั้นและเอฟเฟกต์แบบคงที่จะมีอิทธิพลต่อค่าเฉลี่ยเท่านั้น แต่ฉันได้พบตัวอย่างที่ผลกระทบแบบสุ่มมีอิทธิพลต่อค่าเฉลี่ย - การประมาณค่าสัมประสิทธิ์: require(nlme) set.seed(128) n <- 100 k <- 5 cat <- as.factor(rep(1:k, each = n)) cat_i <- 1:k # intercept per kategorie x <- rep(1:n, k) sigma <- 0.2 alpha <- 0.001 y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma) plot(x, y) …

1
การทำความเข้าใจผลกระทบของปัจจัยสุ่มต่อเนื่องในรูปแบบเอฟเฟกต์ผสม
ฉันเข้าใจถึงผลกระทบของการสุ่มอย่างมีนัยสำคัญต่อแบบจำลองเอฟเฟกต์แบบผสมซึ่งจะทำการรวมบางส่วนของการสังเกตตามระดับในเอฟเฟกต์สุ่มโดยสมมติว่าการสังเกตไม่ได้เป็นอิสระ แต่มีเพียงบางส่วนเท่านั้น นอกจากนี้สำหรับความเข้าใจของฉันในการสังเกตแบบจำลองที่ใช้ระดับเอฟเฟกต์แบบสุ่มเหมือนกัน แต่ความแตกต่างในระดับเอฟเฟกต์แบบคงที่จะมีค่ามากกว่าการสังเกตที่ต่างกันทั้งในเอฟเฟกต์แบบสุ่มและระดับเอฟเฟกต์คงที่ อะไรคือผลกระทบของปัจจัยสุ่มต่อเนื่อง เนื่องจากโมเดลที่ไม่มีเอฟเฟกต์แบบสุ่มแสดงให้เห็นว่าเอฟเฟกต์คงที่มีขนาดเอฟเฟกต์ X ฉันควรคาดหวังว่าหากการสังเกตในระดับต่าง ๆ ของเอฟเฟกต์คงที่มาจากปลายสุดของเอฟเฟกต์สุ่ม แบบจำลองซึ่งรวมถึงปัจจัยสุ่มในขณะที่ถ้าการสังเกตในระดับปัจจัยคงที่แตกต่างกันมีค่าเอฟเฟกต์แบบสุ่มที่ใกล้เคียงกันขนาดของเอฟเฟกต์จะเพิ่มขึ้น?

3
ผลกระทบคงที่เทียบกับสุ่ม
ฉันเพิ่งเริ่มเรียนรู้เกี่ยวกับโมเดลเชิงเส้นผสมแบบทั่วไปและใช้ R เพื่อสำรวจความแตกต่างที่ทำให้ปฏิบัติต่อการเป็นสมาชิกกลุ่มเป็นลักษณะพิเศษแบบคงที่หรือแบบสุ่ม โดยเฉพาะฉันกำลังดูชุดข้อมูลตัวอย่างที่กล่าวถึงที่นี่: http://www.ats.ucla.edu/stat/mult_pkg/glmm.htm http://www.ats.ucla.edu/stat/r/dae/melogit.htm ดังที่อธิบายไว้ในบทช่วยสอนนี้ผลกระทบของ Doctor ID นั้นสามารถมองเห็นได้และฉันคาดหวังว่ารูปแบบผสมกับการสกัดแบบสุ่มเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น อย่างไรก็ตามการเปรียบเทียบค่า AIC สำหรับสองวิธีแนะนำว่ารุ่นนี้แย่กว่า: > require(lme4) ; hdp = read.csv("http://www.ats.ucla.edu/stat/data/hdp.csv") > hdp$DID = factor(hdp$DID) ; hdp$Married = factor(hdp$Married) > GLM = glm(remission~Age+Married+IL6+DID,data=hdp,family=binomial);summary(GLM) Call: glm(formula = remission ~ Age + Married + IL6 + DID, family = binomial, data = hdp) Deviance …


1
ข้ามเอฟเฟกต์แบบสุ่มและข้อมูลที่ไม่สมดุล
ฉันกำลังสร้างแบบจำลองข้อมูลบางอย่างที่ฉันคิดว่าฉันมีผลกระทบแบบสุ่มข้ามสอง แต่ชุดข้อมูลไม่สมดุลและฉันไม่แน่ใจว่าต้องทำอะไรเพื่อบัญชี ข้อมูลของฉันคือชุดของเหตุการณ์ เหตุการณ์เกิดขึ้นเมื่อลูกค้าพบกับผู้ให้บริการเพื่อดำเนินงานซึ่งประสบความสำเร็จหรือไม่ มีลูกค้าและผู้ให้บริการหลายพันรายและลูกค้าและผู้ให้บริการแต่ละรายมีส่วนร่วมในกิจกรรมที่แตกต่างกันจำนวน (ประมาณ 5 ถึง 500) ลูกค้าและผู้ให้บริการแต่ละรายมีระดับทักษะและโอกาสที่งานจะประสบความสำเร็จคือหน้าที่ของทักษะของผู้เข้าร่วมทั้งสอง ไม่มีการทับซ้อนระหว่างไคลเอนต์และผู้ให้บริการ ฉันสนใจความแปรปรวนของประชากรของลูกค้าและผู้ให้บริการที่เกี่ยวข้องดังนั้นเราจึงสามารถทราบได้ว่าแหล่งข้อมูลใดมีผลต่ออัตราความสำเร็จมากขึ้น ฉันต้องการทราบค่าเฉพาะของทักษะระหว่างลูกค้าและผู้ให้บริการที่เรามีข้อมูลเพื่อระบุลูกค้าหรือผู้ให้บริการที่ดีที่สุด / แย่ที่สุด ตอนแรกฉันต้องการสมมติว่าความน่าจะเป็นของความสำเร็จนั้นเกิดจากระดับทักษะรวมของลูกค้าและผู้ให้บริการโดยไม่มีผลกระทบคงที่อื่น ๆ ดังนั้นสมมติว่า x เป็นปัจจัยสำหรับลูกค้าและ y เป็นปัจจัยสำหรับผู้ให้บริการจากนั้นใน R (โดยใช้แพ็คเกจ lme4) ฉันมีรูปแบบที่ระบุเป็น: glmer( success ~ (1 | x) + (1 | y), family=binomial(), data=events) ปัญหาหนึ่งคือลูกค้าไม่ได้กระจายอย่างเท่าเทียมกันทั่วทั้งผู้ให้บริการ ลูกค้าที่มีทักษะสูงจะมีโอกาสที่จะจับคู่กับผู้ให้บริการที่มีทักษะสูงกว่า ความเข้าใจของฉันคือผลกระทบแบบสุ่มจะต้องไม่เกี่ยวข้องกับตัวทำนายอื่น ๆ ในโมเดล แต่ฉันไม่แน่ใจว่าจะอธิบายได้อย่างไร นอกจากนี้ลูกค้าและผู้ให้บริการบางรายมีกิจกรรมน้อยมาก (น้อยกว่า 10) ในขณะที่ลูกค้าอื่นมีจำนวนมาก (มากถึง 500) …

2
ขนาดตัวอย่างขั้นต่ำต่อคลัสเตอร์ในโมเดลเอฟเฟกต์แบบสุ่ม
มีเหตุผลสำหรับจำนวนของการสังเกตต่อกลุ่มในรูปแบบผลกระทบแบบสุ่ม? ฉันมีขนาดตัวอย่าง 1,500 กับ 700 คลัสเตอร์จำลองเป็นเอฟเฟกต์สุ่มที่แลกเปลี่ยนได้ ฉันมีตัวเลือกในการรวมกลุ่มเพื่อสร้างกลุ่มน้อยลง แต่มีขนาดใหญ่ขึ้น ฉันสงสัยว่าฉันจะเลือกขนาดตัวอย่างขั้นต่ำต่อคลัสเตอร์ได้อย่างไรเพื่อให้ได้ผลลัพธ์ที่มีความหมายในการทำนายเอฟเฟกต์แบบสุ่มสำหรับแต่ละคลัสเตอร์ มีกระดาษที่ดีที่อธิบายสิ่งนี้หรือไม่

1
การตีความผลกระทบคงที่จากการถดถอยโลจิสติกส์ผลผสม
ฉันสับสนกับข้อความที่หน้าเว็บของ UCLAเกี่ยวกับการถดถอยโลจิสติกเอฟเฟกต์ พวกเขาแสดงตารางของสัมประสิทธิ์ผลกระทบคงที่จากการปรับแบบจำลองดังกล่าวและย่อหน้าแรกข้างล่างดูเหมือนจะตีความค่าสัมประสิทธิ์เหมือนการถดถอยโลจิสติกปกติ แต่เมื่อพวกเขาพูดถึงอัตราต่อรองพวกเขาบอกว่าคุณต้องตีความเงื่อนไขแบบสุ่มตามเงื่อนไข อะไรจะทำให้การตีความของอัตราต่อรองที่แตกต่างจากค่า exponentiated ของพวกเขา? จะไม่ต้อง "ถือทุกอย่างอื่นคงที่"? วิธีที่เหมาะสมในการตีความสัมประสิทธิ์ผลคงที่จากรุ่นนี้คืออะไร? ฉันอยู่ภายใต้ความประทับใจเสมอไม่มีอะไรเปลี่ยนแปลงจากการถดถอยโลจิสติก "ปกติ" เพราะเอฟเฟกต์แบบสุ่มมีความคาดหวังเป็นศูนย์ ดังนั้นคุณจึงตีความอัตราต่อรองของอัตราต่อรองและอัตราต่อรองเหมือนกันโดยมีหรือไม่มีเอฟเฟกต์แบบสุ่ม - เปลี่ยนเฉพาะ SE เท่านั้น การประมาณการสามารถตีความได้อย่างเป็นหลักเช่นเคย ตัวอย่างเช่นสำหรับ IL6 การเพิ่มขึ้นหนึ่งหน่วยใน IL6 จะสัมพันธ์กับการลดลงของ. 053 หน่วยในอัตราต่อรองที่คาดหวังของการให้อภัย ในทำนองเดียวกันคนที่แต่งงานแล้วหรืออาศัยอยู่ในฐานะแต่งงานได้รับการคาดหวังว่าจะมีอัตราการอยู่รอดสูงถึง. 26 มากกว่าคนที่โสด หลายคนชอบตีความอัตราต่อรอง อย่างไรก็ตามสิ่งเหล่านี้มีความหมายที่เหมาะสมยิ่งขึ้นเมื่อมีเอฟเฟกต์แบบผสม ในการถดถอยโลจิสติกปกติอัตราเดิมพันอัตราส่วนอัตราต่อรองที่คาดว่าจะถือทำนายอื่น ๆ ทั้งหมดได้รับการแก้ไข สิ่งนี้สมเหตุสมผลเมื่อเรามักจะสนใจในการปรับทางสถิติสำหรับเอฟเฟกต์อื่น ๆ เช่นอายุเพื่อให้ได้ผลที่ "บริสุทธิ์" ของการแต่งงานหรืออะไรก็ตามที่ผู้ทำนายหลักสนใจ เช่นเดียวกันกับโมเดลเอฟเฟ็กต์โลจิสติกส์เอฟเฟกต์ผสมที่มีการเพิ่มทุกอย่างที่คงที่ไว้ นั่นคืออัตราส่วนอัตราต่อรองที่นี่คืออัตราต่อรองแบบมีเงื่อนไขสำหรับคนที่อายุและค่าคงที่ IL6 เช่นเดียวกับคนที่มีแพทย์เดียวกันหรือแพทย์ที่มีเอฟเฟกต์แบบสุ่มเหมือนกัน

2
REML vs ML stepAIC
ฉันรู้สึกท่วมท้นหลังจากพยายามขุดลงไปในวรรณคดีว่าจะใช้การวิเคราะห์แบบผสมของฉันได้อย่างไรหลังจากใช้ AIC เพื่อเลือกแบบจำลองหรือแบบจำลองที่ดีที่สุด ฉันไม่คิดว่าข้อมูลของฉันมีความซับซ้อน แต่ฉันกำลังมองหาการยืนยันว่าสิ่งที่ฉันทำถูกต้องแล้วแนะนำวิธีดำเนินการต่อ ฉันไม่แน่ใจว่าควรใช้ lme หรือ lmer หรือไม่ถ้าใช้อย่างใดอย่างหนึ่งควรใช้ REML หรือ ML ฉันมีคุณค่าในการเลือกและฉันต้องการรู้ว่า covariates ที่ดีที่สุดมีอิทธิพลต่อคุณค่านั้นและอนุญาตให้มีการคาดการณ์ นี่คือตัวอย่างข้อมูลและโค้ดสำหรับการทดสอบที่ฉันใช้: ID=as.character(rep(1:5,3)) season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w") time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d") repro=as.character(rep(1:3,5)) risk=runif(15, min=0, max=1.1) comp1=rnorm(15, mean = 0, sd = 1) mydata=data.frame(ID, season, time, repro, risk, comp1) c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata) c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata) c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata) c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata) c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata) c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata) c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata) ฉันมีโมเดล 19 รุ่นที่สำรวจข้อมูลนี้ด้วยชุดค่าผสมที่หลากหลายและมีเงื่อนไขการโต้ตอบ 2 ทาง แต่จะใช้ …

3
แบบจำลองเอฟเฟกต์แบบสุ่มที่จัดการความซ้ำซ้อน
ฉันกำลังพยายามจัดการกับการวิเคราะห์แบบเวลาต่อเหตุการณ์โดยใช้ผลลัพธ์ไบนารีซ้ำ ๆ สมมติว่าเวลาต่อเหตุการณ์ถูกวัดเป็นวัน แต่สำหรับช่วงเวลาที่เราแยกเวลาเป็นสัปดาห์ ฉันต้องการประมาณค่าประมาณของ Kaplan-Meier (แต่อนุญาตให้ covariates) โดยใช้ผลลัพธ์ไบนารีซ้ำ นี่จะดูเหมือนเป็นวงเวียนที่จะไป แต่ฉันกำลังสำรวจว่าสิ่งนี้ขยายไปสู่ผลลัพธ์ตามลำดับและเหตุการณ์ที่เกิดขึ้นซ้ำ ๆ หากคุณสร้างลำดับเลขฐานสองที่ดูเหมือนว่า 000 สำหรับคนที่ถูกเซ็นเซอร์ใน 3 สัปดาห์, 0000 สำหรับคนที่ถูกเซ็นเซอร์ที่ 4w และ 0000111111111111 .... สำหรับผู้ที่ล้มเหลวที่ 5w (1s ขยายไปถึงประเด็นที่เรื่องสุดท้ายเป็น ตามมาในการศึกษา) เมื่อคุณคำนวณสัดส่วนเฉพาะสัปดาห์ของ 1s คุณจะได้รับอุบัติการณ์สะสมตามปกติ (จนกว่าคุณจะได้รับเวลาตรวจสอบตัวแปรที่ซึ่งจะประมาณได้เฉพาะ แต่ไม่เท่ากับการประมาณอุบัติการณ์สะสมของ Kaplan-Meier) ฉันสามารถใส่การสังเกตแบบไบนารี่ซ้ำ ๆ กับแบบจำลองโลจิสติกไบนารีโดยใช้ GEE แทนที่จะทำให้เวลาไม่ต่อเนื่องเหมือนด้านบน แต่แทนที่จะใช้ spline ในเวลา ตัวประมาณความแปรปรวนร่วมของคลัสเตอร์แซนด์วิชทำงานได้ดีพอสมควร แต่ฉันต้องการได้ข้อสรุปที่แน่นอนมากขึ้นโดยใช้โมเดลเอฟเฟกต์แบบผสม ปัญหาคือว่า 1 หลังจาก 1 แรกซ้ำซ้อน ไม่มีใครรู้วิธีระบุเอฟเฟกต์แบบสุ่มหรือระบุรุ่นที่คำนึงถึงความซ้ำซ้อนเพื่อให้ข้อผิดพลาดมาตรฐานจะไม่ย่นหรือไม่ …

2
วิธีที่ดีที่สุดในการประเมินผลการรักษาโดยเฉลี่ยในการศึกษาระยะยาวคืออะไร?
ในการศึกษาระยะยาวผลลัพธ์ของหน่วยที่ถูกวัดซ้ำ ๆ ณ จุดเวลาโดยมีโอกาสในการวัดคงที่ทั้งหมด (คงที่ = วัดที่หน่วยในเวลาเดียวกัน)YฉันทีYผมเสื้อY_{it}ผมผมiเสื้อเสื้อtม.ม.m หน่วยที่ได้รับมอบหมายสุ่มทั้งการรักษา,หรือกลุ่มควบคุม, 0 ฉันต้องการประเมินและทดสอบผลการรักษาโดยเฉลี่ยเช่นที่ความคาดหวังนั้นเกิดขึ้นข้ามเวลาและส่วนบุคคล ฉันพิจารณาใช้แบบจำลองหลายระดับ (เอฟเฟกต์ผสม) ในโอกาสคงที่เพื่อวัตถุประสงค์นี้G = 1G=1G=1G = 0G=0G=0TE= E( Y| G=1)-E( Y| G=0),ATE=E(Y|G=1)-E(Y|G=0),ATE=E(Y | G=1) - E(Y | G=0), Yฉันที= α + βGผม+ยู0 ฉัน+อีฉันทีYผมเสื้อ=α+βGผม+ยู0ผม+อีผมเสื้อY_{it} = \alpha + \beta G_i + u_{0i} + e_{it} ด้วย the intercept the ,จะถูกสกัดกั้นแบบสุ่มทั่วทั้งหน่วยและส่วนที่เหลือαα\alphaββ\betaTEATEATEยูยูuอีอีe ตอนนี้ฉันกำลังพิจารณารูปแบบทางเลือก Yฉันที=β~Gผม+Σj = …

1
เมื่อใดควรรวมเอฟเฟกต์แบบสุ่มในโมเดล
ฉันใหม่กับการทำโมเดลแบบผสมและฉันสับสนว่ามันเหมาะสมที่จะใช้เอฟเฟกต์แบบสุ่มในการวิเคราะห์ที่ฉันทำหรือไม่ คำแนะนำใด ๆ ที่จะได้รับการชื่นชม. การศึกษาของฉันคือการทดสอบว่าดัชนีที่พัฒนาขึ้นใหม่ของความอุดมสมบูรณ์ของสัตว์เลี้ยงลูกด้วยนมสามารถทำนายมูลค่าของดัชนีที่สร้างขึ้น แต่มีความเข้มข้นของแรงงานมากขึ้นได้อย่างไร ฉันทำการวัดดัชนีเหล่านี้ในผืนป่าหลาย ๆ ผืนพร้อมกับแปลงหลายผืนในแต่ละผืนป่า เพราะฉันไม่สนใจผลของแผ่นปะป่าโดยตรงและเนื่องจากแผ่นตัวอย่างของฉันซ้อนอยู่ในแผ่นปะป่าฉันจึงใช้แผ่นปะป่าเป็นผลแบบสุ่ม อย่างไรก็ตามฉันมีคำถามสองสามข้อเกี่ยวกับเรื่องนี้: ก่อนอื่นฉันรู้ว่าเอฟเฟกต์แบบสุ่มช่วยให้คุณสามารถสรุปผลลัพธ์ของคุณในทุกระดับที่เป็นไปได้ของปัจจัยการสุ่มไม่ใช่เฉพาะที่คุณสุ่มตัวอย่าง แต่สำหรับฉันแล้วการที่จะอนุมานแบบนี้ระดับของคุณจะต้องมีการสุ่มตัวอย่าง? แผ่นปะป่าของฉันไม่ได้สุ่มตัวอย่างแล้วฉันจะยังสามารถใช้มันเป็นเอฟเฟกต์แบบสุ่มได้หรือไม่? ประการที่สองฉันได้อ่านว่าคุณสามารถทดสอบได้ว่าจำเป็นต้องมีเอฟเฟกต์แบบสุ่มหรือไม่เช่นการทดสอบอัตราส่วนความน่าจะเป็นเพื่อเปรียบเทียบแบบจำลองที่มีและไม่มีผลกระทบหรือไม่ ฉันได้ทำไปแล้วและมันแสดงให้เห็นว่าแบบจำลองเอฟเฟกต์แบบสุ่มไม่ได้อธิบายข้อมูลรวมถึงแบบจำลองเอฟเฟกต์ถาวรเท่านั้น ปัญหาของฉันเกี่ยวกับเรื่องนี้ก็คือแผนการของฉันยังคงซ้อนกันอยู่ในแผ่นปะป่าและดังนั้นจึงไม่น่าจะเป็นอิสระ ดังนั้นฉันสามารถใช้วิธี LRT นี้เพื่อปรับการยกเว้นเอฟเฟกต์แบบสุ่มหรือฉันยังต้องรวมวิธีการนี้เพื่อใช้ในการพิจารณาความซ้อนกันหรือไม่? และหากฉันสิ้นสุดการลบเอฟเฟกต์แบบสุ่มมีวิธีการตรวจสอบว่าแปลงในแพทช์ป่าสามารถพิจารณาได้อย่างอิสระหรือไม่? ขอบคุณสำหรับความช่วยเหลือของคุณ! คนโง่

1
ทำไมการแนะนำของเอฟเฟกต์ความชันแบบสุ่มทำให้ SE ของความชันเพิ่มขึ้น
ฉันพยายามวิเคราะห์ผลกระทบของปีต่อตัวแปร logInd สำหรับกลุ่มบุคคลโดยเฉพาะ (ฉันมี 3 กลุ่ม) โมเดลที่ง่ายที่สุด: > fix1 = lm(logInd ~ 0 + Group + Year:Group, data = mydata) > summary(fix1) Call: lm(formula = logInd ~ 0 + Group + Year:Group, data = mydata) Residuals: Min 1Q Median 3Q Max -5.5835 -0.3543 -0.0024 0.3944 4.7294 Coefficients: Estimate Std. Error …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.