ฉันปรับโมเดลเอฟเฟกต์แบบสุ่มให้เหมาะกับglmer
ข้อมูลธุรกิจบางอย่าง จุดมุ่งหมายคือการวิเคราะห์ประสิทธิภาพการขายโดยผู้จัดจำหน่ายโดยคำนึงถึงความหลากหลายของภูมิภาค ฉันมีตัวแปรต่อไปนี้:
distcode
: รหัสผู้จำหน่ายที่มีประมาณ 800 ระดับregion
: รหัสทางภูมิศาสตร์ระดับบนสุด (เหนือ, ใต้, ตะวันออก, ตะวันตก)zone
: ภูมิศาสตร์ระดับกลางซ้อนกันภายในregion
ประมาณ 30 ระดับในทุกระดับterritory
: ภูมิศาสตร์ระดับต่ำซ้อนกันภายในzone
ประมาณ 150 ระดับ
ผู้จัดจำหน่ายแต่ละรายดำเนินงานในพื้นที่เดียวเท่านั้น ส่วนที่ยุ่งยากคือการสรุปข้อมูลพร้อมจุดข้อมูลหนึ่งจุดต่อผู้จัดจำหน่าย ดังนั้นฉันจึงมี 800 จุดข้อมูลและฉันพยายามปรับให้พอดี (อย่างน้อย) พารามิเตอร์ 800 ถึงแม้ว่าจะเป็นแบบธรรมดา
ฉันได้ติดตั้งโมเดลดังนี้:
glmer(ninv ~ 1 + (1|region/zone/territory) + (1|distcode), family=poisson)
สิ่งนี้จะทำงานโดยไม่มีปัญหาแม้ว่าจะพิมพ์บันทึกย่อ:
จำนวนระดับของปัจจัยการจัดกลุ่มสำหรับเอฟเฟกต์แบบสุ่มเท่ากับ n จำนวนการสังเกต
นี่เป็นสิ่งที่ควรทำใช่ไหม ฉันได้รับการประมาณค่าสัมประสิทธิ์ทั้งหมดและ AIC ก็ไม่สมเหตุสมผล ถ้าฉันลองปัวซอง GLMM ด้วยลิงก์ตัวตน AIC นั้นแย่กว่ามากดังนั้นลิงก์ล็อกนั้นเป็นจุดเริ่มต้นที่ดีอย่างน้อย
ถ้าฉันพล็อตค่าที่พอดีกับการตอบสนองฉันจะได้รับสิ่งที่เหมาะสมที่สุดซึ่งฉันเดาว่าเป็นเพราะฉันมีจุดข้อมูลหนึ่งจุดต่อผู้จัดจำหน่าย มีเหตุผลหรือว่าฉันกำลังทำอะไรที่โง่อย่างสมบูรณ์?
นี่ใช้ข้อมูลเป็นเวลาหนึ่งเดือน ฉันสามารถรับข้อมูลเป็นเวลาหลายเดือนและได้รับการจำลองแบบด้วยวิธีนั้น แต่ฉันต้องเพิ่มคำศัพท์ใหม่สำหรับรูปแบบรายเดือนและการโต้ตอบที่เป็นไปได้ถูกต้องไหม
การทางพิเศษแห่งประเทศไทย: ฉันวิ่งโมเดลด้านบนอีกครั้ง แต่ไม่มีfamily
ข้อโต้แย้ง (ดังนั้นเพียงแค่ LMM แบบเกาส์เซียนมากกว่า GLMM) ตอนนี้lmer
ให้ฉันข้อผิดพลาดต่อไปนี้:
ข้อผิดพลาดใน (ฟังก์ชั่น (fr, FL, start, REML, verbose): จำนวนระดับของปัจจัยการจัดกลุ่มสำหรับเอฟเฟกต์แบบสุ่มต้องน้อยกว่าจำนวนการสังเกต
ดังนั้นฉันเดาว่าฉันไม่ได้ทำอะไรที่สมเหตุสมผลเพราะการเปลี่ยนครอบครัวไม่ควรมีผลกระทบ แต่ตอนนี้คำถามคือทำไมมันทำงานในสถานที่แรก?