คำถามติดแท็ก overdispersion

Overdispersion คือเมื่อมีความแปรปรวนมากกว่าที่ควรจะเป็นในข้อมูล เช่นความแปรปรวนของจำนวนนับมักจะมากกว่าค่าเฉลี่ยในขณะที่ความแปรปรวนของปัวซองควรเท่ากับค่าเฉลี่ย

4
มีการทดสอบเพื่อตรวจสอบว่าการทับซ้อน GLM มีความสำคัญหรือไม่?
ฉันกำลังสร้าง Poisson GLMs ในอาร์ในการตรวจสอบ overdispersion summary(model.name)ฉันกำลังมองหาที่อัตราส่วนของการเบี่ยงเบนที่เหลือเพื่อองศาอิสระให้บริการโดย มีค่า cutoff หรือการทดสอบสำหรับอัตราส่วนนี้ที่จะพิจารณาว่า "สำคัญหรือไม่" ฉันรู้ว่าถ้ามัน> 1 ข้อมูลจะถูกใช้งานเกินขนาด แต่ถ้าฉันมีอัตราส่วนค่อนข้างใกล้กับ 1 [เช่นอัตราส่วนหนึ่งเท่ากับ 1.7 (ส่วนเบี่ยงเบนเหลือ = 25.48, df = 15) และอีก 1.3 (rd = 324, df = 253)] ฉันยังควรเปลี่ยนไปใช้ quasipoisson / binomial เชิงลบหรือไม่ ฉันพบที่นี่การทดสอบนี้เพื่อความสำคัญ: 1-pchisq (ส่วนเบี่ยงเบนเบี่ยงเบน, df) แต่ฉันเห็นเพียงครั้งเดียวซึ่งทำให้ฉันกังวล ฉันอ่านด้วย (ฉันไม่สามารถหาแหล่งที่มาได้) ว่าอัตราส่วน <1.5 มีความปลอดภัยโดยทั่วไป ความเห็น?

4
ฉันจะพอดีกับโมเดลหลายระดับสำหรับผลลัพธ์ปัวส์ซองที่กระจายอยู่ทั่วได้อย่างไร
ฉันต้องการติดตั้ง GLMM หลายระดับพร้อมการกระจายแบบปัวซอง (ด้วยการกระจายตัวมากเกินไป) โดยใช้ R ในขณะนี้ฉันกำลังใช้lme4แต่ฉันสังเกตเห็นว่าเมื่อเร็ว ๆ นี้quasipoissonครอบครัวถูกลบออก ฉันเคยเห็นที่อื่นว่าคุณสามารถสร้างแบบจำลองการกระจายตัวเกินสำหรับการแจกแจงทวินามโดยการเพิ่มการสกัดกั้นแบบสุ่มด้วยระดับหนึ่งต่อการสังเกต สิ่งนี้ใช้ได้กับการแจกแจงแบบปัวซองด้วยหรือไม่ มีวิธีที่ดีกว่าที่จะทำหรือไม่ มีแพ็คเกจอื่น ๆ ที่คุณอยากแนะนำอีกไหม?

2
การกระจายแบบกึ่งทวินามคืออะไร (ในบริบทของ GLM)
ฉันหวังว่าบางคนสามารถให้ภาพรวมที่เข้าใจง่ายเกี่ยวกับการกระจายตัวของ quasibinomial คืออะไรและมันทำอะไร ฉันสนใจในประเด็นเหล่านี้เป็นพิเศษ: วิธี quasibinomial แตกต่างกับการกระจายทวินาม เมื่อตัวแปรตอบสนองเป็นสัดส่วน (ค่าตัวอย่าง ได้แก่ 0.23, 0.11, 0.78, 0.98) โมเดล quasibinomial จะทำงานใน R แต่โมเดลทวินามจะไม่ ทำไมรูปแบบ quasibinomial ควรใช้เมื่อตัวแปรการตอบสนอง TRUE / FALSE เกินกำหนด

4
กลยุทธ์สำหรับการตัดสินใจรูปแบบที่เหมาะสมสำหรับการนับข้อมูล
กลยุทธ์ที่เหมาะสมในการตัดสินใจเลือกรุ่นใดที่จะใช้กับข้อมูลนับ ฉันมีข้อมูลนับที่ฉันต้องการสร้างแบบจำลองเป็นแบบหลายระดับและแนะนำให้ฉัน (บนเว็บไซต์นี้) ว่าวิธีที่ดีที่สุดในการทำเช่นนี้คือผ่านบั๊กหรือ MCMCglmm อย่างไรก็ตามฉันยังคงพยายามที่จะเรียนรู้เกี่ยวกับสถิติแบบเบย์และฉันคิดว่าฉันควรพยายามใส่ข้อมูลของฉันให้เป็นแบบจำลองเชิงเส้นแบบทั่วไปและไม่สนใจโครงสร้างซ้อนของข้อมูล ข้อมูลประมาณ 70% เป็น 0 และอัตราส่วนของความแปรปรวนต่อค่าเฉลี่ยคือ 33 ดังนั้นข้อมูลจึงกระจายตัวค่อนข้างมาก หลังจากลองใช้ตัวเลือกที่แตกต่างกันจำนวนมาก (รวมทั้งปัวซอง, รูปแบบลบ, แบบกึ่งและกึ่งศูนย์) ฉันเห็นความสอดคล้องกันน้อยมากในผลลัพธ์ (การเปลี่ยนแปลงจากทุกอย่างมีความหมาย ฉันจะตัดสินใจเกี่ยวกับรูปแบบประเภทใดให้เลือกโดยพิจารณาจากอัตราเงินเฟ้อ 0 และการกระจายตัวมากเกินไป ตัวอย่างเช่นฉันจะอนุมานได้ว่า quasi-poisson นั้นเหมาะสมกว่าเชิงลบแบบทวินาม (หรือในทางกลับกัน) และฉันจะรู้ได้อย่างไรว่าการใช้อย่างใดอย่างหนึ่งได้จัดการอย่างเพียงพอ (หรือไม่) ด้วยค่าศูนย์ส่วนเกิน? ในทำนองเดียวกันฉันจะประเมินได้อย่างไรว่าไม่มีการกระจายตัวมากเกินไปหากใช้ตัวแบบที่ไม่มีการขยายเกินศูนย์? หรือฉันควรจะตัดสินใจอย่างไรระหว่างปัวซงที่มีค่าเป็นศูนย์ที่สูงขึ้นและทวินามลบที่สูงเกินจริง

2
เมื่อมีคนบอกว่าส่วนเบี่ยงเบน / df ที่เหลือควร ~ 1 สำหรับโมเดลปัวซองค่าประมาณเป็นอย่างไร
ฉันมักจะเห็นคำแนะนำสำหรับการตรวจสอบว่าแบบจำลองของปัวซองนั้นเต็มไปด้วยการแยกส่วนเบี่ยงเบนที่เหลือด้วยองศาอิสระหรือไม่ อัตราส่วนผลลัพธ์ควรเป็น "ประมาณ 1" คำถามคือช่วงที่เรากำลังพูดถึงสำหรับ "โดยประมาณ" - อัตราส่วนที่ควรตั้งปิดสัญญาณเตือนเพื่อพิจารณารูปแบบรูปแบบทางเลือกคืออะไร?

2
ปัวซองหรือปัวซองกึ่งในการถดถอยด้วยการนับข้อมูลและการกระจายเกินพิกัด?
ฉันมีข้อมูลนับจำนวน (การวิเคราะห์อุปสงค์ / ข้อเสนอพร้อมจำนวนการนับลูกค้าขึ้นอยู่กับปัจจัยหลายอย่าง) ฉันลองการถดถอยเชิงเส้นโดยมีข้อผิดพลาดปกติ แต่ QQ-plot ของฉันไม่ค่อยดี ฉันพยายามบันทึกการเปลี่ยนแปลงของคำตอบ: อีกครั้งแผนการดี QQ ดังนั้นตอนนี้ฉันกำลังลองถดถอยด้วยข้อผิดพลาดปัวซอง ด้วยโมเดลที่มีตัวแปรสำคัญทั้งหมดฉันจะได้รับ: Null deviance: 12593.2 on 53 degrees of freedom Residual deviance: 1161.3 on 37 degrees of freedom AIC: 1573.7 Number of Fisher Scoring iterations: 5 การเบี่ยงเบนส่วนที่เหลือมีขนาดใหญ่กว่าองศาอิสระที่เหลืออยู่ฉันมีการกระจายเกินกำหนด ฉันจะรู้ได้อย่างไรว่าฉันต้องใช้ quasipoisson? เป้าหมายของ quasipoisson ในกรณีนี้คืออะไร? ฉันอ่านคำแนะนำนี้ใน "The R Book" โดย Crawley แต่ฉันไม่เห็นประเด็นหรือการปรับปรุงขนาดใหญ่ในกรณีของฉัน

2
การทดสอบการกระจายตัวใน GLMs * มีประโยชน์ * จริงหรือไม่
ปรากฏการณ์ของ 'การกระจายตัวมากเกินไป' ใน GLM เกิดขึ้นเมื่อใดก็ตามที่เราใช้แบบจำลองที่จำกัดความแปรปรวนของตัวแปรการตอบสนองและข้อมูลจะแสดงความแปรปรวนมากกว่าแบบ จำกัด ที่อนุญาต สิ่งนี้มักเกิดขึ้นเมื่อการสร้างแบบจำลองนับข้อมูลโดยใช้ Poisson GLM และสามารถวินิจฉัยได้จากการทดสอบที่รู้จักกันดี หากการทดสอบแสดงให้เห็นว่ามีหลักฐานนัยสำคัญทางสถิติของการกระจายตัวเกินเรามักจะสรุปโมเดลโดยใช้ตระกูลการแจกแจงที่กว้างขึ้นที่ทำให้พารามิเตอร์ความแปรปรวนจากข้อ จำกัด ที่เกิดขึ้นภายใต้โมเดลดั้งเดิม ในกรณีของ Poisson GLM มันเป็นเรื่องธรรมดาที่จะพูดคุยทั่วไปทั้งในเชิงลบ - ทวินามหรือกึ่ง - Poisson GLM สถานการณ์นี้กำลังตั้งท้องพร้อมกับคัดค้านอย่างชัดเจน ทำไมเริ่มต้นด้วย Poisson GLM เลยเหรอ? หนึ่งสามารถเริ่มต้นโดยตรงกับรูปแบบการกระจายที่กว้างขึ้นซึ่งมีพารามิเตอร์แปรปรวนอิสระ (ค่อนข้าง) และอนุญาตให้พารามิเตอร์แปรปรวนจะพอดีกับข้อมูลละเว้นการทดสอบการกระจายตัวเกินอย่างสมบูรณ์ ในสถานการณ์อื่น ๆ เมื่อเราทำการวิเคราะห์ข้อมูลเรามักจะใช้แบบฟอร์มการกระจายสินค้าที่อนุญาตให้มีอิสระอย่างน้อยสองครั้งแรกดังนั้นทำไมต้องมีข้อยกเว้นที่นี่ คำถามของฉัน:มีเหตุผลที่ดีที่เริ่มต้นด้วยการแจกแจงที่แก้ไขความแปรปรวน (เช่นการแจกแจงปัวซง) แล้วทำการทดสอบการกระจายตัวเกินหรือไม่? ขั้นตอนนี้เปรียบเทียบกับการกระโดดข้ามแบบฝึกหัดนี้ได้อย่างสมบูรณ์และตรงไปยังแบบจำลองทั่วไปที่มากขึ้น (เช่นลบ - ทวินาม, กึ่ง - ปัวซอง ฯลฯ )? กล่าวอีกนัยหนึ่งทำไมไม่ใช้การแจกแจงที่มีพารามิเตอร์ผลต่างอิสระเสมอไป

2
การสร้างแบบจำลองการกระจายปัวซองด้วยการกระจายเกินพิกัด
ฉันมีชุดข้อมูลที่ฉันคาดว่าจะติดตามการกระจายของปัวซอง แต่มันมีการกระจายตัวเกินประมาณ 3 เท่า ในปัจจุบันฉันกำลังสร้างแบบจำลองการกระจายเกินปกตินี้โดยใช้โค้ดต่อไปนี้ในอาร์ ## assuming a median value of 1500 med = 1500 rawdist = rpois(1000000,med) oDdist = rawDist + ((rawDist-med)*3) สายตาสิ่งนี้ดูเหมือนจะสอดคล้องกับข้อมูลเชิงประจักษ์ของฉันได้เป็นอย่างดี ถ้าฉันมีความสุขกับแบบที่มีเหตุผลใด ๆ ที่ฉันควรจะทำบางสิ่งบางอย่างที่ซับซ้อนมากขึ้นเช่นการใช้การแจกแจงแบบทวินามลบตามที่อธิบายไว้ที่นี่ ? (ถ้าเป็นเช่นนั้นพอยน์เตอร์หรือลิงก์ในการทำเช่นนั้นจะได้รับการชื่นชมมาก) โอ้และฉันรู้ว่าสิ่งนี้สร้างการกระจายแบบขรุขระเล็กน้อย (เนื่องจากการคูณด้วยสาม) แต่นั่นไม่ควรสำคัญสำหรับแอปพลิเคชันของฉัน อัปเดต: เพื่อประโยชน์ของผู้อื่นที่ค้นหาและพบคำถามนี้ต่อไปนี้เป็นฟังก์ชั่น R ที่ใช้ง่ายในการสร้างแบบจำลองปัวซองที่ใช้โอเวอร์เซ็ตโดยใช้การแจกแจงแบบทวินามลบ ตั้งค่า d เป็นอัตราส่วนค่าเฉลี่ย / ความแปรปรวนที่ต้องการ: rpois.od<-function (n, lambda,d=1) { if (d==1) rpois(n, lambda) else …

2
overdispersion ในการถดถอยโลจิสติก
ฉันพยายามจัดการกับแนวคิดของการกระจายเกินเหตุในการถดถอยโลจิสติก ฉันได้อ่านว่าการกระจายข้อความเกินขนาดนั้นเกิดขึ้นเมื่อความแปรปรวนที่สังเกตได้ของตัวแปรตอบกลับสูงกว่าที่คาดไว้จากการแจกแจงทวินาม แต่หากตัวแปรทวินามมีได้เพียงสองค่า (1/0) จะมีค่าเฉลี่ยและความแปรปรวนได้อย่างไร ฉันสบายดีกับการคำนวณค่าเฉลี่ยและความแปรปรวนของความสำเร็จจากการทดลองหมายเลข Bernoulli แต่ฉันไม่สามารถคาดเดาแนวคิดเรื่องค่าเฉลี่ยและความแปรปรวนของตัวแปรที่มีค่าได้สองค่าเท่านั้น ทุกคนสามารถให้ภาพรวมที่ใช้งานง่ายของ: แนวคิดของค่าเฉลี่ยและความแปรปรวนในตัวแปรที่สามารถมีได้สองค่าเท่านั้น แนวคิดของการกระจายเกินเหตุในตัวแปรที่มีได้เพียงสองค่า

1
จะจัดการกับ overdispersion ในการถดถอยของปัวซองได้อย่างไร: ความเป็นไปได้เสมือน, GLM ทวินามลบ, หรือเอฟเฟกต์แบบสุ่มระดับหัวเรื่อง?
ฉันได้พบกับข้อเสนอสามข้อเพื่อจัดการกับการกระจายเกินพิกัดในตัวแปรตอบกลับของปัวซองและโมเดลเริ่มต้นที่มีเอฟเฟกต์ถาวรทั้งหมด: ใช้แบบจำลองเสมือน; ใช้ GLM ลบแบบทวินาม ใช้โมเดลผสมกับเอฟเฟกต์แบบสุ่มระดับหัวเรื่อง แต่สิ่งที่จะเลือกจริงและทำไม? มีเกณฑ์ใดบ้างในกลุ่มนี้?

1
ค่าสัมประสิทธิ์ที่เหมือนกันประมาณในรูปแบบปัวซอง vs ควอซี - ปัวซอง
ในการสร้างแบบจำลองข้อมูลการนับการเรียกร้องในสภาพแวดล้อมการประกันภัยฉันเริ่มต้นด้วย Poisson แต่แล้วสังเกตเห็นการทับซ้อนกัน Quasi-Poisson เป็นแบบอย่างที่ดีกว่าความสัมพันธ์แปรปรวนที่ดีกว่า Poisson พื้นฐาน แต่ฉันสังเกตเห็นว่าสัมประสิทธิ์เป็นเหมือนกันทั้งใน Poisson และ Quasi-Poisson หากนี่ไม่ใช่ข้อผิดพลาดเหตุใดจึงเป็นเช่นนี้ การใช้ Quasi-Poisson บน Poisson มีประโยชน์อย่างไร สิ่งที่ควรทราบ: การสูญเสียที่อยู่ภายใต้พื้นฐานส่วนเกินซึ่ง (ฉันเชื่อว่า) ป้องกัน Tweedie จากการทำงาน - แต่มันเป็นการกระจายครั้งแรกที่ฉันพยายาม ฉันยังตรวจสอบรุ่นของ NB, ZIP, ZINB และ Hurdle แต่ก็ยังพบว่า Quasi-Poisson นั้นเหมาะสมที่สุด ฉันทดสอบการกระจายตัวเกินขนาดผ่านการทดสอบการกระจายในแพ็คเกจ AER พารามิเตอร์การกระจายของฉันอยู่ที่ประมาณ 8.4 โดยมีค่า p อยู่ที่ขนาด 10 ^ -16 ฉันกำลังใช้ glm () กับ family = …

1
การใช้มากเกินไปและการสร้างแบบจำลองทางเลือกในโมเดลเอฟเฟกต์แบบปัวซองที่มีออฟเซ็ต
ฉันพบคำถามเชิงปฏิบัติจำนวนมากเมื่อสร้างแบบจำลองนับข้อมูลจากการวิจัยเชิงทดลองโดยใช้การทดสอบภายในเรื่อง ฉันอธิบายการทดลองข้อมูลและสิ่งที่ฉันได้ทำไปแล้วตามด้วยคำถามของฉัน มีการฉายภาพยนตร์สี่เรื่องที่แตกต่างกันตามตัวอย่างของผู้ตอบแบบสอบถาม หลังจากภาพยนตร์แต่ละเรื่องทำการสัมภาษณ์กันซึ่งเราได้นับจำนวนการปรากฏของข้อความบางอย่างที่น่าสนใจสำหรับ RQ (ตัวแปรการนับที่คาดการณ์) นอกจากนี้เรายังบันทึกจำนวนสูงสุดของเหตุการณ์ที่เป็นไปได้ (หน่วยการเข้ารหัสตัวแปรออฟเซ็ต) นอกจากนี้ยังมีการวัดคุณลักษณะหลายอย่างของภาพยนตร์ในระดับต่อเนื่องซึ่งสำหรับหนึ่งเรามีสมมติฐานเชิงสาเหตุของผลกระทบของคุณลักษณะภาพยนตร์ที่มีต่อการนับข้อความในขณะที่คุณสมบัติอื่น ๆ เป็นตัวควบคุม (ตัวทำนาย) กลยุทธ์การสร้างแบบจำลองที่นำมาใช้จนถึงมีดังนี้: ประมาณค่าแบบจำลองเอฟเฟกต์ปัวซงโดยใช้ตัวแปรสาเหตุเป็นตัวแปรร่วมและตัวแปรอื่น ๆ เป็นตัวแปรควบคุม รุ่นนี้มีการชดเชยเท่ากับ 'บันทึก (หน่วย)' (หน่วยการเข้ารหัส) เอฟเฟกต์แบบสุ่มจะถูกนำไปใช้กับตัวแบบ (จำนวนเฉพาะของภาพยนตร์นั้นซ้อนอยู่ในตัวแบบ) เราพบว่าสมมติฐานเชิงสาเหตุได้รับการยืนยัน (sig. สัมประสิทธิ์ของตัวแปรเชิงสาเหตุ) ในการประมาณค่าเราใช้แพ็คเกจ lme4 ใน R โดยเฉพาะฟังก์ชัน glmer ตอนนี้ฉันมีคำถามต่อไปนี้ ปัญหาที่พบบ่อยในการถดถอยปัวซองคือ ฉันรู้ว่าสิ่งนี้สามารถทดสอบได้โดยใช้การถดถอยแบบทวินามลบและประเมินว่าพารามิเตอร์การกระจายของมันช่วยปรับปรุงแบบจำลองของปัวซองแบบง่าย ๆ หรือไม่ อย่างไรก็ตามฉันไม่รู้ว่าจะทำอย่างไรในบริบทของเอฟเฟกต์แบบสุ่ม ฉันควรทดสอบ overispersion ในสถานการณ์ของฉันอย่างไร ฉันทดสอบการกระจายตัวมากเกินไปในปัวซอง / การถดถอยแบบทวินามเชิงลบอย่างง่าย (ที่ไม่มีเอฟเฟกต์แบบสุ่ม) ที่ฉันรู้ว่าจะพอดีได้อย่างไร การทดสอบแสดงให้เห็นการปรากฏตัวของ overdispersion อย่างไรก็ตามเนื่องจากรุ่นเหล่านี้ไม่ได้พิจารณาการจัดกลุ่มฉันจึงคิดว่าการทดสอบนี้ไม่ถูกต้อง นอกจากนี้ฉันไม่แน่ใจเกี่ยวกับบทบาทของออฟเซ็ตสำหรับการทดสอบการเกินขนาด มีแบบจำลองการถดถอยเอฟเฟกต์แบบสุ่มแบบลบทวินามแบบลบหรือไม่และฉันควรใส่ใน …

2
จะทดสอบการกระจายตัวมากเกินไปใน Poisson GLMM ด้วย lmer () ใน R ได้อย่างไร
ฉันมีรูปแบบดังต่อไปนี้: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... และนี่คือผลลัพธ์สรุป > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: Groups Name Variance Std.Dev. landscape …

2
แบบจำลองพารามิเตอร์ของความแปรปรวนของข้อมูลการนับ
ฉันกำลังมองหาแบบจำลองข้อมูลบางอย่าง แต่ฉันไม่แน่ใจว่าแบบจำลองชนิดใดที่ฉันสามารถใช้ได้ ฉันมีข้อมูลนับและฉันต้องการรูปแบบที่จะให้การประมาณค่าพารามิเตอร์ของทั้งค่าเฉลี่ยและความแปรปรวนของข้อมูล นั่นคือฉันมีปัจจัยการทำนายที่หลากหลายและฉันต้องการตรวจสอบว่ามีปัจจัยใดที่ส่งผลต่อความแปรปรวน (ไม่ใช่แค่ค่าเฉลี่ยของกลุ่ม) ฉันรู้ว่าการถดถอยของปัวซองจะไม่ทำงานเพราะความแปรปรวนเท่ากับค่าเฉลี่ย สมมติฐานนี้ไม่ถูกต้องในกรณีของฉันดังนั้นฉันรู้ว่ามีการกระจายเกินจริง อย่างไรก็ตามโมเดลทวินามลบเชิงลบจะสร้างพารามิเตอร์ overdispersion เดียวเท่านั้นไม่ใช่แบบจำลองฟังก์ชันของตัวทำนายในโมเดล รูปแบบใดที่สามารถทำได้ นอกจากนี้การอ้างอิงถึงหนังสือหรือกระดาษที่กล่าวถึงรูปแบบและ / หรือแพคเกจ R ซึ่งใช้รูปแบบจะได้รับการชื่นชม

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.