คำถามติดแท็ก glmm

โดยทั่วไปแล้วแบบจำลองเชิงเส้นผสม (เอฟเฟกต์) ทั่วไปมักใช้สำหรับการสร้างแบบจำลองข้อมูลที่ไม่ใช่ข้อมูลปกติที่ไม่เป็นอิสระ (เช่นข้อมูลไบนารีตามยาว)

3
ฉันจะทดสอบได้อย่างไรว่าเอฟเฟกต์แบบสุ่มนั้นสำคัญหรือไม่
ฉันพยายามเข้าใจว่าควรใช้เอฟเฟกต์แบบสุ่มเมื่อใดและไม่จำเป็น ฉันถูกบอกแล้วว่ากฎง่ายๆคือถ้าคุณมี 4 คนขึ้นไป / กลุ่มที่ฉันทำ (15 ตัวมูซแต่ละตัว) กวางมูซเหล่านี้บางส่วนถูกทดลองใน 2 หรือ 3 ครั้งรวมเป็น 29 การทดลอง ฉันต้องการที่จะรู้ว่าพวกเขาทำงานแตกต่างกันเมื่อพวกเขาอยู่ในภูมิทัศน์ที่มีความเสี่ยงสูงกว่าไม่ ดังนั้นฉันคิดว่าฉันจะตั้งค่าบุคคลเป็นผลสุ่ม อย่างไรก็ตามตอนนี้ฉันถูกบอกว่าไม่จำเป็นต้องรวมบุคคลนั้นเป็นเอฟเฟกต์แบบสุ่มเพราะไม่มีการตอบสนองที่หลากหลาย สิ่งที่ฉันไม่สามารถหาได้คือวิธีการทดสอบว่ามีอะไรบางอย่างที่เป็นจริงเมื่อทำการตั้งค่าบุคคลให้เป็นเอฟเฟกต์แบบสุ่ม อาจเป็นคำถามเริ่มต้น: การทดสอบ / การวินิจฉัยใดที่ฉันสามารถทำได้เพื่อแยกแยะว่าปัจเจกบุคคลเป็นตัวแปรอธิบายที่ดีหรือไม่และควรเป็นผลคงที่ - แปลง qq หรือไม่ histograms? แผนการกระจาย? และสิ่งที่ฉันจะมองหาในรูปแบบเหล่านั้น ฉันวิ่งโมเดลโดยที่แต่ละคนเป็นเอฟเฟกต์แบบสุ่มและไม่มี แต่ฉันอ่านhttp://glmm.wikidot.com/faqโดยที่พวกเขาระบุว่า: อย่าเปรียบเทียบโมเดล lmer กับ lm ที่เหมาะสมหรือ glmer / glm; บันทึกความน่าจะเป็นไม่ได้เป็นไปตามความเหมาะสม (กล่าวคือมีเงื่อนไขเพิ่มเติมต่างกัน) และที่นี่ฉันถือว่านี่หมายความว่าคุณไม่สามารถเปรียบเทียบระหว่างแบบจำลองที่มีเอฟเฟกต์แบบสุ่มหรือแบบไม่มี แต่ฉันไม่รู้ว่าควรเปรียบเทียบอะไรกันแน่ ในโมเดลของฉันที่มีเอฟเฟกต์แบบสุ่มฉันก็พยายามที่จะดูผลลัพธ์เพื่อดูว่าหลักฐานหรือนัยสำคัญชนิดใดที่ RE มี lmer(Velocity ~ D.CPC.min …

3
ความแตกต่างระหว่างโมเดลเชิงเส้นทั่วไปกับโมเดลผสมเชิงเส้นทั่วไป
ฉันสงสัยว่าอะไรคือความแตกต่างระหว่าง GLM แบบผสมและแบบผสม ตัวอย่างเช่นใน SPSS เมนูแบบเลื่อนลงอนุญาตให้ผู้ใช้พอดี: analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear พวกเขาจัดการกับค่าที่หายไปแตกต่างกันอย่างไร ตัวแปรตามของฉันคือไบนารีและฉันมีตัวแปรอิสระหลายหมวดหมู่และต่อเนื่อง

2
การวินิจฉัยรุ่นเชิงเส้น (แบบผสม) ทั่วไป (ส่วนที่เหลือโดยเฉพาะ)
ฉันกำลังดิ้นรนกับการหารูปแบบที่เหมาะสมสำหรับข้อมูลการนับยาก (ตัวแปรตาม) ฉันลองรุ่นที่แตกต่างหลากหลาย (โมเดลเอฟเฟ็กต์แบบผสมมีความจำเป็นสำหรับข้อมูลชนิดของฉัน) เช่นlmerและlme4(พร้อมการแปลงล็อก) รวมถึงโมเดลเอฟเฟกต์แบบผสมเชิงเส้นทั่วไปกับครอบครัวต่างๆเช่น Gaussian หรือ Binomial เชิงลบ อย่างไรก็ตามฉันค่อนข้างไม่แน่ใจในวิธีการวินิจฉัยอย่างถูกต้องเหมาะสมกับผลลัพธ์ ฉันพบความคิดเห็นที่แตกต่างกันมากมายในหัวข้อนั้นบนเว็บ ฉันคิดว่าการวินิจฉัยการถดถอยเชิงเส้น (แบบผสม) ค่อนข้างตรงไปตรงมา คุณสามารถไปข้างหน้าและวิเคราะห์ส่วนที่เหลือ (ปกติ) รวมทั้งศึกษา heteroscedasticity โดยการวางแผนค่าติดตั้งเปรียบเทียบกับส่วนที่เหลือ อย่างไรก็ตามคุณจะทำอย่างนั้นสำหรับรุ่นทั่วไปได้อย่างไร ให้เรามุ่งเน้นการถดถอยแบบทวินามลบ (แบบผสม) ในตอนนี้ ฉันเห็นข้อความคัดค้านที่เกี่ยวข้องกับสิ่งที่เหลืออยู่ที่นี่: ในการตรวจสอบค่าคงที่สำหรับค่าปกติในโมเดลเชิงเส้นทั่วไปมันจะถูกชี้ให้เห็นในคำตอบแรกว่าส่วนที่เหลือจะไม่แจกแจงแบบปกติสำหรับ GLM; ฉันคิดว่านี่ชัดเจน อย่างไรก็ตามมันก็ชี้ให้เห็นว่าเพียร์สันและส่วนเบี่ยงเบนเบี่ยงเบนก็ไม่ควรจะเป็นปกติ กระนั้นคำตอบที่สองระบุว่าควรแจกแจกส่วนเบี่ยงเบนปกติ (รวมกับการอ้างอิง) โดยปกติแล้วความเบี่ยงเบนที่เหลืออยู่นั้นควรจะมีการบอกกล่าวไว้ในเอกสารประกอบสำหรับ? glm.diag.plots (จากbootแพ็คเกจของ R ) ในบล็อกโพสต์นี้ผู้เขียนได้ทำการศึกษาเรื่องปกติของสิ่งที่ฉันคิดว่าเป็นของเพียร์สันสำหรับแบบจำลองการถดถอยแบบผสมผลกระทบ NB ตามที่คาดไว้ (ตามความเห็นของฉัน) เศษซากไม่ได้แสดงให้เห็นว่าเป็นเรื่องปกติและผู้เขียนสันนิษฐานว่าแบบจำลองนี้ไม่เหมาะสม อย่างไรก็ตามตามที่ระบุไว้ในความคิดเห็นที่เหลือควรกระจายตามการกระจายทวินามลบ ในความคิดของฉันสิ่งนี้ใกล้เคียงกับความจริงมากที่สุดเนื่องจากส่วนที่เหลือของ GLM สามารถมีการแจกแจงแบบอื่นที่ไม่ใช่แบบปกติ ถูกต้องหรือไม่ จะตรวจสอบสิ่งต่าง ๆ เช่น heteroscedasticity …

2
ทำไมฉันถึงได้รับผลต่างแบบไม่มีศูนย์ของเอฟเฟกต์แบบสุ่มในโมเดลผสมของฉันแม้ว่าข้อมูลจะมีการเปลี่ยนแปลงบ้าง
เราได้เรียกใช้การถดถอยโลจิสติกเอฟเฟ็กต์แบบผสมโดยใช้ไวยากรณ์ต่อไปนี้ # fit model fm0 <- glmer(GoalEncoding ~ 1 + Group + (1|Subject) + (1|Item), exp0, family = binomial(link="logit")) # model output summary(fm0) หัวเรื่องและรายการเป็นเอฟเฟกต์แบบสุ่ม เราได้ผลลัพธ์ที่แปลกซึ่งมีค่าสัมประสิทธิ์และความเบี่ยงเบนมาตรฐานสำหรับเทอมที่เป็นทั้งคู่ Generalized linear mixed model fit by maximum likelihood (Laplace Approximation) [glmerMod] Family: binomial ( logit ) Formula: GoalEncoding ~ 1 + Group + (1 | …

2
วิธีการใช้ binomial GLMM (glmer) กับเปอร์เซ็นต์แทนที่จะเป็นจำนวนใช่หรือไม่?
ฉันมีการทดสอบซ้ำหลายครั้งโดยที่ตัวแปรตามคือร้อยละและฉันมีหลายปัจจัยเป็นตัวแปรอิสระ ฉันต้องการใช้glmerจากแพ็คเกจ R lme4เพื่อจัดการกับปัญหาการถดถอยโลจิสติก (โดยระบุfamily=binomial) เนื่องจากดูเหมือนว่าจะรองรับการตั้งค่านี้โดยตรง ข้อมูลของฉันมีลักษณะเช่นนี้: > head(data.xvsy) foldnum featureset noisered pooldur dpoolmode auc 1 0 mfcc-ms nr0 1 mean 0.6760438 2 1 mfcc-ms nr0 1 mean 0.6739482 3 0 melspec-maxp nr075 1 max 0.8141421 4 1 melspec-maxp nr075 1 max 0.7822994 5 0 chrmpeak-tpor1d nr075 1 max 0.6547476 …

4
จะประเมินความพอดีของ binomial GLMM ที่ติดตั้ง lme4 (> 1.0) ได้อย่างไร?
ฉันมี GLMM ที่มีการแจกแจงแบบทวินามและฟังก์ชันการเชื่อมโยง logit และฉันรู้สึกว่าข้อมูลที่สำคัญไม่ได้ถูกนำเสนอในโมเดล เพื่อทดสอบสิ่งนี้ฉันอยากจะรู้ว่าข้อมูลถูกอธิบายอย่างดีโดยฟังก์ชันเชิงเส้นในสเกล logit หรือไม่ ดังนั้นฉันต้องการทราบว่าส่วนที่เหลือมีความประพฤติดีหรือไม่ อย่างไรก็ตามฉันไม่สามารถหาว่าพล็อตส่วนที่เหลือจะพล็อตและวิธีการตีความพล็อต โปรดทราบว่าฉันใช้รุ่นใหม่ของ lme4 ( รุ่นพัฒนาจาก GitHub ): packageVersion("lme4") ## [1] ‘1.1.0’ คำถามของฉันคือ: ฉันจะตรวจสอบและตีความส่วนที่เหลือของแบบผสมเชิงเส้นแบบทวินามเชิงเส้นทั่วไปพร้อมฟังก์ชันการเชื่อมโยง logit ได้อย่างไร ข้อมูลต่อไปนี้แสดงให้เห็นถึงข้อมูลจริงของฉันเพียง 17% แต่การติดตั้งอุปกรณ์ใช้เวลาประมาณ 30 วินาทีบนเครื่องของฉันดังนั้นฉันจึงปล่อยให้มันเป็นเช่นนี้: require(lme4) options(contrasts=c('contr.sum', 'contr.poly')) dat <- read.table("http://pastebin.com/raw.php?i=vRy66Bif") dat$V1 <- factor(dat$V1) m1 <- glmer(true ~ distance*(consequent+direction+dist)^2 + (direction+dist|V1), dat, family = binomial) พล็อตที่ง่ายที่สุด …

1
ความหมายของคำเตือนการบรรจบกันใน Glmer
ฉันใช้glmerฟังก์ชันจากlme4แพ็คเกจใน R และฉันใช้bobyqaเครื่องมือเพิ่มประสิทธิภาพ (เช่นค่าเริ่มต้นในกรณีของฉัน) ฉันได้รับคำเตือนและฉันสงสัยว่ามันหมายถึงอะไร Warning message: In optwrap(optimizer, devfun, start, rho$lower, control = control, : convergence code 3 from bobyqa: bobyqa -- a trust region step failed to reduce q ฉันค้นหา "ขั้นตอนภูมิภาคที่เชื่อถือได้ล้มเหลวในการลด q" พบข้อมูลบางอย่างในแพ็คเกจ minqaซึ่งพูดว่า "Consult Powell สำหรับคำอธิบาย" ฉันทำ (คุณสามารถทำได้เช่นกันหากคุณต้องการ! ดูการอ้างอิงและลิงก์ไปยังพวกเขาด้านล่าง) แต่ฉันไม่เข้าใจ ที่จริงแล้วฉันไม่พบสิ่งใดเกี่ยวกับการลด q MJD Powell (2007) "การพัฒนา NEWUOA …

1
วิธีการพอดีกับแบบผสมกับตัวแปรการตอบสนองระหว่าง 0 และ 1
ฉันกำลังพยายามใช้lme4::glmer()ให้พอดีกับแบบจำลองผสมแบบทวินามทั่วไป (GLMM) กับตัวแปรตามที่ไม่ใช่ไบนารี แต่เป็นตัวแปรต่อเนื่องระหว่างศูนย์ถึงหนึ่ง ใคร ๆ ก็นึกถึงตัวแปรนี้ว่าเป็นความน่าจะเป็น ในความเป็นจริงมันเป็นความน่าจะเป็นตามรายงานของมนุษย์ (ในการทดลองที่ฉันช่วยวิเคราะห์) คือมันไม่ใช่เศษส่วนแบบแยก แต่เป็นตัวแปรต่อเนื่อง glmer()สายของฉันไม่ทำงานตามที่คาดไว้ (ดูด้านล่าง) ทำไม? ฉันควรทำอย่างไร แก้ไขในภายหลัง: คำตอบของฉันด้านล่างกว้างกว่าคำถามเดิมของรุ่นนี้ดังนั้นฉันจึงแก้ไขคำถามให้กว้างขึ้นเช่นกัน รายละเอียดเพิ่มเติม เห็นได้ชัดว่ามันเป็นไปได้ที่จะใช้การถดถอยโลจิสติกไม่เพียง แต่สำหรับไบนารี DV แต่สำหรับ DV ต่อเนื่องระหว่างศูนย์และหนึ่ง แน่นอนเมื่อฉันวิ่ง glm(reportedProbability ~ a + b + c, myData, family="binomial") ฉันได้รับข้อความเตือน Warning message: In eval(expr, envir, enclos) : non-integer #successes in a binomial glm! แต่แบบที่สมเหตุสมผลมาก (ปัจจัยทั้งหมดเป็นหมวดหมู่ดังนั้นฉันสามารถตรวจสอบได้อย่างง่ายดายว่าการคาดการณ์แบบจำลองนั้นใกล้เคียงกับวิธีการข้ามวิชาและเป็นอย่างไร) …

1
เอฟเฟกต์แบบสุ่มด้วยการสังเกตเพียง 1 ครั้งจะส่งผลอย่างไรต่อโมเดลเชิงเส้นผสมทั่วไป
ฉันมีชุดข้อมูลที่ตัวแปรที่ฉันต้องการใช้เป็นเอฟเฟกต์แบบสุ่มมีการสังเกตเพียงครั้งเดียวสำหรับบางระดับ จากคำตอบของคำถามก่อนหน้านี้ฉันได้รวบรวมว่าโดยหลักการแล้วสิ่งนี้สามารถทำได้ ฉันสามารถใส่โมเดลผสมกับวัตถุที่มีเพียง 1 การสังเกตได้หรือไม่ โมเดลดักจับแบบสุ่ม - หนึ่งการวัดต่อหนึ่งเรื่อง อย่างไรก็ตามในลิงค์ที่สองคำตอบแรกจะระบุว่า: "... สมมติว่าคุณไม่ได้ใช้GLMMรุ่นผสมเชิงเส้นทั่วไปที่ในกรณีนั้นปัญหาของการกระจายตัวเกินเข้ามาเล่น" ฉันกำลังพิจารณาใช้ GLMM แต่ฉันไม่เข้าใจจริงๆว่าระดับเอฟเฟกต์แบบสุ่มด้วยการสังเกตเพียงครั้งเดียวจะส่งผลกระทบต่อโมเดลได้อย่างไร นี่คือตัวอย่างหนึ่งในโมเดลที่ฉันพยายามทำ ฉันกำลังศึกษานกและฉันต้องการจำลองผลกระทบของประชากรและฤดูกาลตามจำนวนการหยุดระหว่างการย้ายถิ่น ฉันต้องการใช้เอฟเฟกต์แบบสุ่มเพราะสำหรับบางคนฉันมีข้อมูลมากถึง 5 ปี library(dplyr) library(lme4) pop <- as.character(c("BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "BF", "MA", "MA", "MA", "MA", "MA", "MA", …

1
การคำนวณ ICC สำหรับการถดถอยโลจิสติกส์แบบสุ่มผลกระทบ
ฉันใช้รูปแบบการถดถอยโลจิสติกในรูปแบบ: lmer(response~1+(1|site), family=binomial, REML = FALSE) โดยปกติฉันจะคำนวณ ICC จากการสกัดกั้นและผลต่างที่เหลือ แต่การสรุปของโมเดลไม่รวมความแปรปรวนที่เหลือ ฉันจะคำนวณสิ่งนี้ได้อย่างไร

1
การใช้มากเกินไปและการสร้างแบบจำลองทางเลือกในโมเดลเอฟเฟกต์แบบปัวซองที่มีออฟเซ็ต
ฉันพบคำถามเชิงปฏิบัติจำนวนมากเมื่อสร้างแบบจำลองนับข้อมูลจากการวิจัยเชิงทดลองโดยใช้การทดสอบภายในเรื่อง ฉันอธิบายการทดลองข้อมูลและสิ่งที่ฉันได้ทำไปแล้วตามด้วยคำถามของฉัน มีการฉายภาพยนตร์สี่เรื่องที่แตกต่างกันตามตัวอย่างของผู้ตอบแบบสอบถาม หลังจากภาพยนตร์แต่ละเรื่องทำการสัมภาษณ์กันซึ่งเราได้นับจำนวนการปรากฏของข้อความบางอย่างที่น่าสนใจสำหรับ RQ (ตัวแปรการนับที่คาดการณ์) นอกจากนี้เรายังบันทึกจำนวนสูงสุดของเหตุการณ์ที่เป็นไปได้ (หน่วยการเข้ารหัสตัวแปรออฟเซ็ต) นอกจากนี้ยังมีการวัดคุณลักษณะหลายอย่างของภาพยนตร์ในระดับต่อเนื่องซึ่งสำหรับหนึ่งเรามีสมมติฐานเชิงสาเหตุของผลกระทบของคุณลักษณะภาพยนตร์ที่มีต่อการนับข้อความในขณะที่คุณสมบัติอื่น ๆ เป็นตัวควบคุม (ตัวทำนาย) กลยุทธ์การสร้างแบบจำลองที่นำมาใช้จนถึงมีดังนี้: ประมาณค่าแบบจำลองเอฟเฟกต์ปัวซงโดยใช้ตัวแปรสาเหตุเป็นตัวแปรร่วมและตัวแปรอื่น ๆ เป็นตัวแปรควบคุม รุ่นนี้มีการชดเชยเท่ากับ 'บันทึก (หน่วย)' (หน่วยการเข้ารหัส) เอฟเฟกต์แบบสุ่มจะถูกนำไปใช้กับตัวแบบ (จำนวนเฉพาะของภาพยนตร์นั้นซ้อนอยู่ในตัวแบบ) เราพบว่าสมมติฐานเชิงสาเหตุได้รับการยืนยัน (sig. สัมประสิทธิ์ของตัวแปรเชิงสาเหตุ) ในการประมาณค่าเราใช้แพ็คเกจ lme4 ใน R โดยเฉพาะฟังก์ชัน glmer ตอนนี้ฉันมีคำถามต่อไปนี้ ปัญหาที่พบบ่อยในการถดถอยปัวซองคือ ฉันรู้ว่าสิ่งนี้สามารถทดสอบได้โดยใช้การถดถอยแบบทวินามลบและประเมินว่าพารามิเตอร์การกระจายของมันช่วยปรับปรุงแบบจำลองของปัวซองแบบง่าย ๆ หรือไม่ อย่างไรก็ตามฉันไม่รู้ว่าจะทำอย่างไรในบริบทของเอฟเฟกต์แบบสุ่ม ฉันควรทดสอบ overispersion ในสถานการณ์ของฉันอย่างไร ฉันทดสอบการกระจายตัวมากเกินไปในปัวซอง / การถดถอยแบบทวินามเชิงลบอย่างง่าย (ที่ไม่มีเอฟเฟกต์แบบสุ่ม) ที่ฉันรู้ว่าจะพอดีได้อย่างไร การทดสอบแสดงให้เห็นการปรากฏตัวของ overdispersion อย่างไรก็ตามเนื่องจากรุ่นเหล่านี้ไม่ได้พิจารณาการจัดกลุ่มฉันจึงคิดว่าการทดสอบนี้ไม่ถูกต้อง นอกจากนี้ฉันไม่แน่ใจเกี่ยวกับบทบาทของออฟเซ็ตสำหรับการทดสอบการเกินขนาด มีแบบจำลองการถดถอยเอฟเฟกต์แบบสุ่มแบบลบทวินามแบบลบหรือไม่และฉันควรใส่ใน …

2
จะทดสอบการกระจายตัวมากเกินไปใน Poisson GLMM ด้วย lmer () ใน R ได้อย่างไร
ฉันมีรูปแบบดังต่อไปนี้: > model1<-lmer(aph.remain~sMFS1+sAG1+sSHDI1+sbare+season+crop +(1|landscape),family=poisson) ... และนี่คือผลลัพธ์สรุป > summary(model1) Generalized linear mixed model fit by the Laplace approximation Formula: aph.remain ~ sMFS1 + sAG1 + sSHDI1 + sbare + season + crop + (1 | landscape) AIC BIC logLik deviance 4057 4088 -2019 4039 Random effects: Groups Name Variance Std.Dev. landscape …

1
โมเดลชายขอบกับโมเดลสุ่มเอฟเฟกต์ - วิธีการเลือกระหว่างพวกเขา? คำแนะนำสำหรับคนธรรมดา
ในการค้นหาข้อมูลเกี่ยวกับตัวแบบขอบและตัวแบบสุ่มเอฟเฟกต์และวิธีการเลือกระหว่างพวกเขาฉันได้พบข้อมูลบางอย่าง แต่มันเป็นคำอธิบายเชิงนามธรรมทางคณิตศาสตร์มากขึ้นหรือน้อยลง (เช่นตัวอย่างที่นี่: https: //stats.stackexchange .com / a / 68753/38080 ) ที่ไหนสักแห่งที่ฉันพบว่ามีการสังเกตความแตกต่างอย่างมากระหว่างการประมาณค่าพารามิเตอร์ระหว่างสองวิธี / โมเดล ( http://www.biomedcentral.com/1471-2288/2/15/ ) อย่างไรก็ตามสิ่งที่ตรงกันข้ามถูกเขียนโดย Zuur et al . (2009, p. 116; http://link.springer.com/book/10.1007%2F978-0-387-87458-6) รุ่น Marginal (generalized การประเมินวิธีการสม) นำพารามิเตอร์ของประชากรเฉลี่ยในขณะที่ผลจากการสุ่มผลรุ่น (ทั่วไปเชิงเส้นรูปแบบผสม) นำเข้าผลสุ่มบัญชี - เรื่อง (Verbeke et al, 2010, หน้า 49-52.. http: / /link.springer.com/chapter/10.1007/0-387-28980-1_16 ) ฉันต้องการที่จะเห็นคำอธิบายเหมือนคนธรรมดาของแบบจำลองเหล่านี้ที่แสดงในตัวอย่างบางส่วน (ในชีวิตจริง) ในภาษาที่คุ้นเคยกับนักสถิติและนักคณิตศาสตร์ที่ไม่ใช่นักคณิตศาสตร์ ในรายละเอียดฉันต้องการทราบ: ควรใช้โมเดลร่อแร่และควรใช้โมเดลสุ่มเอฟเฟกต์เมื่อใด …

2
โมเดลเชิงเส้นผสมแบบทั่วไป: การวินิจฉัย
ฉันมีการถดถอยแบบลอจิสติกเพื่อสกัดกั้นแบบสุ่ม (เนื่องจากการวัดซ้ำ) และฉันต้องการที่จะทำการวินิจฉัยบางอย่างโดยเฉพาะเกี่ยวกับค่าผิดปกติและการสังเกตที่มีอิทธิพล ฉันดูที่เหลือเพื่อดูว่ามีข้อสังเกตที่โดดเด่นหรือไม่ แต่ฉันก็อยากจะดูบางอย่างเช่นระยะทางของ Cook หรือ DFFITS Hosmer และ Lemeshow (2000) กล่าวว่าเนื่องจากการขาดเครื่องมือวินิจฉัยแบบจำลองสำหรับข้อมูลที่มีความสัมพันธ์หนึ่งควรจะพอดีกับแบบจำลองการถดถอยโลจิสติกปกติละเว้นความสัมพันธ์และใช้เครื่องมือวินิจฉัยที่มีอยู่สำหรับการถดถอยโลจิสติกปกติ พวกเขายืนยันว่าสิ่งนี้จะดีกว่าไม่ได้ทำการวินิจฉัยใด ๆ เลย หนังสือเล่มนี้มาจากปี 2000 และฉันสงสัยว่าตอนนี้มีวิธีการสำหรับการวินิจฉัยแบบจำลองที่มีผลกระทบการถดถอยโลจิสติกแบบผสมหรือไม่? สิ่งที่จะเป็นวิธีที่ดีในการตรวจสอบค่าผิดปกติ? แก้ไข (5 พฤศจิกายน 2013): เนื่องจากการขาดการตอบสนองฉันสงสัยว่าการทำการวินิจฉัยด้วยโมเดลที่หลากหลายนั้นไม่ได้ทำโดยทั่วไปหรือไม่ใช่ขั้นตอนที่สำคัญเมื่อทำการสร้างแบบจำลองข้อมูล ดังนั้นฉันขอใช้ถ้อยคำใหม่คำถามของฉัน: คุณจะทำอย่างไรเมื่อคุณพบรูปแบบการถดถอยที่ "ดี"?

1
การติดตั้ง GLOM แบบทวินาม (glmer) กับตัวแปรตอบกลับที่เป็นสัดส่วนหรือเศษส่วน
ฉันหวังว่าใครบางคนสามารถช่วยในสิ่งที่ฉันคิดว่าเป็นคำถามที่ค่อนข้างง่ายและฉันคิดว่าฉันรู้คำตอบ แต่ไม่มีการยืนยันมันกลายเป็นสิ่งที่ฉันไม่แน่ใจ ฉันมีข้อมูลการนับเป็นตัวแปรตอบกลับและฉันต้องการวัดว่าตัวแปรนั้นเปลี่ยนแปลงไปอย่างไรด้วยการมีสัดส่วนของบางสิ่งบางอย่าง ในรายละเอียดเพิ่มเติมตัวแปรตอบสนองจะนับการมีอยู่ของสปีชีส์ของแมลงในหลาย ๆ ไซต์ดังนั้นตัวอย่างจะถูกสุ่มตัวอย่าง 10 ครั้งและสปีชีส์นี้อาจเกิดขึ้น 4 ครั้ง ฉันต้องการที่จะดูว่าสิ่งนี้มีความสัมพันธ์กับการปรากฏตัวตามสัดส่วนของกลุ่มพันธุ์พืชใน commmunity โดยรวมของพืชที่เว็บไซต์เหล่านี้ ซึ่งหมายความว่าข้อมูลของฉันมีลักษณะดังนี้ (นี่เป็นเพียงตัวอย่าง) Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence 1, 5, 10, 0.5 2, 3, 10, 0.3 3, 7, 9, 0.6 4, 0, 9, 0.1 ข้อมูลยังรวมถึงเอฟเฟกต์แบบสุ่มสำหรับตำแหน่ง ฉันคิดว่าสองวิธีหนึ่งจะเป็นแบบจำลองเชิงเส้น ( lmer) กับแมลงที่แปลงเป็นสัดส่วนเช่น lmer.model<-lmer(insectCount/NumberOfInsectSamples~ ProportionalPlantGroupPresence+(1|Location),data=Data) ครั้งที่สองจะเป็นแบบทวินาม GLMM ( glmer) เช่น glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.