สถิติและข้อมูลขนาดใหญ่ poisson-regression

2

ปัวซงที่ไม่มีการตัดทอนเป็นศูนย์และปัวซงพื้นฐานซ้อนกันหรือไม่ซ้อนกันหรือไม่

ฉันได้เห็นมากมายที่พูดถึงว่าการถดถอยปัวซองพื้นฐานเป็นเวอร์ชันซ้อนกันของการถดถอยปัวซองแบบไม่พอง ตัวอย่างเช่นไซต์นี้ระบุว่าเป็นเพราะหลังมีพารามิเตอร์พิเศษเพื่อจำลองศูนย์เพิ่มเติม แต่รวมถึงพารามิเตอร์การถดถอยปัวซองเช่นเดียวกับอดีตแม้ว่าหน้าจะมีการอ้างอิงที่ไม่เห็นด้วย สิ่งที่ฉันไม่สามารถหาข้อมูลเกี่ยวกับได้คือว่าปัวซงที่ถูกตัดทอนและศูนย์ปัวซงพื้นฐานซ้อนกันหรือไม่ ถ้าปัวซองที่ถูกตัดทอนเป็นศูนย์เป็นเพียงปัวซองที่มีสเปคพิเศษที่ความน่าจะเป็นของการนับศูนย์เป็นศูนย์แล้วฉันคิดว่ามันน่าจะเป็นไปได้ แต่ฉันหวังว่าจะได้คำตอบที่ชัดเจนยิ่งขึ้น เหตุผลที่ฉันสงสัยว่ามันจะส่งผลต่อว่าฉันควรใช้การทดสอบของ Vuong (สำหรับแบบจำลองที่ไม่ซ้อนกัน) หรือการทดสอบไคสแควร์ขั้นพื้นฐานมากขึ้นตามความแตกต่างของ loglikelihoods (สำหรับแบบจำลองแบบซ้อน) Wilson (2015)พูดถึงว่าการทดสอบ Vuong นั้นเหมาะสมสำหรับการเปรียบเทียบการถดถอยแบบ zero-inflated กับการทดสอบพื้นฐานหรือไม่ แต่ฉันไม่สามารถหาแหล่งที่มาซึ่งกล่าวถึงข้อมูลที่ไม่มีการตัดทอนได้

9 poisson-regression zero-inflation

2

การประมาณอัตราส่วนความเสี่ยงที่ปรับแล้วในข้อมูลไบนารีโดยใช้การถดถอยแบบปัวซอง

ฉันสนใจที่จะประเมินอัตราส่วนความเสี่ยงที่ปรับแล้วซึ่งคล้ายกับวิธีที่เราประมาณการอัตราต่อรองที่ปรับแล้วโดยใช้การถดถอยโลจิสติกส์ วรรณกรรมบางฉบับ (เช่นนี้ ) บ่งชี้ว่าการใช้การถดถอยปัวซองกับข้อผิดพลาดมาตรฐานของฮิเบอร์ - ไวท์เป็นวิธีที่ใช้แบบจำลองในการทำสิ่งนี้ ฉันไม่พบวรรณกรรมเกี่ยวกับวิธีการปรับค่าความแปรปรวนร่วมต่อเนื่องที่มีผลต่อสิ่งนี้ การจำลองอย่างง่ายต่อไปนี้แสดงให้เห็นว่าปัญหานี้ไม่ตรงไปตรงมามาก: arr <- function(BLR,RR,p,n,nr,ce) { B = rep(0,nr) for(i in 1:nr){ b <- runif(n)<p x <- rnorm(n) pr <- exp( log(BLR) + log(RR)*b + ce*x) y <- runif(n)<pr model <- glm(y ~ b + x, family=poisson) B[i] <- coef(model)[2] } return( mean( …

9 r references biostatistics poisson-regression relative-risk

2

เหตุใดส่วนที่เหลือของ Pearson จากการถดถอยแบบทวินามเชิงลบจึงมีขนาดเล็กกว่าการถดถอยแบบปัวซอง

ฉันมีข้อมูลเหล่านี้: set.seed(1) predictor <- rnorm(20) set.seed(1) counts <- c(sample(1:1000, 20)) df <- data.frame(counts, predictor) ฉันใช้การถดถอยปัวซอง poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson") และการถดถอยแบบทวินามลบ require(MASS) nb_counts <- glm.nb(counts ~ predictor, data = df) จากนั้นฉันคำนวณหาสถิติการกระจายตัวสำหรับการถดถอยปัวซอง: sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts) # [1] 145.4905 และการถดถอยแบบทวินามลบ sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts) # [1] 0.7650289 มีใครที่สามารถอธิบายได้โดยไม่ต้องใช้เครื่องมือทำไมสถิติการกระจายตัวของการถดถอยแบบทวินามลบน้อยกว่าสถิติการกระจายตัวสำหรับการถดถอยปัวซอง

9 generalized-linear-model residuals negative-binomial poisson-regression dispersion

คำถามติดแท็ก poisson-regression