การเปรียบเทียบตัวแบบการถดถอยกับข้อมูลการนับ


11

ฉันเพิ่งพอดีแบบจำลองการถดถอย 4 แบบสำหรับข้อมูลตัวทำนาย / ตอบกลับเดียวกัน รุ่นที่ฉันพอดีกับการถดถอยของปัวซอง

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

แบบจำลองสองแบบที่ฉันพอดีกับการถดถอยแบบทวินาม

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

มีการทดสอบทางสถิติที่ฉันสามารถใช้เพื่อเปรียบเทียบแบบจำลองเหล่านี้หรือไม่ ฉันใช้ AIC เป็นเครื่องวัดพอดี แต่ AFAIK นี่ไม่ได้แสดงถึงการทดสอบจริง


คุณต้องการเปรียบเทียบความพอดีของแบบจำลองโดยใช้การทดสอบทางสถิติใช่ไหม คุณต้องการทดสอบสมมติฐานแบบใด
ดับเพลิง

@Firefeather ตัวอย่างเช่นผมต้องการที่จะทดสอบว่าพอดีของmodel.nb.interเป็นอย่างมีนัยสำคัญmodel.pois.interดีกว่า ใช่ AIC นั้นต่ำกว่า แต่จะถือว่าดีกว่าเท่าไหร่?
Daniel Standage

หมายเหตุ: คำตอบสำหรับคำถามนี้ไม่จำเป็นต้องรวม AIC
Daniel Standage

ฉันไม่ทราบคำตอบสำหรับคำถามนี้ แต่ฉันสามารถเริ่มต้นได้ ฉันรู้ว่าคุณสามารถใช้ทดสอบเพื่อเปรียบเทียบกับ(และในทำนองเดียวกันเปรียบเทียบกับ) แต่ฉันไม่สามารถรับประกันการเปรียบเทียบระหว่างรูปแบบ Poisson และรูปแบบทวินามเชิงลบที่จะทำงาน ฉันสงสัยว่าการทดสอบเพื่อเปรียบเทียบความแปรปรวนของแต่ละคู่จะเชื่อถือได้หรือไม่ Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF
ดับเพลิง

1
@ Firefeather ใช่ฉันตระหนักถึงความจำเป็นในการควบคุมระดับความเชื่อมั่นในครอบครัว Scheffe จะเหมาะสมกว่าที่นี่มากกว่าพูด Bonferroni หรือไม่
Daniel Standage

คำตอบ:


14

คุณสามารถเปรียบเทียบแบบจำลองทวินามลบกับโมเดลปัวซองที่สอดคล้องกับการทดสอบอัตราส่วนความน่าจะเป็น แบบปัวซองนั้นเทียบเท่ากับแบบจำลองทวินามลบด้วยพารามิเตอร์การกระจายเกินศูนย์ที่ ดังนั้นจึงเป็นโมเดลที่ซ้อนกันและอัตราส่วนความน่าจะเป็นที่ถูกต้อง ภาวะแทรกซ้อนคือพารามิเตอร์ overdispersion ถูก จำกัด ให้ไม่เป็นลบนั่นคือมีเหตุผลไม่น้อยกว่าศูนย์ดังนั้นสมมติฐานว่างอยู่บนขอบเขตของพื้นที่พารามิเตอร์ ซึ่งหมายความว่าแทนที่จะเปรียบเทียบความเป็นไปได้สองครั้งกับการแจกแจงแบบไคสแควร์ที่มีอิสระในระดับหนึ่งคุณต้องเปรียบเทียบมันกับการกระจายแบบผสมที่ประกอบด้วยชิ้นส่วนเท่า ๆ กันของไคสแควร์ที่มี 1 df (การแจกแจงแบบไคสแควร์ที่ไม่มีองศาอิสระ) ความหมายในทางปฏิบัติคือคุณสามารถคำนวณค่า p โดยใช้ไค - สแควร์ด้วย 1 df แล้วลดลงครึ่งหนึ่ง สำหรับรายละเอียดเพิ่มเติมและพื้นหลังให้ดูกรณีที่ 5 ของตนเอง & เหลียงJASA 2530; 82 : 605-610 .

โปรดทราบว่าบางแพคเกจซอฟต์แวร์เชิงสถิติเช่น Stata จะทำสิ่งนี้ให้คุณโดยอัตโนมัติเมื่อคุณใส่โมเดลทวินามลบ ในความเป็นจริงที่ฉันได้ลงคอ cribbed มากดังกล่าวข้างต้นจากระบบ Stata ช่วยเหลือ - ถ้าคุณมี Stata help j_chibarดู


5

ฉันเชื่อanova()ใน R สามารถใช้สำหรับสิ่งนี้ แม้จะมีชื่อมันก็คือการทดสอบอัตราส่วนความน่าจะเป็น Crawley ในThe R Bookของเขามีตัวอย่างการใช้งานบางอย่าง


1

ในฐานะที่เป็นออนท็อปโน๊ตเนื่องจากโมเดลนั้นซ้อนกันคุณสามารถทำการทดสอบอัตราส่วนความน่าจะเป็นได้

โดยทั่วไปแม้ว่าจะไม่เป็นเช่นนั้นดังนั้นหากคุณต้องการเปรียบเทียบแบบจำลองที่ไม่ซ้อนกันคุณสามารถใช้การทดสอบของ Vuongได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.