ปัวซงที่ไม่มีการตัดทอนเป็นศูนย์และปัวซงพื้นฐานซ้อนกันหรือไม่ซ้อนกันหรือไม่


9

ฉันได้เห็นมากมายที่พูดถึงว่าการถดถอยปัวซองพื้นฐานเป็นเวอร์ชันซ้อนกันของการถดถอยปัวซองแบบไม่พอง ตัวอย่างเช่นไซต์นี้ระบุว่าเป็นเพราะหลังมีพารามิเตอร์พิเศษเพื่อจำลองศูนย์เพิ่มเติม แต่รวมถึงพารามิเตอร์การถดถอยปัวซองเช่นเดียวกับอดีตแม้ว่าหน้าจะมีการอ้างอิงที่ไม่เห็นด้วย

สิ่งที่ฉันไม่สามารถหาข้อมูลเกี่ยวกับได้คือว่าปัวซงที่ถูกตัดทอนและศูนย์ปัวซงพื้นฐานซ้อนกันหรือไม่ ถ้าปัวซองที่ถูกตัดทอนเป็นศูนย์เป็นเพียงปัวซองที่มีสเปคพิเศษที่ความน่าจะเป็นของการนับศูนย์เป็นศูนย์แล้วฉันคิดว่ามันน่าจะเป็นไปได้ แต่ฉันหวังว่าจะได้คำตอบที่ชัดเจนยิ่งขึ้น

เหตุผลที่ฉันสงสัยว่ามันจะส่งผลต่อว่าฉันควรใช้การทดสอบของ Vuong (สำหรับแบบจำลองที่ไม่ซ้อนกัน) หรือการทดสอบไคสแควร์ขั้นพื้นฐานมากขึ้นตามความแตกต่างของ loglikelihoods (สำหรับแบบจำลองแบบซ้อน)

Wilson (2015)พูดถึงว่าการทดสอบ Vuong นั้นเหมาะสมสำหรับการเปรียบเทียบการถดถอยแบบ zero-inflated กับการทดสอบพื้นฐานหรือไม่ แต่ฉันไม่สามารถหาแหล่งที่มาซึ่งกล่าวถึงข้อมูลที่ไม่มีการตัดทอนได้

คำตอบ:


4

เพิ่งเจอกันตอนนี้ เพื่อหลีกเลี่ยงความสับสนฉันคือ Wilson of Wilson (2015) ที่อ้างอิงในคำถามเดิมซึ่งถามว่าแบบจำลอง Poisson และ Poisson ที่ถูกตัดทอนซ้อนกันไม่ใช่ซ้อนกันเป็นต้นทำให้ง่ายขึ้นเล็กน้อยแบบจำลองขนาดเล็กจะซ้อนอยู่ในแบบจำลองขนาดใหญ่ขึ้น โมเดลลดขนาดที่เล็กลงถ้าเซ็ตย่อยของพารามิเตอร์ได้รับการแก้ไขตามค่าที่ระบุ สองแบบซ้อนกันถ้าทั้งคู่ลดลงเป็นแบบเดียวกันเมื่อเซ็ตย่อยของพารามิเตอร์นั้นถูกกำหนดเป็นค่าที่แน่นอนพวกมันจะไม่ซ้อนกันถ้าไม่ว่าพารามิเตอร์จะถูกแก้ไขอย่างไร ตามคำจำกัดความนี้ปัวซองที่ถูกตัดทอนและปัวซองมาตรฐานนั้นไม่ซ้อนกัน อย่างไรก็ตามและนี่คือจุดที่หลายคนมองข้ามทฤษฎีการกระจายของ Vuong หมายถึงการซ้อนกันอย่างเข้มงวดไม่ซ้อนกันอย่างเข้มงวด และทับซ้อนกันอย่างเข้มงวด "อย่างเคร่งครัด" หมายถึงการเพิ่มข้อ จำกัด หกข้อในคำจำกัดความพื้นฐานของการซ้อน ฯลฯ ข้อ จำกัด เหล่านี้ไม่ง่ายอย่างแน่นอน แต่เหนือสิ่งอื่นใดหมายความว่าผลลัพธ์ของ Vuong เกี่ยวกับการกระจายของอัตราส่วนความน่าจะเป็นบันทึกไม่สามารถใช้ได้ในกรณีที่ นางแบบ / ดิสทริบิวชันจะซ้อนกันที่ขอบเขตของพื้นที่พารามิเตอร์ (เช่นกรณีที่มีปัวซอง / ศูนย์ปัวซองพองตัวด้วยตัวเชื่อมโยงสำหรับพารามิเตอร์ศูนย์เงินเฟ้อ -) หรือเมื่อรูปแบบหนึ่งมีแนวโน้มไปที่อื่นเมื่อพารามิเตอร์มีแนวโน้มที่จะไม่มีที่สิ้นสุด เป็นกรณีที่มี Poisson / zero-inflated Poisson เมื่อใช้การเชื่อมโยง logit เพื่อสร้างแบบจำลองพารามิเตอร์ zero-inflation Vuong ไม่มีทฤษฎีก้าวหน้าเกี่ยวกับการกระจายตัวของอัตราส่วนความน่าจะเป็นของบันทึกในสถานการณ์เหล่านี้ น่าเสียดายที่นี่

รหัส R ต่อไปนี้จะจำลองการกระจายตัวของปัวส์ซองและอัตราส่วนการตัดทอนของปัวซอง มันต้องมีVGAMแพคเกจ

n<-30   
lambda1<-1
H<-rep(999,10000)
for(i in 1:10000){
  print(i)
  y<-rpospois(n, lambda1)
  fit1 <- vglm(y ~ 1, pospoisson)
  fit2<-glm(y~1, family=poisson(link="log"))
  H[i]<-logLik(fit1)-logLik(fit2)
}

hist(H,col="lemonchiffon")

4

ปัวซองขั้นพื้นฐานสามารถคิดเป็นซ้อนในรูปแบบทั่วไปมากขึ้น:

พี(x)=(1-พี)อี-λλxx!+พี1(x=0)

เมื่อไหร่ พี=0เรามีปัวซองพื้นฐาน เมื่อไหร่พี=-ประสบการณ์{-λ}/(1-ประสบการณ์{-λ})เรามีปัวซองที่ไม่มีการตัดทอน เมื่อไหร่-ประสบการณ์{-λ}/(1-ประสบการณ์{-λ})<พี<0เรามีปัวซองที่ลดลงเป็นศูนย์ เมื่อไหร่0<พี<1เรามีปัวซองที่มีค่าเป็นศูนย์และเรามีการแจกแจงที่แย่ลงที่ พี=1.

สำหรับฉันแล้วดูเหมือนว่าการทดสอบ Vuong รุ่นที่ซ้อนกันหรือไคสแควร์ตามที่คุณแนะนำจะเหมาะสมในกรณีของคุณ แต่โปรดสังเกตว่าไคสแควร์อาจมีปัญหาเนื่องจากความน่าจะเป็นที่ "เล็กน้อย" (สัมพันธ์กับλ) การสังเกต คุณอาจต้องการใช้ bootstrap เพื่อรับค่า p สำหรับสถิติไคสแควร์แทนที่จะใช้ asymptotics ยกเว้นว่าคุณมีข้อมูลค่อนข้างมาก


ขอบคุณ @jbowman - นั่นเป็นคำตอบที่เข้มงวดยิ่งกว่าที่ฉันหวังไว้ ฉันไม่ชัดเจน: ฉันคิดว่าจุดทดสอบทั้งหมดของ Vuong นั้นสำหรับรุ่นที่ไม่ซ้อนกันดังนั้นถึงแม้ว่าจะไปไกลกว่าโพสต์ต้นฉบับของฉันคุณสามารถให้ข้อมูลเพิ่มเติมเล็กน้อยเกี่ยวกับ "การทดสอบ Vuong รุ่นซ้อน" เพื่อให้ชัดเจนเกี่ยวกับแหล่งที่มาของความสับสนของฉัน: จนถึงขณะนี้ฉันเพิ่งทราบถึงvuongฟังก์ชั่นในแพ็คเกจpsclใน R ซึ่งบอกว่ามันเป็นรุ่นที่ไม่ซ้อนกัน ฉันเพิ่ง googled และพบฟังก์ชั่นvuongtestในแพคเกจnonnest2ซึ่งรวมถึงการโต้แย้ง 'ซ้อน' มันคืออะไร
Justin

ใช่นั่นแหละ. ที่จริงแล้วหน้า Wikipedia en.wikipedia.org/wiki/Vuong%27s_closeness_testในการทดสอบ Vuong นั้นมีประโยชน์เล็กน้อย (มักไม่ค่อยมาก) ในการอธิบายความแตกต่าง
jbowman

1
NB ทั้ง Poisson & Poisson zero-truncated เป็นกรณีพิเศษของการแจกแจงที่คุณกำหนดไว้ อันหนึ่งไม่ซ้อนกัน ดังนั้นคุณไม่สามารถใช้ทฤษฎีบทของวิลก์สเพื่อหาค่าการแจกแจงแบบไคม์ไคติคแบบ asymptotic สำหรับอัตราส่วนความน่าจะเป็นของบันทึกสองเท่าซึ่งแล้วแต่ว่าคุณจะเป็นสมมุติฐานว่าง (ฉันคิดว่ามีเงื่อนไขปกติสำหรับการทดสอบ Vuong ด้วย)
Scortchi - Reinstate Monica

3
@Scortchi ฉันอยากรู้เกี่ยวกับคำจำกัดความของ "ซ้อน" ที่คุณใช้อยู่ แม้ว่าฉันจะไม่เห็นด้วยกับข้อสรุปของคุณ แต่ฉันมาจากมุมมองที่แตกต่างกันเล็กน้อย: ใช่ปัวซงซ้อนอยู่ภายในครอบครัวนี้ (เพราะมันเกิดจากการ จำกัดพี=0) แต่ข้อสรุปต่าง ๆ เกี่ยวกับการแจกแจงแบบไม่ระบุชื่อของการประมาณพารามิเตอร์ MLE สำหรับ พี ไม่ใช้เพราะค่านี้ของ พี อยู่บนขอบเขตของครอบครัว ฉันขาดความแตกต่างที่สำคัญบ้างไหม?
whuber

2
@whuber ฉันจะแสดงความคิดเห็น / ให้คำตอบเกี่ยวกับจุดเดียวกัน ลิงค์อ้างอิงไม่หมายเหตุ: "... แม้ว่าการกระจายไคสแควร์อาจต้องปรับบางส่วนเนื่องจากข้อ จำกัด อยู่ในขอบเขตของพื้นที่พารามิเตอร์"
เบน Bolker
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.