ปัวซองกำลังจะยกกำลังเป็นแกมม่าปัวซองคืออะไร?


16

กระจาย Poisson สามารถวัดเหตุการณ์ต่อหน่วยเวลาและพารามิเตอร์เป็นλλการแจกแจงเอ็กซ์โพเนนเชียลวัดเวลาจนถึงเหตุการณ์ถัดไปด้วยพารามิเตอร์1λλ หนึ่งสามารถแปลงการแจกแจงแบบหนึ่งให้เป็นแบบอื่นได้ขึ้นอยู่กับว่ามันง่ายกว่าในการจำลองเหตุการณ์หรือเวลา

ตอนนี้ Gamma-Poisson เป็น Poisson แบบ "ยืด" ที่มีความแปรปรวนมากขึ้น การแจกแจงแบบ Weibull เป็นเลขชี้กำลัง "ยืด" ที่มีความแปรปรวนมากขึ้น แต่ทั้งสองจะสามารถแปลงเป็นกันและกันได้อย่างง่ายดายในลักษณะเดียวกันปัวซองสามารถแปลงเป็นเลขชี้กำลัง?

หรือมีการกระจายอื่น ๆ ที่เหมาะสมกว่าที่จะใช้ร่วมกับการกระจายแกมม่า - ปัวซอง?

แกมม่าปัวซองเรียกอีกอย่างว่าการกระจายตัวแบบทวินามเชิงลบหรือ NBD

คำตอบ:


14

นี่เป็นปัญหาที่ค่อนข้างตรงไปตรงมา แม้ว่าจะมีการเชื่อมโยงระหว่างการแจกแจงปัวซงและการลบแบบทวินาม แต่จริงๆแล้วฉันคิดว่ามันไม่เป็นประโยชน์สำหรับคำถามเฉพาะของคุณเพราะมันกระตุ้นให้ผู้คนคิดถึงกระบวนการทวินามลบ โดยทั่วไปคุณมีชุดของกระบวนการปัวซง:

Yi(ti)|λiPoisson(λiti)

ไหนYiเป็นกระบวนการและtiคือเวลาที่คุณสังเกตเห็นมันและiหมายถึงบุคคล และคุณกำลังบอกว่ากระบวนการเหล่านี้ "คล้ายกัน" โดยการผูกอัตราเข้าด้วยกันด้วยการแจกแจง:

λiGamma(α,β)

เมื่อทำการรวม / mxixing บนλiคุณมี:

Yผม(เสื้อผม)|αβ~ยังไม่มีข้อความอีก.Bผมn(α,พีผม)Wชั่วโมงอีRอีพีผม=เสื้อผมเสื้อผม+β

นี่คือ pmf ของ:

Pr(Yi(ti)=yi|αβ)=Γ(α+yi)Γ(α)yi!piyi(1pi)α

เพื่อรับการกระจายเวลารอคอยเราทราบว่า:

= 1 - ( 1 - p i ) α = 1 - ( 1 +

Pr(Titi|αβ)=1Pr(Ti>ti|αβ)=1Pr(Yi(ti)=0|αβ)
=1(1pi)α=1(1+tiβ)α

แยกความแตกต่างนี้และคุณมี PDF:

pTi(ti|αβ)=αβ(1+tiβ)(α+1)

นี่เป็นสมาชิกของการแจกแจงพาเรโตทั่วไปพิมพ์ II ฉันจะใช้สิ่งนี้เป็นการกระจายเวลารอของคุณ

หากต้องการดูการเชื่อมต่อกับการแจกแจงปัวซองให้สังเกตว่าเพื่อที่ว่าถ้าเราตั้งβ=ααβ=E(λi|αβ)และจากนั้น จำกัดαเราได้รับ:β=αλα

limααβ(1+tiβ)(α+1)=limαλ(1+λtiα)(α+1)=λexp(λti)

1α


1
นอกจากนี้คุณยังสามารถทราบได้ว่าการแจกแจงเวลารอคอยนั้นคือการพูดการแจกแจงแบบเอ็กซ์โพเนนเชียลด้วยพารามิเตอร์อัตราสุ่มแกมมาและการพูดอย่างเคร่งครัดนี่คือการแจกแจงเบต้าของชนิดที่สองเช่นเดียวกับการแจกแจงแกมมาใด ๆ
Stéphane Laurent

การใช้ @probabilityislogic เป็นพื้นฐานฉันพบบทความต่อไปนี้ที่ให้รายละเอียดเพิ่มเติมเกี่ยวกับความสัมพันธ์ระหว่าง NBD และ Pareto: Gupta, Sunil และ Donald G. Morrison ประมาณการ Heterogeneith ในอัตราการจัดซื้อของผู้บริโภค วิทยาศาสตร์การตลาด, 1991, 10 (3), 264-269 ขอบคุณทุกคนที่ช่วยฉันตอบคำถามนี้
zbicyclist

+1, ฉันเดาว่ารูปแบบการวิเคราะห์ที่ดีนี้อาจไม่มีอยู่อีกต่อไป Poisson(λiti+c), where c is a constant.
Randel

1
@randel - you could get a "nice-ish" form by noting this rv is the sum of two independent rvs...Zi=Yi+Xi where Yi is the same as above and Xipoisson(c). As Xi doesn't depend on λi or Yi the pdf of Zi is the convolution of the above negative binomial pdf and a poisson pdf. To get the waiting time distribution just multiply Pr(Yi=0) in the above answer by Pr(Xi=0)=ec. You then get waiting time cdf of 1ec(1+tiβ)α and pdf of ecαβ(1+tiβ)(α+1).
probabilityislogic

1
This won't work in terms of the mixing distribution, because you need λi<cti1 (else the poisson mean is negative). The gamma mixing distribution would need to be truncated (I also assumed that c>0 in my previous answer). This would mean no nb distribution.
probabilityislogic

4

One possibility: Poisson is to Exponential as Negative-Binomial is to ... Exponential!

There is a pure-jump increasing Lévy process called the Negative Binomial Process such that at time t the value has a negative binomial distribution. Unlike the Poisson process, the jumps are not almost surely 1. Instead, they follow a logarithmic distribution. By the law of total variance, some of the variance comes from the number of jumps (scaled by the average size of the jumps), and some of the variance comes from the sizes of the jumps, and you can use this to check that it is overdispersed.

There may be other useful descriptions. See "Framing the negative binomial distribution for DNA sequencing."


Let me be more explicit about how the Negative Binomial Process described above can be constructed.

  • Choose p<1.

  • Let X1,X2,X3,... be IID with logarithmic distributions, so P(xi=k)=1log(1p)pkk.

  • Let N be a Poisson process with constant rate log(1p), so N(t)=Pois(tlog(1p)).

  • Let NBP be the process so that

NBP(t)=i=1N(t)Xi.

NBP is a pure jump process with logarithmically distributed jumps. The gaps between jumps follow an exponential distribution with rate log(1p).

I don't think it is obvious from this description that NBP(t) has a negative binomial NB(t,p) distribution, but there is a short proof using probability generating functions on Wikipedia, and Fisher also proved this when he introduced the logarithmic distribution to analyze the relative frequencies of species.


1
No, any compound Poisson process has an exponential waiting time. This means you add Pois(λt) IID random variables with some distribution.
Douglas Zare

No, that is not what is meant by a compound Poisson process. en.wikipedia.org/wiki/Compound_Poisson_process " The jumps arrive randomly according to a Poisson process and the size of the jumps is also random, with a specified probability distribution." I did not say IID Poisson variables. You take the Nth partial sum of IID logarithmic random variables where N is the value of a Poisson process.
Douglas Zare

If you multiply a Poisson process by 2, this is not a Poisson process and the waiting times remain exponential.
Douglas Zare


0

I am not able to comment yet so I apologize is this isn't a definitive solution.

You are asking for the appropriate distribution to use with an NB but appropriate isn't entirely defined. If an appropriate distribution means appropriate for explaining data and you are starting with an overdispersed Poisson then you may have to look further into the cause of the overdispersion. The NB doesn't distinguish between a Poisson with heterogeneous means or a positive occurrence dependence (that one event occurring increases the probability of another occurring). In continuous time there is also duration dependence, eg positive duration dependence means the passage of time increases the probability of an occurrence. It was also shown that negative duration dependence asymptotically causes an overdispersed Poisson[1]. This adds to the list of what might be the appropriate waiting time model.


1
cause of the overdispersion: This is consumer purchase data. Individual consumers are poisson, each with a rate of purchase lambda. But not every consumer has the same lambda -- that's the cause of the overdispersion. The lambda purchasing rates are considered to be distributed as gamma. This is a common model (traces back to A.S.C. Ehrenberg), but I haven't found anything in his writing that answers this question.
zbicyclist
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.