คำถามติดแท็ก gamma-distribution

การกระจายความน่าจะเป็นแบบไม่ต่อเนื่องที่ไม่เป็นลบจัดทำดัชนีโดยพารามิเตอร์เชิงบวกสองตัว

3
ปัวซองกำลังจะยกกำลังเป็นแกมม่าปัวซองคืออะไร?
กระจาย Poisson สามารถวัดเหตุการณ์ต่อหน่วยเวลาและพารามิเตอร์เป็นλλλ\lambdaการแจกแจงเอ็กซ์โพเนนเชียลวัดเวลาจนถึงเหตุการณ์ถัดไปด้วยพารามิเตอร์1λ1λ\frac{1}{\lambda}λ หนึ่งสามารถแปลงการแจกแจงแบบหนึ่งให้เป็นแบบอื่นได้ขึ้นอยู่กับว่ามันง่ายกว่าในการจำลองเหตุการณ์หรือเวลา ตอนนี้ Gamma-Poisson เป็น Poisson แบบ "ยืด" ที่มีความแปรปรวนมากขึ้น การแจกแจงแบบ Weibull เป็นเลขชี้กำลัง "ยืด" ที่มีความแปรปรวนมากขึ้น แต่ทั้งสองจะสามารถแปลงเป็นกันและกันได้อย่างง่ายดายในลักษณะเดียวกันปัวซองสามารถแปลงเป็นเลขชี้กำลัง? หรือมีการกระจายอื่น ๆ ที่เหมาะสมกว่าที่จะใช้ร่วมกับการกระจายแกมม่า - ปัวซอง? แกมม่าปัวซองเรียกอีกอย่างว่าการกระจายตัวแบบทวินามเชิงลบหรือ NBD


2
Kullback – Leibler ความแตกต่างระหว่างการแจกแจงแกมม่าสองครั้ง
การเลือกเพื่อกำหนดพารามิเตอร์การแจกแจงแกมม่าΓ(b,c)Γ(b,c)\Gamma(b,c)โดย pdf g(x;b,c)=1Γ(c)xc−1bce−x/bg(x;b,c)=1Γ(c)xc−1bce−x/bg(x;b,c) = \frac{1}{\Gamma(c)}\frac{x^{c-1}}{b^c}e^{-x/b} Kullback-Leibler divergence ระหว่างΓ(bq,cq)Γ(bq,cq)\Gamma(b_q,c_q)และΓ(bp,cp)Γ(bp,cp)\Gamma(b_p,c_p)ได้รับจาก [1] เป็น KLG( bQ, คQ; ขพี, คพี)= ( cQ- 1 ) Ψ ( cQ) - บันทึกขQ- คQ- บันทึกΓ ( cQ) + บันทึกΓ ( cพี)+ cพีเข้าสู่ระบบขพี- ( cพี- 1 ) ( Ψ ( cQ) + บันทึกขQ) + bQคQขพีKLGa(ขQ,คQ;ขพี,คพี)=(คQ-1)Ψ(คQ)-เข้าสู่ระบบ⁡bq−cq−log⁡Γ(cq)+log⁡Γ(cp)+cplog⁡bp−(cp−1)(Ψ(cq)+log⁡bq)+bqcqbp\begin{align} KL_{Ga}(b_q,c_q;b_p,c_p) &= (c_q-1)\Psi(c_q) - \log …

1
ความสัมพันธ์ระหว่างการแจกแจงแกมม่าและไคสแควร์
ถ้าโดยที่X i ∼ N ( 0 , σ 2 ) , นั่นคือXทั้งหมดของฉันคือ iid ตัวแปรสุ่มแบบสุ่มของศูนย์หมายความว่ามีค่าความแปรปรวนเดียวกันจากนั้นY ∼ Γ ( NY= ∑i = 1ยังไม่มีข้อความX2ผมY=∑i=1NXi2Y=\sum_{i=1}^{N}X_i^2Xผม∼ N( 0 , σ2)Xi∼N(0,σ2)X_i \sim \mathcal{N}(0,\sigma^2)XผมXiX_iY∼ Γ ( N2, 2 σ2) .Y∼Γ(N2,2σ2).Y \sim \Gamma\left(\frac{N}{2},2\sigma^2\right). ฉันรู้ว่าการกระจายตัวไคสแควร์เป็นกรณีพิเศษของการแจกแจงแกมม่า แต่ไม่สามารถหาการกระจายไคสแควร์สำหรับตัวแปรสุ่มได้ มีอะไรให้ช่วยไหม?YYY

1
ทำไมพวกเขาถึงเลือกการกระจายแกมม่าที่นี่?
ในตอนหนึ่งของการออกกำลังกายสำหรับหลักสูตรของเรากำลังใช้ชุดข้อมูลทางการแพทย์ Kaggle แบบฝึกหัดบอกว่า: เราต้องการสร้างแบบจำลองการกระจายตัวของค่าใช้จ่ายส่วนบุคคลและเรายังต้องการที่จะได้รับความไม่แน่นอนเกี่ยวกับการกระจายนั้นเพื่อให้เราสามารถจับช่วงค่าที่เราอาจเห็นได้ดีขึ้น กำลังโหลดข้อมูลและแสดงมุมมองเริ่มต้น: เราอาจสงสัยจากข้างต้นว่ามีการแจกแจงแบบ exponential คล้ายกับที่นี่ ... อาจมีค่าใช้จ่ายในการเคลมประกันหลายรูปแบบ การแจกแจงแกมม่านั้นสามารถนำมาใช้ได้และเราสามารถทดสอบเรื่องนี้สำหรับการกระจายของค่าใช้จ่ายที่ไม่ได้เรียกร้องประกันก่อน ผมเงยหน้าขึ้นมอง "แจกแจงแกมมา" และพบว่า "อย่างต่อเนื่องในเชิงบวกอย่างเดียวกระจายรูปแบบเดียวที่ encodes เวลาที่จำเป็นสำหรับ«อัลฟา»เหตุการณ์จะเกิดขึ้นในกระบวนการ Poisson กับเวลาที่เข้าพักเฉลี่ยของ«เบต้า»" ไม่มีเวลาเกี่ยวข้องที่นี่เพียงแค่ค่าใช้จ่ายที่ไม่เกี่ยวข้องไม่ว่าจะเป็นการประกันหรือไม่ก็ตาม ทำไมพวกเขาถึงเลือกการกระจายแกมม่า?

1
ค่าที่คาดหวังของการกระจาย Dirichlet ที่แก้ไขคืออะไร (ปัญหาการรวม)
มันง่ายในการสร้างตัวแปรสุ่มที่มีการแจกแจงไดริชเลตโดยใช้ตัวแปรแกมม่าที่มีพารามิเตอร์สเกลเดียวกัน ถ้า: Xi∼Gamma(αi,β)Xi∼Gamma(αi,β) X_i \sim \text{Gamma}(\alpha_i, \beta) แล้ว: (X1∑jXj,…,Xn∑jXj)∼Dirichlet(α1,…,αn)(X1∑jXj,…,Xn∑jXj)∼Dirichlet(α1,…,αn) \left(\frac{X_1}{\sum_j X_j},\; \ldots\; , \frac{X_n}{\sum_j X_j}\right) \sim \text{Dirichlet}(\alpha_1,\;\ldots\;,\alpha_n) ปัญหา จะเกิดอะไรขึ้นถ้าพารามิเตอร์ของสเกลไม่เท่ากัน Xi∼Gamma(αi,βi)Xi∼Gamma(αi,βi) X_i \sim \text{Gamma}(\alpha_i, \beta_i) แล้วการกระจายตัวของตัวแปรนี้คืออะไร? (X1∑jXj,…,Xn∑jXj)∼?(X1∑jXj,…,Xn∑jXj)∼? \left(\frac{X_1}{\sum_j X_j},\; \ldots\; , \frac{X_n}{\sum_j X_j}\right) \sim \; ? สำหรับฉันมันคงเพียงพอที่จะรู้คุณค่าที่คาดหวังของการกระจายตัวนี้ ฉันต้องการสูตรพีชคณิตแบบปิดโดยประมาณที่สามารถประเมินได้อย่างรวดเร็วโดยคอมพิวเตอร์ สมมุติว่าการประมาณด้วยความเที่ยงตรง 0.01 นั้นเพียงพอแล้ว คุณสามารถสันนิษฐานได้ว่า: αi,βi∈Nαi,βi∈N \alpha_i, \beta_i \in \mathbb{N} หมายเหตุในระยะสั้นงานคือการหาการประมาณของอินทิกรัลนี้: f(α⃗ ,β⃗ )=∫Rn+x1∑jxj⋅∏jβαjjΓ(αj)xαj−1je−βjxjdx1…dxnf(α→,β→)=∫R+nx1∑jxj⋅∏jβjαjΓ(αj)xjαj−1e−βjxjdx1…dxn …

3
คะแนนทดสอบเป็นไปตามการแจกแจงปกติหรือไม่
ฉันพยายามเรียนรู้ว่าการแจกแจงแบบใดที่จะใช้ใน GLMs และฉันสับสนเล็กน้อยเมื่อต้องใช้การแจกแจงแบบปกติ ในส่วนหนึ่งของตำราเรียนของฉันบอกว่าการแจกแจงแบบปกติอาจจะดีสำหรับการทำแบบจำลองคะแนนสอบ ในส่วนถัดไปมันจะถามว่าการจัดจำหน่ายแบบใดที่เหมาะสมในการสร้างแบบจำลองการเคลมประกันรถยนต์ เวลานี้มันบอกว่าการแจกแจงที่เหมาะสมจะเป็นแกมม่าหรืออินเวอร์สเกาส์เนื่องจากพวกมันมีค่าบวกอย่างต่อเนื่องเท่านั้น ฉันเชื่อว่าคะแนนสอบจะต่อเนื่องกับค่าบวกเท่านั้นดังนั้นทำไมเราถึงใช้การแจกแจงแบบปกติที่นั่น? การแจกแจงปกติไม่อนุญาตสำหรับค่าลบหรือไม่

2
ใช้ R สำหรับ GLM ด้วยการกระจายแกมม่า
ขณะนี้ฉันมีปัญหาในการทำความเข้าใจไวยากรณ์สำหรับ R เพื่อปรับ GLM ให้เหมาะสมโดยใช้การแจกแจงแกมมา ฉันมีชุดข้อมูลซึ่งแต่ละแถวมี 3 co-variates ( ), ตัวแปรตอบกลับ ( Y ) และพารามิเตอร์รูปร่าง ( K ) ฉันต้องการจำลองสเกลของการแจกแจงแกมม่าเป็นฟังก์ชันเชิงเส้นของสามตัวแปร แต่ฉันไม่เข้าใจวิธีตั้งค่ารูปร่างของการแจกแจงเป็นKสำหรับแต่ละแถวของข้อมูลX1,X2,X3X1,X2,X3X_1, X_2, X_3YYYKKKKKK สถานการณ์ที่ฉันคิดว่าคล้ายคลึงกันคือสำหรับการแจกแจงแบบทวินาม GLM ต้องการให้ทราบจำนวนการทดลอง ( ) สำหรับการป้อนข้อมูลแต่ละครั้งNNN

2
ค่าที่คาดหวังของลอการิทึมของการแจกแจงแกมมาคืออะไร?
หากค่าที่คาดหวังของคือค่าคาดหวังของ ? สามารถคำนวณเชิงวิเคราะห์ได้หรือไม่?Gamma(α,β)Gamma(α,β)\mathsf{Gamma}(\alpha, \beta)αβαβ\frac{\alpha}{\beta}log(Gamma(α,β))log⁡(Gamma(α,β))\log(\mathsf{Gamma}(\alpha, \beta)) การตั้งพาราเมทริกที่ฉันใช้คืออัตรารูปร่าง

3
ผลรวมของตัวแปรสุ่มแกมมาอิสระสองตัว
จากบทความของ Wikipedia เกี่ยวกับการกระจาย Gamma : ถ้าและโดยที่และเป็นตัวแปรสุ่มอิสระแล้วtheta)Y ∼ G a m m a ( b , θ )X∼Gamma(a,θ)X∼Gamma(a,θ)X\sim\mathrm{Gamma}(a,\theta)Y∼Gamma(b,θ)Y∼Gamma(b,θ)Y\sim\mathrm{Gamma}(b,\theta)Y X + Y ∼ G a m m a ( a + b , θ )XXXYYYX+ Y∼ G a m m a ( a + b , θ )X+Y∼Gamma(a+b,θ)X+Y\sim \mathrm{Gamma}(a+b, \theta) แต่ฉันไม่เห็นข้อพิสูจน์ใด ๆ …

2
วิธีการทดสอบว่าตัวอย่างของข้อมูลที่เหมาะกับครอบครัวของการกระจายแกมม่าหรือไม่?
ฉันมีตัวอย่างของข้อมูลซึ่งสร้างจากตัวแปรสุ่มแบบต่อเนื่อง X และจากฮิสโตแกรมที่ฉันวาดด้วย R ฉันเดาว่าบางทีการกระจายของ X เป็นไปตามการแจกแจงแกมม่าบางอย่าง แต่ฉันไม่รู้พารามิเตอร์ที่แน่นอนของการกระจายแกมม่านี้ คำถามของฉันคือวิธีทดสอบว่าการแจกแจง X เป็นของตระกูลการแจกแจงแกมมาหรือไม่? มีความดีของการทดสอบแบบพอดีเช่นการทดสอบ Kolmogorov-Smirnov การทดสอบ Anderson-Darling และอื่น ๆ แต่ข้อ จำกัด อย่างหนึ่งเมื่อใช้การทดสอบเหล่านี้คือพารามิเตอร์ของการแจกแจงทางทฤษฎีควรทราบล่วงหน้า ใครช่วยกรุณาบอกวิธีแก้ปัญหานี้ได้ไหม

1
Gamma GLM เทียบกับ Log-linked Gaussian GLM เทียบกับ LM-log-แปรรูป LM
จากผลลัพธ์ของฉันปรากฏว่า GLM Gamma เป็นไปตามสมมติฐานส่วนใหญ่ แต่เป็นการปรับปรุงที่คุ้มค่าสำหรับ LM ที่แปลงเป็นไฟล์บันทึกหรือไม่ วรรณกรรมส่วนใหญ่ฉันพบข้อตกลงกับ Poisson หรือ Binomial GLMs ฉันพบว่าบทความการประเมินผลของรูปแบบเชิงเส้นของสมมติฐานทั่วไปโดยใช้การสุ่มคืนค่ามีประโยชน์มาก แต่มันไม่มีแผนการจริงที่ใช้ในการตัดสินใจ หวังว่าคนที่มีประสบการณ์สามารถชี้ฉันในทิศทางที่ถูกต้อง ฉันต้องการสร้างแบบจำลองการกระจายตัวของตัวแปรตอบสนองของฉัน T ซึ่งมีพล็อตแบบกระจาย ที่คุณสามารถดูมันเป็นเบ้บวก: ฉันมีปัจจัยสองอย่างที่ต้องพิจารณา: METH และ CASEPART โปรดทราบว่าการศึกษาครั้งนี้ส่วนใหญ่เป็นการสำรวจโดยมีวัตถุประสงค์หลักเพื่อการศึกษานำร่องก่อนทำการสร้างแบบจำลองเชิงทฤษฎีและทำการแสดง DoE รอบ ๆ ฉันมีโมเดลต่อไปนี้ใน R พร้อมโครงการวินิจฉัย: LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat) GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log')) GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log')) ฉันยังได้รับค่า P ต่อไปนี้ผ่านการทดสอบ Shapiro-Wilks ในส่วนที่เหลือ: LM.LOG: 2.347e-11 GLM.GAMMA: 0.6288 GLM.GAUS: 0.6288 ฉันคำนวณค่า AIC และ BIC แต่ถ้าฉันถูกต้องพวกเขาจะไม่บอกฉันมากนักเนื่องจากตระกูลต่าง ๆ …

1
เป็นไปได้หรือไม่ที่จะเข้าใจโมเดลของ pareto / nbd
ฉันกำลังเรียนรู้ที่จะใช้แพ็คเกจ BTYD ที่ใช้โมเดล Pareto / NBD เพื่อคาดการณ์ว่าลูกค้าจะกลับมาเมื่อใด อย่างไรก็ตามวรรณคดีทั้งหมดในรุ่นนี้เต็มไปด้วยคณิตศาสตร์และดูเหมือนจะไม่มีคำอธิบายง่ายๆ / แนวคิดเกี่ยวกับการทำงานของรุ่นนี้ เป็นไปได้หรือไม่ที่จะเข้าใจโมเดล Pareto / NBD สำหรับผู้ที่ไม่ใช่นักคณิตศาสตร์ ฉันได้อ่านบทความที่มีชื่อเสียงนี้โดยเฟดเดอร์ โมเดล Pareto / NBD สร้างสมมติฐานดังต่อไปนี้: ผม. ในขณะที่ใช้งานจำนวนของการทำธุรกรรมที่ทำโดยลูกค้าในช่วงระยะเวลาที่มีความยาว t มีการกระจายปัวซองด้วยอัตราการทำธุรกรรมλ ii ความแตกต่างในอัตราการทำธุรกรรมทั่วลูกค้าจะเป็นไปตามการแจกแจงแกมม่าด้วยพารามิเตอร์รูปร่าง r และพารามิเตอร์สเกลα สาม. ลูกค้าแต่ละรายมีความยาว“ ตลอดชีพ” ที่ไม่ได้สังเกตเห็น จุดนี้ที่ลูกค้าไม่ใช้งานจะมีการแจกแจงแบบเอ็กซ์โพเนนเชียลด้วยอัตราการออกกลางคัน µ iv) ความหลากหลายในอัตราการออกกลางคันของลูกค้าตามการกระจายของแกมม่าด้วยพารามิเตอร์รูปร่างและพารามิเตอร์สเกลβ v. อัตราการทำธุรกรรมλและอัตราการออกกลางคัน µ แตกต่างกันไปตามลูกค้า " ฉันไม่เข้าใจเหตุผลของการตั้งสมมติฐาน (ii), (iii) และ (iv) เหตุใดจึงมีเพียงการกระจายเหล่านี้ทำไมจึงไม่ใช่คนอื่น นอกจากนี้สมมติฐานของรุ่น BG …

2
วิธีตัวอย่าง X อย่างรวดเร็วถ้า exp (X) ~ Gamma
ฉันมีปัญหาในการสุ่มตัวอย่างอย่างง่ายโดยที่วงในของฉันดูเหมือน: v = sample_gamma(k, a) โดยที่sample_gammaตัวอย่างจากการแจกแจงแกมม่าเป็นตัวอย่าง Dirichlet มันใช้งานได้ดี แต่สำหรับค่าบางส่วนของ k / a การคำนวณ downstream underflows บางส่วน ฉันปรับมันเพื่อใช้ตัวแปรพื้นที่บันทึก: v = log(sample_gamma(k, a)) หลังจากปรับโปรแกรมที่เหลือทั้งหมดมันทำงานได้อย่างถูกต้อง (อย่างน้อยมันก็ให้ผลลัพธ์ที่แน่นอนเหมือนกันในกรณีทดสอบ) อย่างไรก็ตามมันช้ากว่าเดิม มีวิธีการโดยตรงตัวอย่างโดยไม่ใช้ฟังก์ชั่นช้าเช่นlog ( ) ? ฉันลอง googling สำหรับสิ่งนี้ แต่ฉันไม่รู้ด้วยซ้ำว่าการกระจายนี้มีชื่อสามัญ (log-gamma?)X, ประสบการณ์( X) ∼ GammaX,exp⁡(X)∼GammaX, \exp(X) \sim \text{Gamma}เข้าสู่ระบบ( )log⁡()\log()

3
คุณคำนวณความคาดหวังของ ?
ถ้ามีการแจกแจงแบบเอ็กซ์โพเนนเชียลพร้อมพารามิเตอร์และนั้นเป็นอิสระร่วมกันความคาดหวังของXiXiX_i(i=1,...,n)(i=1,...,n)(i=1,...,n)λλ\lambdaXiXiX_i (∑i=1nXi)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 ในแง่ของและและค่าคงที่อื่น ๆnnnλλ\lambda หมายเหตุ:คำถามนี้มีอากาศที่เป็นคำตอบทางคณิตศาสตร์/math//q/12068/4051 ผู้อ่านก็จะดูมันเช่นกัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.