คำถามติดแท็ก gamma-distribution

การกระจายความน่าจะเป็นแบบไม่ต่อเนื่องที่ไม่เป็นลบจัดทำดัชนีโดยพารามิเตอร์เชิงบวกสองตัว

1
ความหนาแน่นของ Y = log (X) สำหรับ X ที่กระจายโดยแกมมา
คำถามนี้เกี่ยวข้องกับโพสต์นี้อย่างใกล้ชิด สมมติว่าฉันมีตัวแปรสุ่มและฉันกำหนด(X) ฉันต้องการที่จะหาสิ่งที่ฟังก์ชั่นความหนาแน่นของความน่าจะเป็นของYY = บันทึก( X ) YX∼ Gamma ( k , θ )X~แกมมา(k,θ)X \sim \text{Gamma}(k, \theta)Y= บันทึก( X)Y=เข้าสู่ระบบ⁡(X)Y = \log(X)YYY ตอนแรกฉันคิดว่าฉันจะนิยามฟังก์ชันการแจกแจงสะสมแบบ X ทำการเปลี่ยนแปลงของตัวแปรแล้วนำ "ข้างใน" ของอินทิกรัลเป็นความหนาแน่นของฉันเช่นนั้น P( X≤ c )P( Y≤ บันทึกค)= ∫ค01θk1Γ ( k )xk - 1อี- xθdx= ∫เข้าสู่ระบบ( c )เข้าสู่ระบบ( 0 )1θk1Γ ( k )ประสบการณ์( y)k - 1อี- …

2
ความคาดหวังของแกมม่ากำลังสอง
หากการแจกแจงแกมมาถูกกำหนดพารามิเตอร์ด้วยและดังนั้น:αα\alphaββ\beta E(Γ(α,β))=αβE(Γ(α,β))=αβ E(\Gamma(\alpha, \beta)) = \frac{\alpha}{\beta} ฉันต้องการคำนวณความคาดหวังของแกมม่ากำลังสองนั่นคือ: E(Γ(α,β)2)=?E(Γ(α,β)2)=? E(\Gamma(\alpha, \beta)^2) = ? ฉันคิดว่ามันเป็น: E(Γ(α,β)2)=(αβ)2+αβ2E(Γ(α,β)2)=(αβ)2+αβ2 E(\Gamma(\alpha, \beta)^2) = \left(\frac{\alpha}{\beta}\right)^2 + \frac{\alpha}{\beta^2} ไม่มีใครรู้ว่าการแสดงออกหลังนี้ถูกต้องหรือไม่

1
ความหนาแน่นสูงเกินไปสำหรับโมเดล Gamma-Poisson แบบลำดับชั้น
ในรูปแบบลำดับชั้นของข้อมูลที่ มันดูเหมือนจะเป็นเรื่องปกติในทางปฏิบัติเพื่อเลือกค่า (ว่าค่าเฉลี่ยและความแปรปรวนของการแจกแจงแกมมาประมาณตรงกับค่าเฉลี่ยและความแปรปรวนของข้อมูล (เช่น Clayton และ Kaldor, 1987 "Empirical Bayes Estimates ของความเสี่ยงสัมพัทธ์ตามมาตรฐานอายุสำหรับการทำแผนที่โรค" Biometrics ) เห็นได้ชัดว่านี่เป็นเพียงโซลูชันเฉพาะกิจแต่เนื่องจากมันจะเกินความเชื่อมั่นของนักวิจัยในพารามิเตอร์yyyy∼Poisson(λ)y∼Poisson(λ)y \sim \textrm{Poisson}(\lambda) λ∼Gamma(α,β)λ∼Gamma(α,β)\lambda \sim \textrm{Gamma}(\alpha, \beta)α,β)α,β)\alpha, \beta)yyy(α,β)(α,β)(\alpha, \beta)และความผันผวนเล็กน้อยในข้อมูลที่รับรู้อาจมีผลต่อความหนาแน่นของแกมม่าแม้ว่ากระบวนการสร้างข้อมูลพื้นฐานจะยังคงเหมือนเดิม นอกจากนี้ในการวิเคราะห์ข้อมูลแบบเบย์ (2nd Ed) Gelman เขียนว่าวิธีนี้คือ " เลอะเทอะ ;" ในหนังสือและบทความนี้ (เริ่มต้นที่ 3232) เขาแนะนำว่าควรเลือกความหนาแน่น hyperpriorในแบบที่คล้ายกับตัวอย่างเนื้องอกหนู (เริ่มต้นที่ 130)p(α,β)p(α,β)p(\alpha, \beta) แม้ว่าจะเป็นที่ชัดเจนว่ายอมรับได้ตราบใดที่มันสร้างความหนาแน่นของหลังที่ จำกัด แต่ฉันไม่พบตัวอย่างของความหนาแน่น hyperprior ที่นักวิจัยได้ใช้สำหรับปัญหานี้ในอดีต ฉันจะซาบซึ้งอย่างยิ่งถ้ามีคนชี้ให้ฉันไปที่หนังสือหรือบทความที่ใช้ความหนาแน่นสูงเกินไปเพื่อประเมินแบบจำลอง Poisson-Gamma เป็นการดีที่ฉันสนใจในที่ค่อนข้างแบนและจะถูกครอบงำโดยข้อมูลในตัวอย่างเนื้องอกหนูหรือการอภิปรายเปรียบเทียบข้อกำหนดทางเลือกหลายประการและการแลกเปลี่ยนที่เกี่ยวข้องกับแต่ละp(α,β)p(α,β)p(\alpha, \beta)p(α,β)p(α,β)p(\alpha, \beta)

2
การใช้งานและการตีความที่เหมาะสมของตัวแบบแกมม่าที่ไม่พองตัว
ข้อมูลประกอบ:ฉันเป็นนักชีวสถิติกำลังต่อสู้กับชุดข้อมูลของอัตราการแสดงออกของเซลล์ การศึกษาเปิดเผยโฮสต์ของเซลล์ที่รวบรวมในกลุ่มจากผู้บริจาคต่าง ๆ เพื่อเปปไทด์บางอย่าง เซลล์อาจแสดงตัวบ่งชี้ทางชีวภาพบางอย่างเพื่อตอบสนองหรือไม่ทำเช่นนั้น อัตราการตอบกลับจะถูกบันทึกไว้สำหรับผู้บริจาคแต่ละกลุ่ม อัตราการตอบสนอง (แสดงเป็นเปอร์เซ็นต์) เป็นผลลัพธ์ของดอกเบี้ยและการได้รับเปปไทด์เป็นตัวทำนาย โปรดสังเกตว่าการสังเกตนั้นมีการรวมกลุ่มกันภายในผู้บริจาค เนื่องจากฉันมีข้อมูลสรุปเท่านั้นฉันจึงยังคงรักษาอัตราการตอบกลับของผู้บริจาคให้เป็นข้อมูลต่อเนื่อง (อย่างน้อยตอนนี้) ภาวะแทรกซ้อนเกิดจากความจริงที่ว่าฉันมีเลขศูนย์ในข้อมูลของฉัน มากเกินไปที่จะเพิกเฉย ฉันกำลังพิจารณารูปแบบแกมม่าที่ไม่พองตัวเพื่อจัดการกับความจริงที่ว่าฉันได้บิดเบือนข้อมูลอย่างต่อเนื่องควบคู่กับการมีศูนย์รวมเกินศูนย์ ฉันได้พิจารณาแบบจำลอง Tobit ด้วยเช่นกัน แต่สิ่งนี้ดูด้อยกว่าเพราะถือว่าการเซ็นเซอร์ในขอบเขตที่ต่ำกว่าเมื่อเทียบกับศูนย์ของแท้ (นักเศรษฐศาสตร์อาจบอกว่า คำถาม:โดยทั่วไปแล้วการใช้แบบจำลองแกมม่าที่ไม่ต้องพองเมื่อใดจึงเหมาะสมที่จะใช้? นั่นคืออะไรคือสมมติฐาน? และคนเราตีความการอนุมานได้อย่างไร? ฉันจะขอบคุณสำหรับการเชื่อมโยงไปยังเอกสารที่กล่าวถึงเรื่องนี้ถ้าคุณมี ฉันได้พบลิงก์ใน SAS-Lซึ่ง Dale McLerran ให้รหัส NLMIXED สำหรับแบบจำลองแกมม่าที่ไม่มีการพองตัวดังนั้นมันจึงเป็นไปได้ อย่างไรก็ตามฉันจะเกลียดที่จะเรียกเก็บเงินจากคนตาบอด

2
การกระจายสำหรับข้อมูลร้อยละ
ฉันมีคำถามเกี่ยวกับการแจกจ่ายที่ถูกต้องเพื่อใช้สำหรับการสร้างแบบจำลองด้วยข้อมูลของฉัน ฉันจัดทำรายการป่าไม้ที่มี 50 แปลงแต่ละแปลงมีขนาด 20 ม. x 50 ม. ในแต่ละแปลงนั้นฉันประมาณเปอร์เซ็นต์ของต้นไม้ที่บังแสง แต่ละพล็อตมีหนึ่งค่าเป็นเปอร์เซ็นต์สำหรับฝาครอบหลังคา เปอร์เซ็นต์มีตั้งแต่ 0 ถึง 0.95 ฉันกำลังสร้างแบบจำลองของร้อยละต้นไม้ปกคลุมหลังคา ( ตัวแปรY ) ด้วยเมทริกซ์ของตัวแปรXอิสระจากภาพถ่ายดาวเทียมและข้อมูลด้านสิ่งแวดล้อม ฉันไม่แน่ใจว่าฉันควรใช้การแจกแจงทวินามหรือไม่เนื่องจากตัวแปรสุ่มแบบทวินามคือผลรวมของการทดลองอิสระn ครั้ง (เช่นตัวแปรสุ่มของเบอร์นูลลี) ค่าเปอร์เซ็นต์ไม่ใช่ผลรวมของการทดลอง เป็นเปอร์เซ็นต์ที่แท้จริง ฉันควรใช้แกมมาแม้ว่าจะไม่มีขีด จำกัด บน ฉันควรแปลงเปอร์เซ็นต์เป็นจำนวนเต็มและใช้ปัวซองเป็นค่าหรือไม่ ฉันควรจะอยู่กับเกาส์เซียนหรือไม่ ฉันไม่พบตัวอย่างมากมายในวรรณคดีหรือในตำราที่พยายามจำลองเปอร์เซ็นต์ด้วยวิธีนี้ คำแนะนำหรือข้อมูลเชิงลึกใด ๆ ที่ชื่นชม ขอบคุณสำหรับคำตอบ ในความเป็นจริงการกระจายเบต้าเป็นสิ่งที่ฉันต้องการและมีการพูดคุยอย่างละเอียดในบทความนี้: Eskelson, BN, Madsen, L. , Hagar, JC, & Temesgen, H. (2011) การประมาณพืชพรรณที่เข้าใจได้ของชายฝั่ง Riparian ด้วยแบบจำลองการถดถอยแบบเบตาและโคคูล่า …

1
ชื่อสำหรับการแจกแจงระหว่างเลขชี้กำลังและแกมม่า
ความหนาแน่นฉ( s ) ∝ ss + αอี- s,s > 0f(s)∝ss+αe−s,s>0f(s)\propto \frac{s}{s+\alpha}e^{-s},\quad s > 0ที่อัลฟ่า≥ 0α≥0\alpha \ge 0เป็นพารามิเตอร์ที่ชีวิตระหว่างชี้แจง (α = 0α=0\alpha=0 ) และΓ ( 2 , 1 )Γ(2,1)\Gamma(2,1) (α → ∞α→∞\alpha \to \infty ) การกระจาย เพียงแค่สงสัยว่าสิ่งนี้เกิดขึ้นเป็นตัวอย่างของครอบครัวที่มีการแจกแจงทั่วไปมากขึ้นหรือไม่? ฉันไม่รู้จักเช่นนี้

2
ความแตกต่างของตัวแปรสุ่มแกมมา
รับตัวแปรสุ่มอิสระสองตัวและการกระจายความแตกต่างคือคืออะไร?Y ∼ G a m m a ( α Y , β Y ) D = X - YX∼Gamma(αX,βX)X∼Gamma(αX,βX)X\sim \mathrm{Gamma}(\alpha_X,\beta_X)Y∼Gamma(αY,βY)Y∼Gamma(αY,βY)Y\sim \mathrm{Gamma}(\alpha_Y,\beta_Y)D=X−YD=X−YD=X-Y หากผลลัพธ์ไม่เป็นที่รู้จักฉันจะไปหาผลลัพธ์ได้อย่างไร

1
วิธีการวาดกราฟที่พอดีและกราฟที่แท้จริงของการกระจายแกมม่าในหนึ่งแปลง?
โหลดแพ็คเกจที่จำเป็น library(ggplot2) library(MASS) สร้าง 10,000 หมายเลขที่พอดีกับการแจกแจงแกมม่า x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] วาดฟังก์ชันความหนาแน่นของความน่าจะเป็นถ้าเราไม่รู้ว่าการกระจายตัว x พอดีกับอะไร t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) t1$y <- t1$y/sum(t1[,2]) ggplot() + geom_point(data = t1,aes(x = x,y = y)) + theme_classic() จากกราฟเราสามารถเรียนรู้ว่าการแจกแจงของ x นั้นเหมือนกับการแจกแจงแกมม่าดังนั้นเราใช้fitdistr()ในแพ็คเกจMASSเพื่อรับพารามิเตอร์ของรูปร่างและอัตราการกระจายแกมม่า fitdistr(x,"gamma") ## output ## shape …

3
ความเป็นอิสระของสถิติจากการแจกแจงแกมม่า
ให้เป็นตัวอย่างที่สุ่มจากการกระจายรังสีแกมมาขวา)X1,...,XnX1,...,XnX_1,...,X_nGamma(α,β)Gamma(α,β)\mathrm{Gamma}\left(\alpha,\beta\right) ให้และS ^ 2เป็นค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างตามลำดับX¯X¯\bar{X}S2S2S^2 จากนั้นพิสูจน์หรือพิสูจน์ว่าX¯X¯\bar{X}และS2/X¯2S2/X¯2S^2/\bar{X}^2นั้นเป็นอิสระ ความพยายามของฉัน: ตั้งแต่S2/X¯2=1n−1∑ni=1(XiX¯−1)2S2/X¯2=1n−1∑i=1n(XiX¯−1)2S^2/\bar{X}^2 = \frac{1}{n-1} \sum_{i=1}^n \left(\frac{X_i}{\bar{X}}-1\right)^2 เราต้องตรวจสอบความเป็นอิสระของX¯X¯\bar{X}และ(XผมX¯)ni = 1(XผมX¯)ผม=1n\left(\frac{X_i}{\bar{X}} \right)_{i=1}^{n} , แต่ฉันจะสร้างความเป็นอิสระระหว่างพวกเขาได้อย่างไร?

1
ความหมายที่แท้จริงของ alpha ใน GLM กับครอบครัวแกมม่าคืออะไร?
ฉันเหมาะสมกับแบบจำลองหลายแบบ .. glm(DV ~ I(1/IV), family = Gamma(link = "log") .. และฉันกำลังมองหาวิธีการเปรียบเทียบแบบจำลองที่ได้รับสำหรับตัวแปรที่แตกต่างกัน ฉันสงสัยว่าค่าอัลฟานั้นมีประโยชน์หรือไม่? สำหรับสามแปลงต่ำกว่าค่าอัลฟาคือ 17.85, 9.03 และ 6.27 ค่าเหล่านี้มีข้อมูลใด ๆ ที่ช่วยให้ฉันตีความข้อมูลของฉันหรือเพื่อเปรียบเทียบตัวแปรต่าง ๆ ได้หรือไม่?

1
มีการตีความอีกครั้งสำหรับการแจกแจงแกมม่าด้วยพารามิเตอร์รูปร่างที่ไม่ใช่จำนวนเต็มหรือไม่?
เป็นที่ทราบกันดีว่าตัวแปรสุ่มที่ Gamma กระจายด้วยพารามิเตอร์รูปร่างจำนวนเต็มนั้นเท่ากับผลรวมของกำลังสองของกระจายตัวแปรสุ่มแบบปกติkkkkkk แต่ฉันจะพูดอะไรเกี่ยวกับแกมม่าที่กระจายตัวแปรสุ่มด้วยค่าที่ไม่ใช่จำนวนเต็ม ? มีการตีความอื่นนอกเหนือจากการแจกแจงแกมม่าหรือไม่?kkk

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.