คำถามติดแท็ก beta-distribution

ตระกูลสองพารามิเตอร์ของการแจกแจง univariate ที่กำหนดในช่วงเวลา [0,1].

2
UMVUE จากในขณะที่สุ่มตัวอย่างจากประชากร
ปล่อยเป็นตัวอย่างแบบสุ่มจากความหนาแน่น(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)fθ(x)=θxθ−110<x<1,θ>0fθ(x)=θxθ−110<x<1,θ>0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 ฉันกำลังพยายามที่จะหา UMVUE ของtheta}θ1+θθ1+θ\frac{\theta}{1+\theta} ความหนาแน่นรอยต่อของคือ(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n) fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110<x1,…,xn<1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10<x1,…,xn<1)],θ>0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110<x1,…,xn<1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10<x1,…,xn<1)],θ>0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} เนื่องจากประชากร pdfเป็นสมาชิกของตระกูลเลขชี้กำลังหนึ่งพารามิเตอร์นี่แสดงให้เห็นว่าสถิติที่เพียงพอสำหรับคือfθfθf_{\theta}θθ\thetaT(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i ตั้งแต่ตอนแรกจะให้ UMVUE ของให้ฉัน ทฤษฎีบท Lehmann-Scheffe ถ้าไม่แน่ใจว่าความคาดหวังที่มีเงื่อนไขนี้สามารถพบได้โดยตรงหรือหนึ่งที่มีการพบว่าเงื่อนไขการจำหน่าย x_iE(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta}E(X1∣T)E(X1∣T)E(X_1\mid T)θ1+θθ1+θ\frac{\theta}{1+\theta}X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i ในทางกลับกันฉันพิจารณาวิธีการต่อไปนี้: เรามีเพื่อให้{2n}Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n} ดังนั้น TH เพื่อช่วงเวลาดิบเกี่ยวกับศูนย์ตามที่คำนวณโดยใช้ไคสแควร์เป็น pdfrrr−2θT−2θT-2\theta\,TE(−2θT)r=2rΓ(n+r)Γ(n),n+r>0E(−2θT)r=2rΓ(n+r)Γ(n),n+r>0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 ดังนั้นดูเหมือนว่าสำหรับทางเลือกที่แตกต่างกันของจำนวนเต็ม , ฉันจะได้รับประมาณเป็นกลาง (และ UMVUEs) ของอำนาจแตกต่างกันของจำนวนเต็ม\ตัวอย่างเช่นและให้ฉันเป็น UMVUE และตามลำดับrrrθθ\thetaE(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta1θ1θ\frac{1}{\theta}θθ\theta ตอนนี้เมื่อเรามี1}θ>1θ>1\theta>1θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots ฉันสามารถรับ UMVUE ได้และอื่น ๆ ดังนั้นการรวม UMVUE เหล่านี้เป็นฉันจะได้รับที่จำเป็น UMVUE …

2
สุ่มตัวอย่างการกระจายเบต้าที่มีประสิทธิภาพอย่างมีประสิทธิภาพ
ฉันจะสุ่มตัวอย่างอย่างมีประสิทธิภาพจากการกระจายต่อไปนี้ได้อย่างไร? x ∼ B ( α , β) , x > k x∼B(α,β), x>k x \sim B(\alpha, \beta),\space x > k หากไม่ใหญ่เกินไปการสุ่มตัวอย่างการปฏิเสธอาจเป็นวิธีที่ดีที่สุด แต่ฉันไม่แน่ใจว่าจะดำเนินการอย่างไรเมื่อkมีขนาดใหญ่ อาจจะมีการประมาณแบบเชิงเส้นกำกับบางอย่างที่สามารถใช้ได้?kkkkkk

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

4
ฉันจะตีความกราฟความอยู่รอดของโมเดลอันตราย Cox ได้อย่างไร
คุณจะตีความเส้นโค้งการอยู่รอดจากโมเดลอันตรายตามสัดส่วนของค็อกซ์ได้อย่างไร ในตัวอย่างของเล่นนี้สมมติว่าเรามีโมเดลอันตรายตามสัดส่วนในageตัวแปรในkidneyข้อมูลและสร้างเส้นโค้งการอยู่รอด library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() ตัวอย่างเช่น ณ เวลาคำสั่งใดเป็นจริง หรือทั้งสองอย่างผิดปกติ?200200200 คำแถลงที่ 1: เราจะเหลือวิชา 20% (เช่นถ้าเรามีคนโดยวันที่เราควรเหลืออีกประมาณ ) 100010001000200200200200200200 งบ 2: สำหรับคนที่ได้รับหนึ่งเขา / เธอมีมีโอกาสที่จะอยู่รอดได้ในวันที่20020%20%20\%200200200 ความพยายามของฉัน: ฉันไม่คิดว่าทั้งสองงบจะเหมือนกัน (แก้ไขฉันถ้าฉันผิด) เนื่องจากเราไม่ได้มีการสันนิษฐาน iid (เวลารอดสำหรับทุกคนไม่ได้มาจากการกระจายอย่างอิสระ) มันคล้ายกับการถดถอยโลจิสติกในคำถามของฉันที่นี่อัตราความเป็นอันตรายของแต่ละคนขึ้นอยู่กับสำหรับบุคคลนั้นβTxβTx\beta^Tx

1
การแจกแจงเบต้าสองครั้งจะกำหนดพารามิเตอร์หรือไม่
หากฉันให้ปริมาณสองค่าและตำแหน่งที่สอดคล้องกัน (แต่ละอัน) ในช่วงเวลาเปิดฉันจะหาพารามิเตอร์ของการแจกแจงแบบเบต้าที่มีปริมาณเหล่านั้นในตำแหน่งที่ระบุได้หรือไม่?(q1,q2)(q1,q2)(q_1,q_2)(l1,l2)(l1,l2)(l_1,l_2)(0,1)(0,1)(0,1)

1
ถ้า
นี่คือปัญหาที่เกิดขึ้นในการสอบภาคการศึกษาในมหาวิทยาลัยของเราไม่กี่ปีหลังซึ่งฉันพยายามที่จะแก้ปัญหา ถ้า X1,X2X1,X2X_1,X_2 มีความเป็นอิสระ ββ\beta ตัวแปรสุ่มที่มีความหนาแน่น β(n1,n2)β(n1,n2)\beta(n_1,n_2) และ β(n1+12,n2)β(n1+12,n2)\beta(n_1+\dfrac{1}{2},n_2) ตามลำดับแล้วแสดงว่า X1X2-----√X1X2\sqrt{X_1X_2} ดังต่อไปนี้ β( 2)n1, 2n2)β(2n1,2n2)\beta(2n_1,2n_2). ฉันใช้วิธีจาโคเบียนเพื่อรับความหนาแน่นของ Y=X1X2-----√Y=X1X2Y=\sqrt{X_1X_2} มีดังนี้: ฉY( y) =4Y2n1B (n1,n2) B (n1+12,n2)∫1Y1x2( 1 -x2)n2- 1( 1 -Y2x2)n2- 1dxfY(y)=4y2n1B(n1,n2)B(n1+12,n2)∫y11x2(1−x2)n2−1(1−y2x2)n2−1dxf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_y^1\dfrac{1}{x^2}(1-x^2)^{n_2-1}(1-\dfrac{y^2}{x^2})^{n_2-1}dx ตอนนี้ฉันหลงทางไปแล้ว ตอนนี้ในบทความหลักฉันพบว่ามีการให้คำใบ้ ฉันพยายามใช้คำใบ้ แต่ไม่สามารถรับการแสดงออกที่ต้องการ คำใบ้คือคำต่อคำดังนี้ คำแนะนำ: หาสูตรสำหรับความหนาแน่นของ Y=X1X2-----√Y=X1X2Y=\sqrt{X_1X_2} ในแง่ของความหนาแน่นที่กำหนดของ X1X1X_1 และ X2X2X_2 และลองใช้การเปลี่ยนแปลงของตัวแปรด้วย Z=Y2xz=y2xz=\dfrac{y^2}{x}. ดังนั้น ณ จุดนี้ฉันพยายามใช้ประโยชน์จากคำใบ้นี้โดยพิจารณาการเปลี่ยนแปลงของตัวแปรนี้ ดังนั้นฉันได้รับฉY( y) =4Y2n1B …

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.