คำถามติดแท็ก maximum-likelihood

วิธีการประมาณค่าพารามิเตอร์ของแบบจำลองทางสถิติโดยเลือกค่าพารามิเตอร์ที่ปรับความน่าจะเป็นของการสังเกตตัวอย่างที่กำหนดให้เหมาะสมที่สุด

1
ทำไม Anova () และ drop1 () จึงให้คำตอบที่แตกต่างกันสำหรับ GLMM
ฉันมีแบบฟอร์ม GLMM: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) เมื่อฉันใช้drop1(model, test="Chi")ฉันได้รับผลลัพธ์ที่แตกต่างกว่าถ้าผมใช้จากแพคเกจรถหรือAnova(model, type="III") summary(model)สองหลังนี้ให้คำตอบเดียวกัน จากการใช้ข้อมูลที่ประดิษฐ์ขึ้นมาฉันพบว่าทั้งสองวิธีปกติไม่แตกต่างกัน พวกเขาให้คำตอบเดียวกันสำหรับแบบจำลองเชิงเส้นที่มีความสมดุลแบบจำลองเชิงเส้นที่ไม่สมดุล (ซึ่งไม่เท่ากันในกลุ่มต่าง ๆ ) และสำหรับแบบจำลองเชิงเส้นที่สมดุลแบบทั่วไป ดังนั้นจึงปรากฏว่าเฉพาะในกรณีที่มีการรวมปัจจัยแบบสุ่มเข้าด้วยกัน ทำไมจึงมีความคลาดเคลื่อนระหว่างสองวิธีนี้? เมื่อใช้ GLMM ควรAnova()หรือdrop1()จะใช้งานอย่างไร ความแตกต่างระหว่างสองสิ่งนี้ค่อนข้างเล็กน้อยอย่างน้อยสำหรับข้อมูลของฉัน มันมีความสำคัญต่อการใช้งานหรือไม่?
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

1
คุณใช้อัลกอริธึม EM ในการคำนวณ MLEs สำหรับสูตรตัวแปรแฝงของโมเดลปัวซองที่มีค่าศูนย์ได้อย่างไร
แบบจำลองการถดถอยปัวซงแบบ zero zero ถูกกำหนดไว้สำหรับตัวอย่างโดย และจะถือว่าพารามิเตอร์และไปY i = { 0 ด้วยความน่าจะเป็นp i + ( 1 - p i ) e - λ i k ด้วยความน่าจะเป็น( 1 - p i ) e - λ ฉัน λ k i / k ! λ = ( λ 1 , … , λ n ) …

1
การทดสอบสมมติฐานเกี่ยวกับเมทริกซ์ความแปรปรวนร่วมแบบผกผัน
สมมติว่าฉันสังเกตIID และความปรารถนาในการทดสอบเอช0 :เวช( Σ - 1 ) =สำหรับเมทริกซ์คล้อยตามและเวกเตอร์ มีงานที่รู้จักกับปัญหานี้หรือไม่?xผม∼ N( μ , Σ )xi∼N(μ,Σ)x_i \sim \mathcal{N}\left(\mu,\Sigma\right)H0: A H0:A H_0: A\ ( Σ- 1) =a(Σ−1)=a\left(\Sigma^{-1}\right) = aAAAaaa ความพยายามที่ชัดเจน (กับฉัน) จะผ่านการทดสอบอัตราส่วนความน่าจะเป็น แต่ดูเหมือนว่าการเพิ่มความเป็นไปได้สูงสุดภายใต้ข้อ จำกัด ของจะต้องใช้ตัวแก้ SDPและอาจมีขนดกสวยH0H0H_0

2
หนังสือที่ดีที่มีความเครียดเท่า ๆ กันเกี่ยวกับทฤษฎีและคณิตศาสตร์
ฉันมีหลักสูตรสถิติเพียงพอในช่วงปีที่เรียนและที่มหาวิทยาลัย ฉันมีความเข้าใจอย่างเป็นธรรมเกี่ยวกับแนวคิดเช่น CI ค่า p การตีความนัยสำคัญทางสถิติการทดสอบหลายแบบสหสัมพันธ์การถดถอยเชิงเส้นอย่างง่าย (ที่มีกำลังสองน้อยที่สุด) (โมเดลเชิงเส้นทั่วไป) และการทดสอบสมมติฐานทั้งหมด ฉันได้รับการแนะนำให้รู้จักกับมันมากของวันก่อนหน้านี้ส่วนใหญ่ทางคณิตศาสตร์ และเมื่อเร็ว ๆ นี้ด้วยความช่วยเหลือของหนังสือชีวสถิติที่ใช้งานง่ายฉันได้เข้าใจและไม่เคยมีมาก่อนเกี่ยวกับทฤษฎีแนวคิดจริงฉันเชื่อ ตอนนี้สิ่งที่ฉันพบว่าขาดคือความเข้าใจในตัวแบบที่เหมาะสม (การประมาณค่าพารามิเตอร์กับตัวแบบ) และสิ่งที่คล้ายกัน โดยเฉพาะอย่างยิ่งแนวคิดต่าง ๆ เช่นการประมาณค่าความน่าจะเป็นสูงสุดแบบจำลองเชิงเส้นแบบทั่วไปวิธีการแบบเบส์เพื่อสถิติเชิงอนุมาน มีตัวอย่างหรือแบบฝึกหัดไม่เพียงพอหรือมีเนื้อหาที่เป็นแนวคิดอย่างที่ควรจะเป็นในโมเดลที่น่าจะเป็นไปได้ง่ายหรือหัวข้ออื่น ๆ (พื้นฐาน) บนอินเทอร์เน็ต ฉันเป็นชีวสารสนเทศศาสตร์และฉันทำงานกับข้อมูล RNA-Seq ซึ่งเกี่ยวข้องกับจำนวนการอ่านดิบที่มีต่อการค้นหาสมมติว่าการแสดงออกของยีน (หรือการแสดงออกของยีนที่แตกต่างกัน) จากพื้นหลังของฉันแม้ว่าฉันจะไม่คุ้นเคยกับแบบจำลองทางสถิติฉันก็สามารถเข้าใจเหตุผลของการกระจายตัวแบบปัวซองและทวินามลบและอื่น ๆ .. แต่เอกสารบางฉบับเกี่ยวข้องกับตัวแบบเชิงเส้นทั่วไปและประมาณ MLE เป็นต้น .. ซึ่ง ฉันเชื่อว่าฉันมีพื้นฐานที่จำเป็นในการทำความเข้าใจ ฉันเดาว่าสิ่งที่ฉันขอเป็นวิธีการที่ผู้เชี่ยวชาญบางคนในหมู่คุณเห็นว่ามีประโยชน์และ (a) หนังสือ (s) ที่ช่วยให้ฉันเข้าใจแนวคิดเหล่านี้ในวิธีที่ง่ายขึ้น (ไม่ใช่แค่คณิตศาสตร์ที่เข้มงวด แต่ทฤษฎีที่สนับสนุนคณิตศาสตร์) ในขณะที่ฉันจะนำไปใช้เป็นส่วนใหญ่ฉันจะพอใจ (ในขณะนี้) ด้วยความเข้าใจว่าอะไรคืออะไรและหลังจากนั้นฉันสามารถกลับไปที่บทพิสูจน์ทางคณิตศาสตร์ที่เข้มงวด ... ไม่มีใครมีคำแนะนำหรือไม่? ฉันไม่รังเกียจที่จะซื้อหนังสือมากกว่า 1 …

2
ไตรลักษณ์ของการทดสอบในความเป็นไปได้สูงสุด: จะทำอย่างไรเมื่อเผชิญกับข้อสรุปที่ขัดแย้งกัน?
การทดสอบอัตราส่วนตัวบ่งชี้ความน่าจะเป็นและตัวคูณลากรองจ์ในบริบทของการประมาณความน่าจะเป็นสูงสุดนั้นจะเทียบเท่ากันแบบเชิงเส้นกำกับ อย่างไรก็ตามสำหรับตัวอย่างเล็ก ๆ พวกเขามีแนวโน้มที่จะแตกต่างกันเล็กน้อยและในบางกรณีพวกเขาส่งผลให้ข้อสรุปที่แตกต่างกัน พวกเขาสามารถจัดอันดับตามพวกเขามีแนวโน้มที่จะปฏิเสธโมฆะได้อย่างไร จะทำอย่างไรเมื่อการทดสอบมีคำตอบที่ขัดแย้งกัน คุณสามารถเลือกคำตอบที่ต้องการหรือมี "กฎ" หรือ "คำแนะนำ" เป็นวิธีการดำเนินการต่อไปได้หรือไม่?

1
โอกาสสำหรับกระบวนการนี้คืออะไร?
ผู้ป่วยเข้ารับการรักษาในโรงพยาบาล ระยะเวลาพำนักของพวกเขาขึ้นอยู่กับ 2 สิ่ง: ความรุนแรงของการบาดเจ็บและประกันของพวกเขาเต็มใจที่จะจ่ายเพื่อรักษาพวกเขาในโรงพยาบาล ผู้ป่วยบางรายจะออกไปก่อนกำหนดหากประกันของพวกเขาตัดสินใจที่จะหยุดจ่ายเงินสำหรับการเข้าพักของพวกเขา สมมติว่าต่อไปนี้: 1) ความยาวของการเข้าพัก Poisson กระจาย (เพียงสมมตินี้สำหรับตอนนี้ก็อาจจะหรืออาจจะไม่เป็นจริงสมมติฐาน) กับพารามิเตอร์\λλ\lambda 2) แผนประกันภัยหลากหลายครอบคลุมการเข้าพัก 7, 14, และ 21 วัน ผู้ป่วยจำนวนมากจะออกเดินทางหลังจาก 7,14 หรือ 21 วันอยู่ (เพราะประกันหมดและพวกเขาต้องออกไป) ถ้าฉันได้รับข้อมูลจากกระบวนการนี้มันอาจมีลักษณะดังต่อไปนี้: อย่างที่คุณเห็นมีหนามแหลมที่เครื่องหมาย 7, 14 และ 21 วัน นี่คือผู้ป่วยที่ออกเมื่อประกันสิ้นสุด เห็นได้ชัดว่าข้อมูลสามารถจำลองเป็นส่วนผสมได้ ฉันมีเวลายากลำบากที่จะเขียนความเป็นไปได้สำหรับการกระจายตัวนี้ มันเหมือนปัวซองที่พองเกินศูนย์ แต่เงินเฟ้ออยู่ที่ 7, 14 และ 21 โอกาสในการเกิดข้อมูลนี้คืออะไร? กระบวนการคิดที่อยู่เบื้องหลังความน่าจะเป็นคืออะไร?

1
ครอบครัวเอ็กซ์โพเนนเชียล: พบกับสถิติที่เพียงพอที่คาดหวัง
คำถามของฉันเกิดขึ้นจากการอ่านการอ่านของ Minka "การประมาณการแจกแจงดีริชเลต์"ซึ่งระบุสิ่งต่อไปนี้โดยไม่มีข้อพิสูจน์ในบริบทของการหาตัวประมาณความน่าจะเป็นสูงสุดสำหรับการแจกแจงไดริชเล็ตจากการสังเกตเวกเตอร์สุ่ม เช่นเดียวกับตระกูลเอ็กซ์โพเนนเชียลเมื่อการไล่ระดับสีเป็นศูนย์สถิติเพียงพอที่คาดหวังจะเท่ากับสถิติที่เพียงพอที่สังเกตได้ ฉันไม่เห็นการประเมินความเป็นไปได้สูงสุดในตระกูลเอ็กซ์โปเนนเชียลที่นำเสนอด้วยวิธีนี้และฉันไม่พบคำอธิบายที่เหมาะสมในการค้นหาของฉัน ใครบางคนสามารถให้ข้อมูลเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างสถิติที่สังเกตและคาดว่าเพียงพอและอาจช่วยให้เข้าใจการประมาณค่าความน่าจะเป็นสูงสุดในการลดความแตกต่างได้

1
อคติของตัวประมาณความน่าจะเป็นสูงสุดสำหรับการถดถอยโลจิสติก
ฉันต้องการที่จะเข้าใจข้อเท็จจริงบางประการเกี่ยวกับตัวประมาณความน่าจะเป็นสูงสุด (MLEs) สำหรับการถดถอยโลจิสติก โดยทั่วไป MLE สำหรับการถดถอยโลจิสติกนั้นมีอคติหรือไม่? ฉันจะพูดว่า "ใช่" ตัวอย่างเช่นฉันรู้ว่ามิติของตัวอย่างนั้นเกี่ยวข้องกับอคติของ MLEs คุณรู้ตัวอย่างเบื้องต้นของปรากฏการณ์นี้หรือไม่? ถ้า MLE นั้นเอนเอียงเป็นจริงหรือไม่ที่เมทริกซ์ความแปรปรวนร่วมของ MLEs เป็นค่าผกผันของ Hessian ของฟังก์ชันความน่าจะเป็นสูงสุด? แก้ไข : ฉันได้พบสูตรนี้ค่อนข้างบ่อยและไม่มีหลักฐานใด ๆ ; ดูเหมือนจะเป็นทางเลือกที่ค่อนข้างอิสระสำหรับฉัน

1
ทำไมคนหลัง Bayesian จึงมุ่งไปที่ตัวย่อของ KL divergence?
พิจารณาคชกรรมหลังX asymptotically, สูงสุดเกิดขึ้นใน MLE ประมาณการที่เพิ่งเพิ่มโอกาส(X)θ ∣ Xθ|X\theta\mid Xθ^θ^\hat \thetaargminθฉθ( X)argminθฉθ(X)\operatorname{argmin}_\theta\, f_\theta(X) แนวคิดทั้งหมดเหล่านี้ - นักบวชชาว Bayesian, เพิ่มความเป็นไปได้สูงสุด - ให้เสียงที่ดีเลิศและไม่เป็นไปตามอำเภอใจ ไม่มีการลงชื่อเข้าใช้ แต่ MLE จะลดความแตกต่างของ KL ให้น้อยที่สุดระหว่างการกระจายจริงและเช่นจะย่อเล็กสุดฉ~ฉ~\tilde fฉθ( x )ฉθ(x)f_\theta(x) KL (ฉ~∥ฉθ) =∫+ ∞- ∞ฉ~( x ) [บันทึกฉ~( x ) - บันทึกฉθ( x ) ]dxKL(ฉ~∥ฉθ)=∫-∞+∞ฉ~(x)[เข้าสู่ระบบ⁡ฉ~(x)-เข้าสู่ระบบ⁡ฉθ(x)]dx KL(\tilde f \parallel f_\theta) = \int_{-\infty}^{+\infty} \tilde f(x) …

2
คุณสมบัติความไม่แปรเปลี่ยนของตัวประมาณค่า ML นั้นไร้ความหมายจากมุมมองแบบเบย์หรือไม่?
Casella และ Bergerระบุคุณสมบัติ invariance ของตัวประมาณค่า ML ดังนี้: อย่างไรก็ตามดูเหมือนว่าพวกเขาจะกำหนด "โอกาส" ของ ηη\eta อย่างสมบูรณ์แบบและไร้สาระ: ถ้าฉันใช้กฎพื้นฐานของทฤษฎีความน่าจะเป็นกับกรณีอย่างง่าย η=τ(θ)=θ2η=τ(θ)=θ2\eta=\tau(\theta)=\theta^2ฉันได้รับต่อไปนี้แทน: L(η|x)=p(x|θ2=η)=p(x|θ=−η–√∨θ=η–√)=:p(x|A∨B)L(η|x)=p(x|θ2=η)=p(x|θ=−η∨θ=η)=:p(x|A∨B)L(\eta|x)=p(x|\theta^2=\eta)=p(x|\theta = -\sqrt \eta \lor \theta = \sqrt \eta)=:p(x|A \lor B) ตอนนี้ใช้ทฤษฎีบทของเบย์แล้วจากข้อเท็จจริงที่ว่า AAA และ BBB เป็นเอกสิทธิ์เฉพาะบุคคลร่วมกันเพื่อให้เราสามารถใช้กฎผลรวม: p(x|A∨B)=p(x)p(A∨B|x)p(A∨B)=p(x|A∨B)=p(x)p(A|x)+p(B|x)p(A)+p(B)p(x|A∨B)=p(x)p(A∨B|x)p(A∨B)=p(x|A∨B)=p(x)p(A|x)+p(B|x)p(A)+p(B)p(x|A\lor B)=p(x)\frac {p(A\lor B|x)}{p(A\lor B)}=p(x|A\lor B)=p(x)\frac {p(A|x)+p(B|x)}{p(A)+p(B)} ตอนนี้ใช้ทฤษฎีบทของเบย์กับเงื่อนไขในตัวเศษอีกครั้ง: p(x)p(A)p(x|A)p(x)+p(B)p(x|B)p(x)p(A)+p(B)=p(A)p(x|A)+p(B)p(x|B)p(A)+p(B)p(x)p(A)p(x|A)p(x)+p(B)p(x|B)p(x)p(A)+p(B)=p(A)p(x|A)+p(B)p(x|B)p(A)+p(B)p(x)\frac {p(A)\frac {p(x|A)}{p(x)}+p(B)\frac {p(x|B)}{p(x)}}{p(A)+p(B)}=\frac {p(A)p(x|A)+p(B)p(x|B)}{p(A)+p(B)} ถ้าเราต้องการเพิ่ม wrt นี้ให้สูงสุด ηη\eta เพื่อให้ได้ค่าประมาณโอกาสสูงสุด ηη\etaเราต้องเพิ่มสูงสุด: pθ(−η–√)p(x|θ=−η–√)+pθ(η–√)p(x|θ=η–√)pθ(−η)p(x|θ=−η)+pθ(η)p(x|θ=η)p_\theta(-\sqrt …

1
ความสัมพันธ์ระหว่าง MLE และกำลังสองน้อยที่สุดในกรณีของการถดถอยเชิงเส้น
Hastie และ Tibshirani พูดถึงในหัวข้อ 4.3.2 ของหนังสือของพวกเขาว่าในการตั้งค่าการถดถอยเชิงเส้นแนวทางสแควร์สน้อยที่สุดในความเป็นจริงเป็นกรณีพิเศษของความน่าจะเป็นสูงสุด เราจะพิสูจน์ผลลัพธ์นี้ได้อย่างไร? PS: อะไหล่ไม่มีรายละเอียดทางคณิตศาสตร์

2
ช่วยในการเพิ่มความคาดหวังจากกระดาษ: วิธีการรวมการกระจายก่อนหน้า?
คำถามนี้มีพื้นฐานอยู่บนกระดาษหัวข้อ: การสร้างภาพใหม่ในการถ่ายภาพด้วยแสงแบบกระจายโดยใช้แบบจำลองการกระจายการแผ่รังสีแบบคู่ - การกระจาย ลิ้งค์ดาวน์โหลด ผู้เขียนใช้อัลกอริทึม EM ด้วย ล.1l1l_1sparsity normalization ของ vectorไม่รู้จักเพื่อประมาณค่าพิกเซลของรูปภาพ รูปแบบที่ได้รับจากμμ\mu Y= A μ + e(1)(1)y=Aμ+ey=A\mu + e \tag{1} การประมาณการจะได้รับใน Eq (8) เป็น μ^= หาเรื่องm a x lnp ( y| μ)+γLNp ( μ )(2)(2)μ^=arg⁡maxln⁡p(y|μ)+γln⁡p(μ)\hat{\mu} = \arg max {\ln p(y|\mu) + \gamma \ln p(\mu)} \tag{2} ในกรณีของฉันฉันได้ถือว่าเป็นตัวกรองความยาวและคือคูณเวกเตอร์ที่แสดงตัวกรอง ดังนั้น,μμ\muLLLμμ\mathbf{\mu}L × 1L×1L …

1
ทำไมค่าสัมประสิทธิ์การถดถอยเชิงเส้นและโลจิสติกไม่สามารถประมาณได้โดยใช้วิธีการเดียวกัน
ฉันอ่านในหนังสือการเรียนรู้ของเครื่องว่าสามารถประมาณค่าพารามิเตอร์ของการถดถอยเชิงเส้น (ท่ามกลางวิธีอื่น ๆ ) โดยการไล่ระดับสีแบบลาดชันในขณะที่พารามิเตอร์ของการถดถอยแบบโลจิสติกมักจะประเมินโดยการประมาณโอกาสสูงสุด เป็นไปได้หรือไม่ที่จะอธิบายให้กับผู้เริ่มต้น (ฉัน) ว่าทำไมเราถึงต้องการวิธีการที่แตกต่างกันสำหรับการถดถอยเชิงเส้น / ลอจิสติก หรือที่รู้จักว่าทำไมไม่ MLE สำหรับการถดถอยเชิงเส้นและทำไมไม่ไล่ระดับความลาดชันสำหรับการถดถอยโลจิสติก?

1
การบรรจบกันของอัลกอริทึม EM ที่มีการกระจายตัวแบบผสมไบวาเรีย
ผมมีรูปแบบผสมซึ่งผมต้องการที่จะหาประมาณค่าความน่าจะเป็นสูงสุดของการได้รับชุดของข้อมูลและชุดของข้อมูลบางส่วนที่สังเกตZฉันได้ดำเนินการทั้ง E-ขั้นตอน (คำนวณความคาดหวังของให้และพารามิเตอร์ปัจจุบัน ) และขั้นตอนเอ็มเพื่อลดเชิงลบเข้าสู่ระบบได้รับโอกาสที่คาดว่าจะZxxxzzzzzzxxxθkθk\theta^kzzz ตามที่ฉันได้เข้าใจแล้วโอกาสสูงสุดที่เพิ่มขึ้นสำหรับการทำซ้ำทุกครั้งซึ่งหมายความว่าโอกาสในการลบเชิงลบจะต้องลดลงสำหรับการทำซ้ำทุกครั้งหรือไม่ อย่างไรก็ตามในขณะที่ฉันทำซ้ำอัลกอริทึมไม่ได้สร้างมูลค่าลดลงของความน่าจะเป็นบันทึกเชิงลบ แต่อาจลดลงและเพิ่มขึ้นได้ ตัวอย่างเช่นนี่คือค่าของความน่าจะเป็นบันทึกเชิงลบจนกระทั่งการลู่เข้า: ที่นี่ฉันเข้าใจผิดไหม? นอกจากนี้สำหรับข้อมูลจำลองเมื่อฉันดำเนินการความเป็นส่วนตัวสูงสุดสำหรับตัวแปรแฝงที่แท้จริง (ไม่มีการตรวจสอบ) ฉันมีความใกล้เคียงกับความสมบูรณ์แบบมากแสดงว่าไม่มีข้อผิดพลาดในการเขียนโปรแกรม สำหรับอัลกอริทึม EM นั้นมักจะรวมตัวกันเป็นโซลูชั่นย่อยที่ชัดเจนโดยเฉพาะอย่างยิ่งสำหรับชุดย่อยเฉพาะของพารามิเตอร์ (เช่นสัดส่วนของตัวแปรการจำแนกประเภท) เป็นที่ทราบกันดีว่าอัลกอริทึมอาจมาบรรจบกันเพื่อท้องถิ่นน้อยหรือจุดหยุดนิ่งจะมีการแก้ปัญหาการค้นหาธรรมดาหรือเช่นเดียวกันเพื่อเพิ่มโอกาสในการหาขั้นต่ำทั่วโลก (หรือสูงสุด) สำหรับปัญหานี้โดยเฉพาะฉันเชื่อว่ามีการจำแนกประเภทมิสจำนวนมากเนื่องจากการผสมสองตัวแปรหนึ่งในสองการแจกแจงใช้ค่าที่มีความน่าจะเป็นที่หนึ่ง (มันคือการผสมผสานของอายุการใช้งานT=zT0+(1−z)∞T=zT0+(1−z)∞T=z T_0 + (1-z)\inftyโดยที่หมายถึงส่วนที่เป็นของการแจกแจงอย่างใดอย่างหนึ่ง ตัวบ่งชี้ถูกตรวจสอบแน่นอนในชุดข้อมูล zzzzzz ฉันเพิ่มตัวเลขที่สองสำหรับเมื่อฉันเริ่มต้นด้วยวิธีแก้ปัญหาเชิงทฤษฎี (ซึ่งควรใกล้เคียงที่สุด) อย่างไรก็ตามตามที่สามารถเห็นได้ถึงความน่าจะเป็นและพารามิเตอร์ที่เบี่ยงเบนจากการแก้ปัญหานี้ไปสู่สิ่งที่ด้อยกว่าอย่างชัดเจน แก้ไข: ข้อมูลทั้งหมดอยู่ในรูปแบบโดยที่เป็นเวลาที่สังเกตสำหรับหัวเรื่อง ,ระบุว่าเวลาเกี่ยวข้องกับเหตุการณ์จริงหรือไม่ หรือถ้ามันถูกเซ็นเซอร์อย่างถูกต้อง (1 หมายถึงเหตุการณ์และ 0 หมายถึงการเซ็นเซอร์ที่ถูกต้อง),คือเวลาตัดปลายของการสังเกต (อาจเป็น 0) ด้วยตัวบ่งชี้การตัดและในที่สุดเป็นตัวบ่งชี้ว่า bivariate มันเราแค่ต้องพิจารณา 0 และ 1)xi=(ti,δi,Li,τi,zi)xi=(ti,δi,Li,τi,zi)\mathbf{x_i}=(t_i,\delta_i,L_i,\tau_i,z_i)titit_iiiiδiδi\delta_iLiLiL_iτiτi\tau_iziziz_i สำหรับเรามีฟังก์ชั่นความหนาแน่นในทำนองเดียวกันก็มีความเกี่ยวข้องกับฟังก์ชันการกระจายหาง1) สำหรับเหตุการณ์ที่น่าสนใจจะไม่เกิดขึ้น แม้ว่าจะไม่มีที่เกี่ยวข้องกับการกระจายนี้เรากำหนดให้เป็นจึงและ 1 สิ่งนี้ยังให้การกระจายแบบเต็มต่อไปนี้:z=1z=1z=1fz(t)=f(t|z=1)fz(t)=f(t|z=1)f_z(t)=f(t|z=1)Sz(t)=S(t|z=1)Sz(t)=S(t|z=1)S_z(t)=S(t|z=1)z=0z=0z=0tttinfinf\inff(t|z=0)=0f(t|z=0)=0f(t|z=0)=0S(t|z=0)=1S(t|z=0)=1S(t|z=0)=1 …

1
การประมาณแบบเบย์ที่มี "แบนก่อน" เหมือนกับการประเมินความเป็นไปได้สูงสุดหรือไม่?
ในสายวิวัฒนาการต้นไม้ phylogenetic มักถูกสร้างขึ้นโดยใช้ MLE หรือการวิเคราะห์แบบเบย์ อาจเกิดการแบนก่อนใช้ในการประเมินแบบเบย์ ตามที่ฉันเข้าใจแล้วการประมาณการแบบเบย์เป็นการประมาณการความเป็นไปได้ที่จะรวมเอาการประเมินก่อนหน้านี้ คำถามของฉันคือถ้าคุณใช้ความคิดก่อนหน้านี้มันแตกต่างจากการวิเคราะห์ความน่าจะเป็นหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.