คำถามติดแท็ก estimation

แท็กนี้กว้างเกินไป โปรดระบุแท็กที่เฉพาะเจาะจงมากขึ้น สำหรับคำถามเกี่ยวกับคุณสมบัติของตัวประมาณค่าเฉพาะให้ใช้แท็ก [estimators] แทน

2
ประมาณอัตราที่เครื่องชั่งเบี่ยงเบนมาตรฐานที่มีตัวแปรอิสระ
ฉันมีการทดลองในที่ที่ฉันกำลังการวัดของการกระจายตามปกติตัวแปรYYY , Y∼ N( μ , σ)Y∼N(μ,σ)Y \sim N(\mu,\sigma) อย่างไรก็ตามการทดลองก่อนหน้านี้ได้มีหลักฐานบางอย่างที่เบี่ยงเบนมาตรฐานσσ\sigmaเป็นฟังก์ชั่นเลียนแบบของตัวแปรอิสระคือXXX σ= a | X| +bσ=a|X|+b\sigma = a|X| + b Y∼ N( μ , a | X| +b)Y∼N(μ,a|X|+b)Y \sim N(\mu,a|X| + b) ฉันต้องการที่จะประเมินค่าพารามิเตอร์และBโดยการสุ่มตัวอย่างYที่หลายค่าของX นอกจากนี้เนื่องจากข้อ จำกัด ในการทดสอบฉันสามารถใช้ตัวอย่างYจำนวน จำกัด (ประมาณ 30-40) เท่านั้นและต้องการสุ่มตัวอย่างที่ค่าXหลาย ๆ ค่าด้วยเหตุผลการทดลองที่ไม่เกี่ยวข้อง ได้รับข้อ จำกัด เหล่านี้สิ่งที่วิธีการที่มีอยู่ในการประมาณการและข ?aaaขbbYYYXXXYYYXXXaaaขbb คำอธิบายการทดลอง นี่เป็นข้อมูลเพิ่มเติมถ้าคุณสนใจว่าทำไมฉันถึงถามคำถามข้างต้น การทดลองของฉันวัดการรับรู้ทางสายตาและภาพ ฉันมีตั้งค่าการทดสอบที่ฉันสามารถนำเสนอทั้งการได้ยินหรือการมองเห็นเป้าหมายจากสถานที่ที่แตกต่างกัน, , …

1
เครื่องมือประมาณการ James-Stein ที่มีความแปรปรวนไม่เท่ากัน
ทุกคำสั่งที่ฉันพบของตัวประมาณ James-Stein ถือว่าตัวแปรสุ่มที่ถูกประมาณนั้นมีความแปรปรวน (และหน่วย) เหมือนกัน แต่ตัวอย่างทั้งหมดเหล่านี้ยังพูดถึงว่าตัวประมาณ JS สามารถใช้ในการประมาณปริมาณโดยไม่เกี่ยวข้องกัน ตัวอย่างเช่นวิกิพีเดียคือความเร็วของแสงการบริโภคกาแฟในไต้หวันและน้ำหนักหมูในมอนแทนา แต่สมมุติว่าการวัดปริมาณทั้งสามนี้ของคุณจะมีความแปรปรวน "ที่แท้จริง" ที่แตกต่างกัน สิ่งนี้นำเสนอปัญหาหรือไม่? สิ่งนี้เชื่อมโยงกับปัญหาเชิงแนวคิดที่ใหญ่กว่าซึ่งฉันไม่เข้าใจเกี่ยวข้องกับคำถามนี้: ตัวประเมินเจมส์ - สไตน์: Efron และมอร์ริสคำนวณในปัจจัยการหดตัวอย่างเบสบอลของพวกเขาอย่างไร σ2σ2\sigma^2 cเราคำนวณปัจจัยการหดตัวดังนี้คcc c = 1 - ( k - 3 ) σ2∑ ( y- y¯)2c=1−(k−3)σ2∑(y−y¯)2 c = 1 - \frac{(k-3) \sigma^2} {\sum (y - \bar{y})^2} ฉันคิดว่าเทอมนั้นจริง ๆ แล้ว - ต่างกันสำหรับแต่ละปริมาณที่ประมาณไว้ แต่การสนทนาในคำถามนั้นพูดถึงการใช้ความแปรปรวนร่วมเท่านั้น …

2
การประมาณค่าความแปรปรวนของตัวอย่างปกติที่ตรวจสอบโดยกึ่งกลาง
ฉันมีกระบวนการจากที่ผมได้รับตัวอย่างขนาดเล็ก (ปกติกระจายnโดยปกติ 10-30) ที่ฉันต้องการที่จะใช้ในการประมาณค่าความแปรปรวน แต่บ่อยครั้งที่กลุ่มตัวอย่างอยู่ใกล้กันมากจนเราไม่สามารถวัดจุดแต่ละจุดที่อยู่ใกล้ศูนย์กลาง ฉันมีความเข้าใจที่คลุมเครือว่าเราควรสร้างตัวประมาณที่มีประสิทธิภาพโดยใช้ตัวอย่างที่สั่ง: ตัวอย่างเช่นถ้าฉันรู้ว่าตัวอย่างมี 20 คะแนนและ 10 กลุ่มนั้นอยู่ใกล้ศูนย์กลางเกินไปที่จะวัดเป็นรายบุคคล แต่ฉันมีการวัดแบบแยก 5 บนหางทั้งสองข้าง, มีวิธีการมาตรฐาน / สูตรสำหรับการประเมินความแปรปรวนของกระบวนการที่ใช้ตัวอย่างที่ดีที่สุดหรือไม่? (โปรดทราบว่าฉันไม่คิดว่าฉันสามารถถ่วงน้ำหนักค่าเฉลี่ยของศูนย์ได้ตัวอย่างเช่นเป็นไปได้สำหรับ 7 ตัวอย่างที่จะจัดกลุ่มให้แน่นในขณะที่อีกสามตัวเอียงไปด้านข้างแบบไม่สมมาตร แต่ใกล้พอที่เราจะบอกไม่ได้ .) หากคำตอบนั้นซับซ้อนเคล็ดลับใด ๆ เกี่ยวกับสิ่งที่ฉันควรทำการวิจัยจะได้รับการชื่นชม เช่นนี้เป็นปัญหาเกี่ยวกับสถิติการสั่งซื้อหรือไม่ มีแนวโน้มที่จะเป็นคำตอบสูตรหรือเป็นปัญหาการคำนวณหรือไม่ อัพเดทรายละเอียด:แอพพลิเคชั่นวิเคราะห์เป้าหมายการยิง ตัวอย่างพื้นฐานเดียวคือจุดกระทบ ( x, y ) ของการยิงครั้งเดียวบนเป้าหมาย กระบวนการพื้นฐานมีการแจกแจงปกติแบบสมมาตร bivariate แต่ไม่มีความสัมพันธ์กันระหว่างแกนดังนั้นเราจึงสามารถรักษาตัวอย่าง { x } และ { y } เป็นอิสระจากการแจกแจงแบบเดียวกัน (นอกจากนี้เรายังสามารถพูดกระบวนการพื้นฐานคือเรย์ลีกระจาย แต่เราไม่สามารถวัดตัวอย่าง Rayleigh variates เพราะเราไม่สามารถจะมั่นใจได้ของพิกัดของศูนย์ …

1
การประมาณความชันของส่วนตรงของส่วนโค้ง sigmoid
ฉันได้รับงานนี้แล้วก็นิ่งงัน เพื่อนร่วมงานขอให้ฉันประเมินและของแผนภูมิต่อไปนี้:xupperxupperx_{upper}xlowerxlowerx_{lower} เส้นโค้งนั้นคือการแจกแจงแบบสะสมและ x เป็นการวัดแบบหนึ่ง เขาสนใจที่จะรู้ว่าอะไรคือค่าที่สอดคล้องกันของ x เมื่อฟังก์ชันสะสมเริ่มกลายเป็นเส้นตรงและเบี่ยงเบนจากการเป็นเส้นตรง ฉันเข้าใจว่าเราสามารถใช้ความแตกต่างเพื่อค้นหาความชัน ณ จุดหนึ่ง แต่ฉันไม่แน่ใจว่าจะระบุได้อย่างไรว่าเราจะโทรหาเส้นตรงได้เมื่อไหร่ เขยิบต่อแนวทาง / วรรณกรรมที่มีอยู่แล้วบางส่วนจะได้รับการชื่นชมอย่างมาก ฉันรู้ว่าอาร์เช่นกันถ้าคุณรู้แพคเกจหรือตัวอย่างที่เกี่ยวข้องในการสืบสวนประเภทนี้ ขอบคุณมาก. UPDATE ขอบคุณ Flounderer ฉันสามารถขยายงานเพิ่มเติมตั้งค่ากรอบงานและแก้ไขพารามิเตอร์ที่นี่และที่นั่น เพื่อจุดประสงค์ในการเรียนรู้นี่คือรหัสปัจจุบันของฉันและเอาต์พุตกราฟิก library(ESPRESSO) x <- skew.rnorm(800, 150, 5, 3) x <- sort(x) meanX <- mean(x) sdX <- sd(x) stdX <- (x-meanX)/sdX y <- pnorm(stdX) par(mfrow=c(2,2), mai=c(1,1,0.3,0.3)) hist(x, col="#03718750", border="white", main="") …

1
ตัวอย่างการประมาณหลังสูงสุด
ฉันได้อ่านเกี่ยวกับการประมาณความเป็นไปได้สูงสุดและการประมาณหลังสูงสุดและจนถึงตอนนี้ฉันได้พบตัวอย่างที่เป็นรูปธรรมเท่านั้นด้วยการประมาณความเป็นไปได้สูงสุด ฉันได้พบตัวอย่างนามธรรมของการประมาณค่าสูงสุดหลัง แต่ก็ยังไม่มีตัวเลขที่เป็นรูปธรรม: S มันสามารถครอบงำได้มากทำงานเฉพาะกับตัวแปรและฟังก์ชั่นที่เป็นนามธรรมและเพื่อไม่ให้จมน้ำตายในความเป็นนามธรรมนี้มันเป็นเรื่องดีที่จะเชื่อมโยงสิ่งต่าง ๆ เข้ากับโลกแห่งความจริงเป็นครั้งคราว แต่แน่นอนนี่เป็นเพียงการสังเกตของฉัน (และคนอื่น ๆ ) :) ดังนั้นทุกคนสามารถให้ฉันตัวอย่างง่ายๆ แต่เป็นรูปธรรมเกี่ยวกับการประมาณ Posteriori สูงสุดด้วยตัวเลขบน? นั่นจะช่วยได้มาก :) ขอบคุณ! ฉันได้โพสต์คำถามนี้ไว้ที่ MSE แต่ไม่สามารถหาคำตอบได้ที่นั่น: /math/449386/example-of-maximum-a-posteriori-estimation ฉันได้ทำตามคำแนะนำที่ให้ไว้ที่นี่ในการโพสต์ข้าม: http://meta.math.stackexchange.com/questions/5028/how-do-i-move-a-post-to-another-forum-like-cv-stats

1
วิธีประมาณค่าขอบเขตบนสำหรับการถดถอยโลจิสติกโดยจุดข้อมูลเพียง 5 ถึง 7
ผมมีข้อมูลที่อยู่ในรูปx)} สำหรับการประมาณถึงฉันใช้สูตรของบทความนี้: จอห์นฟ็อกซ์ - การถดถอยแบบไม่เชิงเส้นและสแควร์สแบบไม่เชิงเส้น ในบทความนี้ถูกประเมินโดยการดูข้อมูล ถ้าฉันทำมันได้ผลแม้ว่าฉันจะมีแค่สามคะแนน จากนั้นฉันสามารถคำนวณอีกสองอัน ฉันทดสอบพารามิเตอร์ด้วย nls () ใน R และ LevenbergMarquardt ใน C # โมเดลที่ส่งคืนโดยพวกเขาพอใจy=β11+exp(β2+β3∗x)y=β11+exp⁡(β2+β3∗x)y = \frac{\beta_1}{1 + \exp(\beta_2 + \beta_3 * x)}β1β1\beta_1β3β3\beta_3β1β1\beta_1 ปัญหาคือฉันไม่ต้องการดูข้อมูลเพื่อรับตัวประมาณที่ดีสำหรับฉันต้องการให้โปรแกรมคำนวณมัน บางครั้งฉันใช้ค่าที่สูงกว่าค่าสูงสุดของฉันเล็กน้อย (บางสิ่งระหว่างถึง\ max * 1.5มันใช้งานได้ดีตราบใดที่คะแนนครอบคลุมฟังก์ชั่นส่วนใหญ่ จุดข้อมูลอยู่ที่ไหนสักแห่งจาก "ด้านบน" ของเส้นโค้ง แต่เมื่อพวกเขาทั้งหมดมาจากพื้นที่ "ด้านล่าง" จุดเบี่ยงเบนตัวประมาณนี้ต่ำกว่าที่ควรจะเป็นแน่นอนและฉันไม่เหมาะกับแบบจำลองถ้าฉันใช้บางอย่าง นั่นสูงกว่าจุดสูงสุดแน่นอน (โดยการคูณด้วยค่าที่สูงอย่างน่าขัน) โมเดลไม่เหมาะกับวิธีที่มีประโยชน์ใด ๆβ1β1\beta_1max∗1.1max∗1.1\max * 1.1max∗1.5max∗1.5\max * 1.5 การวัดอาจมีลักษณะเช่นนี้: x = …

2
การอ้างอิงสำหรับ ?
ในคำตอบของเขาสำหรับคำถามก่อนหน้านี้@Erik P.ให้นิพจน์ ที่คือส่วนเกินของการแจกแจง อ้างอิงถึงรายการวิกิพีเดียเกี่ยวกับการแจกแจงความแปรปรวนตัวอย่างแต่หน้าวิกิพีเดียบอกว่า "อ้างอิงที่จำเป็น"κVar[s2]=σ4(2n−1+κn),Var[s2]=σ4(2n−1+κn), \mathrm{Var}[s^2]=\sigma^4 \left(\frac{2}{n-1} + \frac{\kappa}{n}\right) \>, κκ\kappa คำถามหลักของฉันคือมีการอ้างอิงสำหรับสูตรนี้หรือไม่? มัน 'เล็กน้อย' ที่จะได้มาและถ้าเป็นเช่นนั้นมันสามารถพบได้ในตำราเรียน? (@Erik P. ไม่พบในสถิติคณิตศาสตร์และการวิเคราะห์ข้อมูลหรือฉันในการอนุมานทางสถิติโดย Casella และ Bergerแม้ว่าหัวข้อจะครอบคลุม มันจะดีถ้ามีการอ้างอิงตำราเรียน แต่มีประโยชน์มากกว่าที่จะมีการอ้างอิงหลัก (the) (คำถามที่เกี่ยวข้องคือ: การแจกแจงความแปรปรวนของตัวอย่างจากการแจกแจงที่ไม่รู้จักคืออะไร ) อัปเดต : @ cardinalชี้ให้เห็นสมการอื่นในmath.SE : โดยที่คือช่วงเวลากลางที่สี่ μ4Var(S2)=μ4n−σ4(n−3)n(n−1)Var(S2)=μ4n−σ4(n−3)n(n−1) \mathrm{Var}(S^2)={\mu_4\over n}-{\sigma^4\,(n-3)\over n\,(n-1)} μ4μ4\mu_4 มีวิธีที่จะจัดเรียงสมการใหม่และแก้ไขทั้งสองหรือสมการในชื่อผิดหรือไม่?

3
การประมาณค่าเฉลี่ยและ st dev ของเส้นโค้งแบบเกาส์ที่ถูกตัดทอนโดยไม่มีการขัดขวาง
สมมติว่าฉันมีกล่องดำที่สร้างข้อมูลหลังจากการแจกแจงแบบปกติด้วยค่าเฉลี่ย m และส่วนเบี่ยงเบนมาตรฐาน อย่างไรก็ตามสมมติว่าเมื่อใดก็ตามที่มันส่งออกค่า <0 มันจะไม่บันทึกอะไรเลย (ไม่สามารถบอกได้เลยว่ามันเป็นค่าที่ส่งออก) เรามีการแจกแจงแบบเกาส์ที่ถูกตัดทอนโดยไม่มีการขัดขวาง ฉันจะประมาณค่าพารามิเตอร์เหล่านี้ได้อย่างไร

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
แคลคูลัสจำเป็นต้องมีความเข้าใจในการประมาณค่าความน่าจะเป็นสูงสุดอย่างไร
ฉันพยายามวางแผนแผนการเรียนรู้เพื่อการเรียนรู้ MLE ในการทำเช่นนี้ฉันกำลังพยายามหาแคลคูลัสระดับต่ำสุดที่จำเป็นต้องเข้าใจ MLE มันเพียงพอที่จะเข้าใจพื้นฐานของแคลคูลัส (เช่นการค้นหาฟังก์ชันขั้นต่ำและสูงสุด) เพื่อที่จะเข้าใจ MLE หรือไม่?

2
จะประมาณความแม่นยำของอินทิกรัลได้อย่างไร?
สถานการณ์ที่พบบ่อยมากในคอมพิวเตอร์กราฟฟิคคือสีของบางพิกเซลเท่ากับส่วนที่สำคัญของฟังก์ชั่นที่มีมูลค่าจริง บ่อยครั้งที่ฟังก์ชั่นนั้นซับซ้อนเกินกว่าที่จะแก้ปัญหาเชิงวิเคราะห์ดังนั้นเราจึงเหลือการประมาณเชิงตัวเลข แต่ฟังก์ชั่นมักจะมีราคาแพงมากในการคำนวณดังนั้นเราจึงถูก จำกัด อย่างมากในจำนวนตัวอย่างที่เราสามารถคำนวณได้ (เช่นคุณไม่สามารถตัดสินใจที่จะรับตัวอย่างหนึ่งล้านตัวอย่างและทิ้งไว้ที่นี่) โดยทั่วไปแล้วสิ่งที่คุณต้องการทำคือประเมินฟังก์ชันที่จุดที่เลือกแบบสุ่มจนกระทั่งอินทิกรัลประมาณกลายเป็น "แม่นยำเพียงพอ" ซึ่งนำมาสู่คำถามจริงของฉัน: คุณประเมิน "ความถูกต้อง" ของอินทิกรัลอย่างไร? โดยเฉพาะอย่างยิ่งเรามีซึ่งดำเนินการโดยอัลกอริทึมคอมพิวเตอร์ที่ซับซ้อนและช้า เราต้องการประเมินf:R→Rf:R→Rf : \mathbb{R} \rightarrow \mathbb{R} k=∫baf(x) dxk=∫abf(x) dxk = \int_a^b f(x) \ dx เราสามารถคำนวณสำหรับเราปรารถนาได้ แต่มันมีราคาแพง ดังนั้นเราต้องการเลือกค่าหลายค่าแบบสุ่มและหยุดเมื่อค่าประมาณของกลายเป็นที่ยอมรับได้อย่างแม่นยำ แน่นอนว่าในการทำเช่นนี้เราจำเป็นต้องทราบว่าการประมาณการในปัจจุบันนั้นแม่นยำเพียงใดx x kf(x)f(x)f(x)xxxxxxkkk ฉันไม่แน่ใจด้วยซ้ำว่าเครื่องมือทางสถิติใดที่เหมาะสำหรับปัญหาประเภทนี้ แต่สำหรับฉันแล้วดูเหมือนว่าถ้าเราไม่รู้อะไรเกี่ยวกับอย่างแน่นอนปัญหาก็แก้ไม่ได้ ตัวอย่างเช่นถ้าคุณคำนวณหนึ่งพันครั้งและมันก็เป็นศูนย์เสมออินทิกรัลที่ประมาณไว้ของคุณจะเป็นศูนย์ แต่ไม่รู้อะไรเลยเกี่ยวกับf ( x ) fffff(x)f(x)f(x)fffมันยังคงเป็นไปได้ที่ทุกที่ยกเว้นจุดที่คุณสุ่มตัวอย่างดังนั้นการประเมินของคุณจึงผิดอย่างมาก!f(x)=1,000,000f(x)=1,000,000f(x) = 1,000,000 บางทีคำถามของฉันควรเริ่มด้วย"เราต้องรู้อะไรเกี่ยวกับเพื่อให้สามารถประเมินความถูกต้องของอินทิกรัลของเราได้fff ?" ตัวอย่างเช่นเรามักรู้ว่าเป็นไปไม่ได้ที่จะเป็นลบซึ่งดูเหมือนจะเป็นข้อเท็จจริงที่เกี่ยวข้อง ...fff แก้ไข:ตกลงดังนั้นสิ่งนี้ดูเหมือนจะสร้างคำตอบมากมายซึ่งเป็นสิ่งที่ดี แทนที่จะตอบกลับเป็นรายบุคคลฉันจะพยายามเติมภูมิหลังเพิ่มเติมที่นี่ เมื่อฉันบอกว่าเรารู้ "ไม่มีอะไร" …

1
การประมาณค่าสัมประสิทธิ์การถดถอยไม่เกี่ยวข้องกันหรือไม่?
พิจารณาการถดถอยง่าย (ปกติไม่ได้สันนิษฐาน):ที่คือมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน\ประมาณการสแควร์น้อยที่สุดของและไม่เกี่ยวข้องกันหรือไม่?Yi=a+bXi+ei,Yi=a+bXi+ei,Y_i = a + b X_i + e_i,eieie_i000σσ\sigmaaaabbb

1
เกี่ยวกับการมีอยู่ของ UMVUE และทางเลือกของตัวประมาณของในประชากร
Letเป็นตัวอย่างที่สุ่มมาจากประชากรที่R(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)N(θ,θ2)N(θ,θ2)\mathcal N(\theta,\theta^2)θ∈Rθ∈R\theta\in\mathbb R ฉันกำลังมองหา UMVUE ของ\θθ\theta ข้อต่อความหนาแน่นของคือ(X1,X2,⋯,Xn)(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n) fθ(x1,x2,⋯,xn)=∏i=1n1θ2π−−√exp[−12θ2(xi−θ)2]=1(θ2π−−√)nexp[−12θ2∑i=1n(xi−θ)2]=1(θ2π−−√)nexp[1θ∑i=1nxi−12θ2∑i=1nx2i−n2]=g(θ,T(x))h(x)∀(x1,⋯,xn)∈Rn,∀θ∈Rfθ(x1,x2,⋯,xn)=∏i=1n1θ2πexp⁡[−12θ2(xi−θ)2]=1(θ2π)nexp⁡[−12θ2∑i=1n(xi−θ)2]=1(θ2π)nexp⁡[1θ∑i=1nxi−12θ2∑i=1nxi2−n2]=g(θ,T(x))h(x)∀(x1,⋯,xn)∈Rn,∀θ∈R\begin{align} f_{\theta}(x_1,x_2,\cdots,x_n)&=\prod_{i=1}^n\frac{1}{\theta\sqrt{2\pi}}\exp\left[-\frac{1}{2\theta^2}(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[-\frac{1}{2\theta^2}\sum_{i=1}^n(x_i-\theta)^2\right] \\&=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[\frac{1}{\theta}\sum_{i=1}^n x_i-\frac{1}{2\theta^2}\sum_{i=1}^nx_i^2-\frac{n}{2}\right] \\&=g(\theta,T(\mathbf x))h(\mathbf x)\qquad\forall\,(x_1,\cdots,x_n)\in\mathbb R^n\,,\forall\,\theta\in\mathbb R \end{align} ที่และ 1g(θ,T(x))=1(θ2π√)nexp[1θ∑ni=1xi−12θ2∑ni=1x2i−n2]g(θ,T(x))=1(θ2π)nexp⁡[1θ∑i=1nxi−12θ2∑i=1nxi2−n2]g(\theta, T(\mathbf x))=\frac{1}{(\theta\sqrt{2\pi})^n}\exp\left[\frac{1}{\theta}\sum_{i=1}^n x_i-\frac{1}{2\theta^2}\sum_{i=1}^nx_i^2-\frac{n}{2}\right]h(x)=1h(x)=1h(\mathbf x)=1 ที่นี่ขึ้นอยู่กับและถึงและเป็นอิสระจาก\ดังนั้นโดยทฤษฎีบทตัวประกอบฟิชเชอร์ - เนย์แมนสถิติสองมิติก็เพียงพอแล้วสำหรับ\gggθθ\thetax1,⋯,xnx1,⋯,xnx_1,\cdots,x_nT(x)=(∑ni=1xi,∑ni=1x2i)T(x)=(∑i=1nxi,∑i=1nxi2)T(\mathbf x)=\left(\sum_{i=1}^nx_i,\sum_{i=1}^nx_i^2\right)hhhθθ\thetaT(X)=(∑ni=1Xi,∑ni=1X2i)T(X)=(∑i=1nXi,∑i=1nXi2)T(\mathbf X)=\left(\sum_{i=1}^nX_i,\sum_{i=1}^nX_i^2\right)θθ\theta อย่างไรก็ตามไม่ได้เป็นสถิติที่สมบูรณ์ นี่เป็นเพราะTTTEθ⎡⎣2(∑i=1nXi)2−(n+1)∑i=1nX2i⎤⎦=2n(1+n)θ2−(n+1)2nθ2=0∀θEθ[2(∑i=1nXi)2−(n+1)∑i=1nXi2]=2n(1+n)θ2−(n+1)2nθ2=0∀θE_{\theta}\left[2\left(\sum_{i=1}^n X_i\right)^2-(n+1)\sum_{i=1}^nX_i^2\right]=2n(1+n)\theta^2-(n+1)2n\theta^2=0\qquad\forall\,\theta และฟังก์ชั่นไม่ใช่ศูนย์เหมือนกันg∗(T(X))=2(∑ni=1Xi)2−(n+1)∑ni=1X2ig∗(T(X))=2(∑i=1nXi)2−(n+1)∑i=1nXi2g^*(T(\mathbf X))=2\left(\sum_{i=1}^n X_i\right)^2-(n+1)\sum_{i=1}^nX_i^2 แต่ฉันรู้ว่าเป็นสถิติที่น้อยที่สุดTTT ฉันไม่แน่ใจ แต่ฉันคิดว่าสถิติที่สมบูรณ์อาจไม่มีอยู่สำหรับตระกูลเลขชี้กำลังแบบโค้งนี้ แล้วฉันจะรับ UMVUE ได้อย่างไร? หากสถิติที่สมบูรณ์ไม่มีอยู่ตัวประมาณที่ไม่มีอคติ (เช่นในกรณีนี้) ซึ่งเป็นฟังก์ชันของสถิติที่เพียงพอเพียงเล็กน้อยคือ UMVUE หรือไม่ (หัวข้อที่เกี่ยวข้อง: เงื่อนไขที่จำเป็นสำหรับตัวประมาณที่ไม่มีอคติให้เป็น UMVUE คืออะไร …

2
UMVUE จากในขณะที่สุ่มตัวอย่างจากประชากร
ปล่อยเป็นตัวอย่างแบบสุ่มจากความหนาแน่น(X1,X2,…,Xn)(X1,X2,…,Xn)(X_1,X_2,\ldots,X_n)fθ(x)=θxθ−110<x<1,θ>0fθ(x)=θxθ−110<x<1,θ>0f_{\theta}(x)=\theta x^{\theta-1}\mathbf1_{00 ฉันกำลังพยายามที่จะหา UMVUE ของtheta}θ1+θθ1+θ\frac{\theta}{1+\theta} ความหนาแน่นรอยต่อของคือ(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n) fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110<x1,…,xn<1=exp[(θ−1)∑i=1nlnxi+nlnθ+ln(10<x1,…,xn<1)],θ>0fθ(x1,⋯,xn)=θn(∏i=1nxi)θ−110<x1,…,xn<1=exp⁡[(θ−1)∑i=1nln⁡xi+nln⁡θ+ln⁡(10<x1,…,xn<1)],θ>0\begin{align} f_{\theta}(x_1,\cdots,x_n)&=\theta^n\left(\prod_{i=1}^n x_i\right)^{\theta-1}\mathbf1_{00 \end{align} เนื่องจากประชากร pdfเป็นสมาชิกของตระกูลเลขชี้กำลังหนึ่งพารามิเตอร์นี่แสดงให้เห็นว่าสถิติที่เพียงพอสำหรับคือfθfθf_{\theta}θθ\thetaT(X1,…,Xn)=∑i=1nlnXiT(X1,…,Xn)=∑i=1nln⁡XiT(X_1,\ldots,X_n)=\sum_{i=1}^n\ln X_i ตั้งแต่ตอนแรกจะให้ UMVUE ของให้ฉัน ทฤษฎีบท Lehmann-Scheffe ถ้าไม่แน่ใจว่าความคาดหวังที่มีเงื่อนไขนี้สามารถพบได้โดยตรงหรือหนึ่งที่มีการพบว่าเงื่อนไขการจำหน่าย x_iE(X1)=θ1+θE(X1)=θ1+θE(X_1)=\frac{\theta}{1+\theta}E(X1∣T)E(X1∣T)E(X_1\mid T)θ1+θθ1+θ\frac{\theta}{1+\theta}X1∣∑ni=1lnXiX1∣∑i=1nln⁡XiX_1\mid \sum_{i=1}^n\ln X_i ในทางกลับกันฉันพิจารณาวิธีการต่อไปนี้: เรามีเพื่อให้{2n}Xi∼i.i.dBeta(θ,1)⟹−2θlnXi∼i.i.dχ22Xi∼i.i.dBeta(θ,1)⟹−2θln⁡Xi∼i.i.dχ22X_i\stackrel{\text{i.i.d}}{\sim}\text{Beta}(\theta,1)\implies -2\theta\ln X_i\stackrel{\text{i.i.d}}{\sim}\chi^2_2−2θT∼χ22n−2θT∼χ2n2-2\theta\, T\sim\chi^2_{2n} ดังนั้น TH เพื่อช่วงเวลาดิบเกี่ยวกับศูนย์ตามที่คำนวณโดยใช้ไคสแควร์เป็น pdfrrr−2θT−2θT-2\theta\,TE(−2θT)r=2rΓ(n+r)Γ(n),n+r>0E(−2θT)r=2rΓ(n+r)Γ(n),n+r>0E(-2\theta\,T)^r=2^r\frac{\Gamma\left(n+r\right)}{\Gamma\left(n\right)}\qquad ,\,n+r>0 ดังนั้นดูเหมือนว่าสำหรับทางเลือกที่แตกต่างกันของจำนวนเต็ม , ฉันจะได้รับประมาณเป็นกลาง (และ UMVUEs) ของอำนาจแตกต่างกันของจำนวนเต็ม\ตัวอย่างเช่นและให้ฉันเป็น UMVUE และตามลำดับrrrθθ\thetaE(−Tn)=1θE(−Tn)=1θE\left(-\frac{T}{n}\right)=\frac{1}{\theta}E(1−nT)=θE(1−nT)=θE\left(\frac{1-n}{T}\right)=\theta1θ1θ\frac{1}{\theta}θθ\theta ตอนนี้เมื่อเรามี1}θ>1θ>1\theta>1θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯θ1+θ=(1+1θ)−1=1−1θ+1θ2−1θ3+⋯\frac{\theta}{1+\theta}=\left(1+\frac{1}{\theta}\right)^{-1}=1-\frac{1}{\theta}+\frac{1}{\theta^2}-\frac{1}{\theta^3}+\cdots ฉันสามารถรับ UMVUE ได้และอื่น ๆ ดังนั้นการรวม UMVUE เหล่านี้เป็นฉันจะได้รับที่จำเป็น UMVUE …

2
Kullback-Leibler Divergence สำหรับสองตัวอย่าง
ฉันพยายามใช้การประมาณเชิงตัวเลขของ Kullback-Leibler Divergence สำหรับสองตัวอย่าง การแก้ปัญหาการดำเนินการวาดตัวอย่างจากสองการแจกแจงปรกติและ(1,2)N(0,1)N(0,1)\mathcal N (0,1)N(1,2)N(1,2)\mathcal N (1,2) สำหรับการประมาณแบบง่ายฉันได้สร้างฮิสโทแกรมสองกราฟและพยายามประมาณอินทิกรัลเชิงตัวเลข ฉันติดอยู่กับการจัดการส่วนต่าง ๆ ของฮิสโตแกรมที่ซึ่งช่องเก็บของฮิสโตแกรมนั้นมีค่าเป็นศูนย์ซึ่งฉันจะสิ้นสุดด้วยการหารด้วยศูนย์หรือลอการิทึมของศูนย์ ฉันจะจัดการปัญหานี้ได้อย่างไร คำถามที่เกี่ยวข้องอยู่ในใจของฉัน: จะคำนวณ KL-Divergence ระหว่างการแจกแจงเครื่องแบบที่แตกต่างกันสองแบบได้อย่างไร ฉันต้อง จำกัด อินทิกรัลกับการรวมกันของการสนับสนุนของการแจกแจงทั้งสองหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.