คำถามติดแท็ก estimation

แท็กนี้กว้างเกินไป โปรดระบุแท็กที่เฉพาะเจาะจงมากขึ้น สำหรับคำถามเกี่ยวกับคุณสมบัติของตัวประมาณค่าเฉพาะให้ใช้แท็ก [estimators] แทน

3
ปัญหาการประมาณค่าในการติดตาม GPS
ปัญหา:พิจารณารถยนต์สองคัน (นำมาเป็นวัตถุแบบจุด) ชื่อหัวหน้าLLL และผู้ติดตาม FFFทั้งคู่ติดตั้งอุปกรณ์ GPS ที่สื่อสารกัน วัตถุประสงค์ของFFF คือการปฏิบัติตาม LLLให้ใกล้เคียงที่สุดเท่าที่จะเป็นไปได้ในภายหลัง ระบุว่าอุปกรณ์ GPS ทั้งหมดมีการกระจายข้อผิดพลาดแบบวงกลมข้อผิดพลาด (CEP) โดยมีค่าเฉลี่ยที่กำหนดμ = (μx,μY)μ=(μx,μy)\mu = (\mu_x,\mu_y) และเมทริกซ์ความแปรปรวนร่วมที่กำหนด Σ2 × 2Σ2×2\Sigma_{2\times 2}. ระบุว่า LLL ลัดเลาะเป็นเส้นโค้ง คCC ในระนาบเส้นโค้งที่คาดหวังไว้คืออะไร FFF? นอกจากนี้การกระจายของคืออะไรFFFเส้นทาง เป็นวิธีที่ดีที่สุดสำหรับอะไร FFF เพื่อประเมิน LLL ในช่วงเวลาหนึ่ง? พื้นหลัง:นี่เป็นปัญหาที่เกิดขึ้นจริงที่ฉันต้องเผชิญในงานทดลองและไม่ทำการบ้านไม่ว่าจะด้วยวิธีใดก็ตาม ฉันรับรู้ถึงเครื่องมือต่าง ๆ เช่นตัวกรองคาลมานเพื่อการประมาณค่าสถานะที่เหมาะสมเมื่อเผชิญกับสัญญาณรบกวนของสีขาว แต่ฉันไม่แน่ใจว่าจะขยายไปยังกรณีนี้ได้อย่างไร ฉันต้องการทราบวรรณกรรมการวิจัยที่เกี่ยวข้องด้วย

3
อัตราการยอมรับของ Metropolis-Hastings พร้อมการกระจายผู้สมัครที่สม่ำเสมอ
เมื่อรันอัลกอริทึม Metropolis-Hastings ด้วยการแจกแจงผู้สมัครที่สม่ำเสมอเหตุผลในการมีอัตราการยอมรับประมาณ 20% คืออะไร? ความคิดของฉันคือ: เมื่อค้นพบค่าพารามิเตอร์จริง (หรือใกล้เคียงกับจริง) แล้วไม่มีการตั้งค่าพารามิเตอร์ของตัวเลือกใหม่จากช่วงเวลาเดียวกันที่เหมือนกันจะเพิ่มค่าของฟังก์ชันความน่าจะเป็น ดังนั้นยิ่งฉันวิ่งซ้ำมากเท่าไหร่อัตราการยอมรับก็ยิ่งต่ำลงเท่านั้น ฉันผิดในความคิดนี้ที่ไหน ขอบคุณมาก! นี่คือภาพประกอบการคำนวณของฉัน: A c c e p t a n c e _ r a t e = exp{ l (θค| Y) + บันทึก( p (θค) ) - [ l (θ* * * *| Y) + บันทึก( p (θ* …

4
การอ้างอิงการเพิ่มประสิทธิภาพเชิงตัวเลขสำหรับนักสถิติ
ฉันกำลังมองหาการอ้างอิงที่มั่นคง (หรือการอ้างอิง) เกี่ยวกับเทคนิคการเพิ่มประสิทธิภาพเชิงตัวเลขที่มุ่งเป้าไปที่นักสถิตินั่นคือมันจะใช้วิธีการเหล่านี้กับปัญหาเชิงอนุมานมาตรฐาน (เช่น MAP / MLE ในแบบจำลองทั่วไป) สิ่งต่าง ๆ เช่นการไล่ระดับสี (ตรงและสุ่ม), EM และ spinoffs / ภาพรวม, การจำลองการหลอม ฯลฯ ฉันหวังว่ามันจะมีบันทึกการใช้งานจริงบางอย่าง (มักขาดในเอกสาร) ไม่จำเป็นต้องชัดเจนอย่างสมบูรณ์ แต่อย่างน้อยก็ควรมีบรรณานุกรมที่เป็นของแข็ง การค้นหาคร่าวๆปรากฏขึ้นมาสองสามข้อความ: การวิเคราะห์เชิงตัวเลขสำหรับนักสถิติโดย Ken Lange และวิธีการเชิงตัวเลขของ John Monahan ความเห็นของแต่ละคนดูหลากหลาย (และกระจัดกระจาย) จากการตรวจสารบัญสองอย่างแสดงให้เห็นว่าหนังสือของ Lange ฉบับที่ 2 นั้นใกล้เคียงกับสิ่งที่ฉันทำมากที่สุด

1
ฉันสามารถประเมินความถี่ของเหตุการณ์โดยพิจารณาจากการสุ่มตัวอย่างเหตุการณ์ที่เกิดขึ้นได้หรือไม่
มีการแก้ไขบางอย่าง ... คำถามนี้มีไว้เพื่อความสนุกเท่านั้นดังนั้นหากมันไม่สนุกโปรดอย่าเพิกเฉย ฉันได้รับความช่วยเหลือมากมายจากไซต์นี้ดังนั้นฉันจึงไม่ต้องการกัดมือที่เลี้ยงฉัน มันขึ้นอยู่กับตัวอย่างในชีวิตจริงและเป็นเพียงสิ่งที่ฉันสงสัยเกี่ยวกับหลายอย่าง ฉันไปเยี่ยมโดโจในพื้นที่ของฉันเพื่อฝึกซ้อมแบบสุ่มเป็นหลักในวันจันทร์ถึงวันศุกร์ สมมติว่าฉันไปเยี่ยมสัปดาห์ละสองครั้ง ซึ่งหมายความว่าฉันไปเยี่ยมสองครั้งทุกสัปดาห์โดยมีเพียงสองวันเท่านั้นที่เปลี่ยนแปลง มีใครคนหนึ่งที่เกือบจะทุกครั้งที่ฉันอยู่ที่นั่น หากเขามาในวันเดียวกันกับฉันฉันก็จะเห็นเขา สมมติว่าเขาอยู่ที่นั่น 90% ของเวลาเมื่อฉันอยู่ที่นั่น ฉันอยากรู้สองสิ่ง: 1) เขาฝึกบ่อยแค่ไหน 2) ไม่ว่าเขาจะมาแบบสุ่มหรือในวันที่กำหนดของสัปดาห์ ฉันเดาว่าบางทีเราต้องสมมติให้เดาอีกอัน ฉันไม่เคยได้รับสิ่งนี้เลย ฉันแค่คิดเกี่ยวกับมันในการอุ่นเครื่องทุกสัปดาห์และงงงันอีกครั้ง แม้ว่าบางคนให้วิธีคิดเกี่ยวกับปัญหาที่ฉันจะขอบคุณมากที่สุด ไชโย!

2
คำนวณ ROC curve สำหรับข้อมูล
ดังนั้นฉันมีการทดลอง 16 ครั้งที่ฉันพยายามพิสูจน์ตัวตนบุคคลจากลักษณะทางชีวภาพโดยใช้ Hamming Distance เกณฑ์ของฉันถูกตั้งไว้ที่ 3.5 ข้อมูลของฉันอยู่ด้านล่างและเฉพาะการทดลองใช้ 1 เท่านั้นคือ True Positive: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 จุดสับสนของฉันคือฉันไม่แน่ใจจริงๆเกี่ยวกับวิธีสร้าง ROC curve …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

1
เกิดข้อผิดพลาดในการประเมินขนาดของชุดหรือไม่
สมมติว่าเรามีเซต A และเซตย่อย B หากเรารู้ว่า | A | ดังนั้นเราสามารถคำนวณ | B | โดยการค้นหาความน่าจะเป็นที่องค์ประกอบที่เลือกอย่างสุ่มจาก A นั้นเป็นของ B. เฉพาะ | A | p = | B | สมมติว่าเราสร้างองค์ประกอบ n ของ A โดยการสุ่มและใช้ข้อมูลนี้เพื่อประเมิน p (จำนวนขององค์ประกอบใน B หารด้วย n) และด้วยเหตุนี้การประมาณ | B | การประมาณนี้น่าเชื่อถือแค่ไหน คือเราจะคำนวณข้อผิดพลาดได้อย่างไร คำถามข้างเคียงมีชื่อสำหรับเทคนิคนี้หรือไม่? (ดูเหมือนว่าจะเป็นรุ่นทางคณิตศาสตร์ของเทคนิคการมาร์คและการรำลึกกลับคืน )

2
การคำนวณแบบไดนามิกของจำนวนตัวอย่างที่จำเป็นในการประมาณค่าเฉลี่ย
ฉันพยายามประเมินค่าเฉลี่ยของการกระจายแบบเกาส์มากขึ้นหรือน้อยลงผ่านการสุ่มตัวอย่าง ฉันไม่มีความรู้มาก่อนเกี่ยวกับค่าเฉลี่ยหรือความแปรปรวน แต่ละตัวอย่างมีราคาแพงที่จะได้รับ ฉันจะตัดสินใจได้อย่างไรว่าจะต้องสุ่มตัวอย่างจำนวนเท่าไรเพื่อให้ได้ระดับความเชื่อมั่น / ความแม่นยำที่แน่นอน อีกวิธีหนึ่งฉันจะรู้ได้อย่างไรว่าฉันจะหยุดรับตัวอย่างเมื่อไหร่? คำตอบสำหรับคำถามเช่นนี้ทั้งหมดที่ฉันสามารถหาได้ดูเหมือนจะเข้าใจความรู้เกี่ยวกับความแปรปรวนบางอย่าง แต่ฉันต้องค้นพบสิ่งนั้นตลอดทาง คนอื่นมุ่งไปที่การลงคะแนนและมันไม่ชัดเจนสำหรับฉัน (เริ่มต้นว่าฉัน) วิธีการที่ generalizes - ค่าเฉลี่ยของฉันไม่ w / ใน [0,1] ฯลฯ ฉันคิดว่านี่อาจเป็นคำถามง่ายๆที่มีคำตอบที่รู้จักกันดี แต่ Google-fu ของฉันกำลังทำให้ฉันล้มเหลว แม้เพียงแค่บอกฉันว่าการค้นหาจะเป็นประโยชน์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.