คำถามติดแท็ก confidence-interval

ช่วงความมั่นใจคือช่วงเวลาที่ครอบคลุมพารามิเตอร์ที่ไม่รู้จักด้วยความมั่นใจ ช่วงความเชื่อมั่นเป็นแนวคิดที่ใช้บ่อย พวกเขามักจะสับสนกับช่วงเวลาที่น่าเชื่อถือซึ่งเป็นแบบอะนาล็อกเบย์ (1α)%

1
การสร้างช่วงความมั่นใจโดยพิจารณาจากความน่าจะเป็นของโปรไฟล์
ในหลักสูตรสถิติเบื้องต้นของฉันฉันได้เรียนรู้วิธีสร้างช่วงความมั่นใจ 95% เช่นค่าเฉลี่ยประชากรโดยยึดตามมาตรฐานเชิงเส้นกำกับสำหรับขนาดตัวอย่าง "ใหญ่" นอกเหนือจากresampling วิธี (เช่นบูต) มีวิธีการอื่นที่อยู่บนพื้นฐานของ"ความน่าจะเป็นรายละเอียด" มีคนอธิบายแนวทางนี้ได้ไหมμμ\mu ภายใต้สถานการณ์ใด CI 95% ที่สร้างขึ้นตามเกณฑ์เชิงเส้นกำกับและความน่าจะเป็นของโปรไฟล์นั้นเทียบเคียงได้อย่างไร ฉันไม่พบการอ้างอิงใด ๆ ในหัวข้อนี้การอ้างอิงที่แนะนำใด ๆ ทำไมมันไม่ใช้กันอย่างแพร่หลายมากขึ้น?

2
พื้นที่ความหนาแน่นสูงสุด (HDR) คืออะไร
ในการอนุมานเชิงสถิติปัญหา 9.6b กล่าวถึง "ภูมิภาคที่มีความหนาแน่นสูงสุด (HDR)" อย่างไรก็ตามฉันไม่พบคำจำกัดความของคำนี้ในหนังสือ หนึ่งคำที่คล้ายกันคือความหนาแน่นหลังสูงสุด (HPD) แต่มันไม่เหมาะสมในบริบทนี้เนื่องจาก 9.6b ไม่ได้พูดถึงเรื่องก่อนหน้า และในการแก้ปัญหาที่แนะนำมันบอกว่า "เห็นได้ชัดว่าc(y)c(y)c(y)คือ HDR" หรือ HDR เป็นภูมิภาคที่มีโหมดไฟล์ PDF อยู่หรือไม่? พื้นที่ความหนาแน่นสูงสุด (HDR) คืออะไร

4
สิ่งที่จะพูดกับลูกค้าที่คิดว่าช่วงความมั่นใจกว้างเกินไปที่จะมีประโยชน์หรือไม่
สมมติว่าฉันเป็นที่ปรึกษาและฉันต้องการอธิบายให้ลูกค้าฟังถึงประโยชน์ของช่วงความมั่นใจ ลูกค้าบอกกับฉันว่าช่วงเวลาของฉันกว้างเกินไปที่จะเป็นประโยชน์และเขาต้องการที่จะใช้ครึ่งกว้าง ฉันจะตอบอย่างไร

9
วิธีการตรวจสอบความเชื่อมั่นของการทำนายเครือข่ายประสาท?
เพื่อแสดงคำถามของฉันสมมติว่าฉันมีชุดฝึกอบรมที่อินพุตมีระดับเสียงรบกวน แต่เอาต์พุตไม่ได้ตัวอย่างเช่น; # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] เอาท์พุทที่นี่คือการไล่ระดับสีของอาเรย์ใส่ถ้ามันไม่มีเสียง (ไม่ไล่โทนสีที่เกิดขึ้นจริง) หลังจากฝึกอบรมเครือข่ายผลลัพธ์ควรมีลักษณะเช่นนี้สำหรับอินพุตที่กำหนด # Expected Output [1.01, 1.96, 2.00, 3.06] : 95% confidence interval of [0.97, 1.03] [2.03, 4.11, 3.89, 3.51] …

2
ความครอบคลุมช่วงความเชื่อมั่น 'กับการประมาณการปกติ
สมมติว่าฉันพยายามประเมินพารามิเตอร์จำนวนมากจากข้อมูลมิติสูงโดยใช้การประมาณปกติบางประเภท Regularizer แนะนำการตั้งค่าบางอย่างในการประมาณค่า แต่มันก็ยังคงเป็นเรื่องที่ดีเนื่องจากการลดความแปรปรวนควรจะชดเชยให้มากกว่า ปัญหาเกิดขึ้นเมื่อฉันต้องการประเมินช่วงความมั่นใจ (เช่นใช้ Laplace Approve หรือ bootstrapping) โดยเฉพาะอคติในการประมาณการของฉันนำไปสู่การรายงานข่าวที่ไม่ดีในช่วงความเชื่อมั่นของฉันซึ่งทำให้ยากที่จะกำหนดคุณสมบัติของผู้ประเมินของฉัน ฉันพบเอกสารบางส่วนที่พูดถึงปัญหานี้ (เช่น"ช่วงความเชื่อมั่นแบบ Asymptotic ในการถดถอยของสันเขาตามการขยายตัวของ Edgeworth" ) แต่คณิตศาสตร์ส่วนใหญ่อยู่เหนือหัวฉัน ในบทความที่เชื่อมโยงสมการ 92-93 ดูเหมือนจะให้ปัจจัยการแก้ไขสำหรับการประมาณที่ถูกทำให้เป็นมาตรฐานโดยการถดถอยของสันเขา แต่ฉันสงสัยว่ามีกระบวนการที่ดีที่จะทำงานกับช่วงของกฎเกณฑ์ต่าง ๆ ได้หรือไม่ แม้แต่การแก้ไขใบสั่งซื้อครั้งแรกก็มีประโยชน์อย่างยิ่ง

7
จะตีความช่วงความเชื่อมั่นของความแตกต่างในค่าเฉลี่ยในการทดสอบ T-test หนึ่งตัวอย่างได้อย่างไร?
SPSS ให้เอาต์พุต "ช่วงความมั่นใจของความแตกต่าง" ฉันได้อ่านในบางแห่งว่ามันหมายถึง "95 ครั้งจาก 100 ตัวอย่างเฉลี่ยของเราจะแตกต่างกันระหว่างขอบเขตเหล่านี้" ฉันพบว่าไม่ชัดเจน ใครสามารถแนะนำถ้อยคำที่ชัดเจนขึ้นเพื่ออธิบาย "ช่วงความเชื่อมั่นของความแตกต่างในค่าเฉลี่ย" เอาต์พุตนี้ปรากฏขึ้นในบริบทของการทดสอบ t-test หนึ่งตัวอย่าง

4
ฉันจะคำนวณช่วงความมั่นใจสำหรับการแจกแจงแบบไม่ปกติได้อย่างไร
ฉันมีตัวอย่าง 383 รายการที่มีอคติอย่างหนักสำหรับค่าทั่วไปบางอย่างฉันจะคำนวณ 95% CI สำหรับค่าเฉลี่ยได้อย่างไร CI ที่ฉันคำนวณดูเหมือนจะหายไปซึ่งฉันถือว่าเป็นเพราะข้อมูลของฉันดูไม่เหมือนเส้นโค้งเมื่อฉันสร้างฮิสโตแกรม ดังนั้นฉันคิดว่าฉันต้องใช้บางอย่างเช่น bootstrapping ซึ่งฉันไม่ค่อยเข้าใจ

4
วิธีการฉายเวกเตอร์ใหม่บนพื้นที่ PCA?
หลังจากทำการวิเคราะห์องค์ประกอบหลัก (PCA) ฉันต้องการฉายเวกเตอร์ใหม่ลงบนพื้นที่ PCA (เช่นค้นหาพิกัดในระบบพิกัด PCA) ผมได้คำนวณ PCA ในภาษา R prcompโดยใช้ ตอนนี้ฉันควรคูณเวกเตอร์ของฉันด้วยเมทริกซ์การหมุน PCA ควรจัดองค์ประกอบหลักในเมทริกซ์นี้เป็นแถวหรือคอลัมน์?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
ช่วงความเชื่อมั่นของ RMSE
ฉันได้รับตัวอย่างของจุดข้อมูลจากประชากร แต่ละจุดเหล่านี้มีค่าจริง (รู้จักจากความจริงพื้นดิน) และค่าประมาณ ฉันคำนวณข้อผิดพลาดสำหรับแต่ละจุดที่สุ่มตัวอย่างแล้วคำนวณ RMSE ของตัวอย่างnnn จากนั้นฉันจะอนุมานช่วงความเชื่อมั่นบางประเภทรอบ RMSE นี้ตามขนาดตัวอย่างอย่างไรnnn ถ้าฉันใช้ค่าเฉลี่ยมากกว่า RMSE ฉันก็จะไม่มีปัญหาในการทำเช่นนี้เพราะฉันสามารถใช้สมการมาตรฐาน m=Zσn√m=Zσn m = \frac{Z \sigma}{\sqrt{n}} แต่ฉันไม่รู้ว่าสิ่งนี้ใช้ได้สำหรับ RMSE มากกว่าค่าเฉลี่ยหรือไม่ มีวิธีใดบ้างที่ฉันสามารถปรับเปลี่ยนสิ่งนี้ได้ (ฉันได้เห็นคำถามนี้แต่ฉันไม่ได้มีปัญหาว่าประชากรของฉันมีการกระจายตามปกติหรือไม่ซึ่งเป็นคำตอบที่เกี่ยวข้องกับ)

1
การคำนวณช่วงการทำนายสำหรับการถดถอยโลจิสติก
ฉันต้องการที่จะเข้าใจวิธีการสร้างช่วงเวลาการทำนายสำหรับการประมาณการการถดถอยโลจิสติก ฉันได้รับคำแนะนำให้ทำตามขั้นตอนในการสร้างแบบจำลองข้อมูลไบนารีของ Collett , 2nd Ed p.98-99 หลังจากนำขั้นตอนนี้มาใช้และเปรียบเทียบกับ R ของpredict.glmจริง ๆ แล้วฉันคิดว่าหนังสือเล่มนี้แสดงขั้นตอนการคำนวณช่วงความเชื่อมั่นไม่ใช่ช่วงเวลาทำนาย การปฏิบัติตามขั้นตอนจาก Collett โดยเปรียบเทียบกับpredict.glmแสดงไว้ด้านล่าง ฉันต้องการทราบว่า: ฉันจะไปจากที่นี่เพื่อสร้างช่วงการทำนายแทนช่วงความมั่นใจได้อย่างไร #Derived from Collett 'Modelling Binary Data' 2nd Edition p.98-99 #Need reproducible "random" numbers. seed <- 67 num.students <- 1000 which.student <- 1 #Generate data frame with made-up data from students: set.seed(seed) #reset seed …

1
ช่วงความเชื่อมั่นรอบอัตราส่วนของสองสัดส่วน
ฉันมีสองสัดส่วน (เช่นอัตราการคลิกผ่าน (CTR) บนลิงก์ในรูปแบบการควบคุมและ CTR บนลิงก์ในรูปแบบการทดลอง) และฉันต้องการคำนวณช่วงความมั่นใจ 95% รอบอัตราส่วนของสัดส่วนเหล่านี้ ฉันจะทำสิ่งนี้ได้อย่างไร ฉันรู้ว่าฉันสามารถใช้วิธีเดลต้าเพื่อคำนวณความแปรปรวนของอัตราส่วนนี้ได้ แต่ฉันไม่แน่ใจว่าต้องทำอะไรนอกจากนั้น ฉันควรใช้อะไรเป็นจุดกึ่งกลางของช่วงความมั่นใจ (อัตราส่วนที่สังเกตได้ของฉันหรืออัตราส่วนที่คาดหวังซึ่งแตกต่างกัน) และควรเบี่ยงเบนมาตรฐานรอบอัตราส่วนนี้เท่าไหร่ ฉันควรใช้ความแปรปรวนของวิธีเดลต้าเลยหรือไม่ (ฉันไม่สนใจความแปรปรวนจริงๆเพียงแค่ช่วงความมั่นใจ) ฉันควรใช้ทฤษฎีบทของ Fiellerโดยใช้กรณีที่ 1 (เนื่องจากฉันทำสัดส่วนฉันคิดว่าฉันตอบสนองความต้องการกระจายทั่วไป) ฉันควรคำนวณตัวอย่าง bootstrap หรือไม่

3
วิธีการรวมช่วงความมั่นใจสำหรับองค์ประกอบความแปรปรวนของแบบผสมผลกระทบเมื่อใช้การใส่หลายครั้ง
ตรรกะของการใส่หลายครั้ง (MI) คือการกำหนดค่าที่หายไปไม่ใช่ครั้งเดียว แต่หลายครั้ง (โดยทั่วไปคือ M = 5) ส่งผลให้ชุดข้อมูล M สมบูรณ์ ชุดข้อมูลที่เสร็จสมบูรณ์แล้ว M จะถูกวิเคราะห์ด้วยวิธีการข้อมูลที่สมบูรณ์ซึ่งการประเมิน M และข้อผิดพลาดมาตรฐานถูกรวมเข้าด้วยกันโดยใช้สูตรรูบินเพื่อรับการประเมินโดยรวมและข้อผิดพลาดมาตรฐาน เยี่ยมมาก แต่ฉันไม่แน่ใจว่าจะใช้สูตรนี้อย่างไรเมื่อส่วนประกอบต่าง ๆ ของแบบผสมเอฟเฟกต์เกี่ยวข้องกัน การกระจายตัวตัวอย่างขององค์ประกอบความแปรปรวนเป็นแบบอสมมาตรดังนั้นจึงไม่สามารถกำหนดช่วงความเชื่อมั่นที่สอดคล้องกันในรูปแบบ "การประมาณ± 1.96 * se (ประมาณ)" โดยทั่วไป ด้วยเหตุนี้แพ็คเกจ R lme4 และ nlme จึงไม่ได้จัดเตรียมข้อผิดพลาดมาตรฐานของส่วนประกอบความแปรปรวน แต่ให้ช่วงความมั่นใจเท่านั้น ดังนั้นเราสามารถดำเนินการ MI บนชุดข้อมูลจากนั้นรับช่วงความเชื่อมั่น M ต่อองค์ประกอบความแปรปรวนหลังจากปรับโมเดลเอฟเฟกต์แบบเดียวกันบนชุดข้อมูลที่เสร็จสมบูรณ์แล้ว M คำถามคือทำอย่างไรจึงจะรวมช่วง M เหล่านี้เข้ากับช่วงความมั่นใจโดยรวม ฉันเดาว่าน่าจะเป็นไปได้ - ผู้เขียนบทความ (yucel & demirtas (2010) …

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
วางแผนช่วงความมั่นใจสำหรับความน่าจะเป็นที่คาดการณ์ไว้จากการถดถอยโลจิสติก
ตกลงฉันมีการถดถอยโลจิสติกและใช้predict()ฟังก์ชั่นในการพัฒนาเส้นโค้งความน่าจะเป็นตามการประมาณการของฉัน ## LOGIT MODEL: library(car) mod1 = glm(factor(won) ~ as.numeric(bid), data=mydat, family=binomial(link="logit")) ## PROBABILITY CURVE: all.x <- expand.grid(won=unique(won), bid=unique(bid)) y.hat.new <- predict(mod1, newdata=all.x, type="response") plot(bid<-000:1000,predict(mod1,newdata=data.frame(bid<-c(000:1000)),type="response"), lwd=5, col="blue", type="l") นี่เป็นสิ่งที่ดี แต่ฉันอยากรู้อยากเห็นเกี่ยวกับการวางแผนช่วงความมั่นใจสำหรับความน่าจะเป็น ฉันพยายามแล้วplot.ci()แต่ก็ไม่มีโชค ทุกคนสามารถชี้ให้ฉันเห็นวิธีการที่จะทำสิ่งนี้โดยเฉพาะอย่างยิ่งกับcarแพคเกจหรือฐานอาร์

2
การคำนวณข้อผิดพลาดมาตรฐานหลังจากการแปลงบันทึก
พิจารณาชุดของตัวเลขสุ่มที่กระจายตามปกติ: x <- rnorm(n=1000, mean=10) เราต้องการทราบค่าเฉลี่ยและข้อผิดพลาดมาตรฐานในค่าเฉลี่ยดังนั้นเราจึงทำสิ่งต่อไปนี้: se <- function(x) { sd(x)/sqrt(length(x)) } mean(x) # something near 10.0 units se(x) # something near 0.03 units ที่ดี! อย่างไรก็ตามสมมติว่าเราไม่จำเป็นต้องรู้ว่าการแจกแจงเริ่มต้นของเราเป็นไปตามการแจกแจงแบบปกติ เราบันทึกการแปลงข้อมูลและทำการคำนวณข้อผิดพลาดมาตรฐานเดียวกัน z <- log(x, base=10) mean(z) # something near 1 log units se(z) # something near 0.001 log units เยี่ยมยอด แต่ตอนนี้เราจำเป็นต้องแปลงกลับเพื่อให้ได้คำตอบในหน่วยที่ไม่ใช่หน่วยบันทึก 10^mean(z) # something …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.