คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต

2
การกระจายเบต้าเมื่อพลิกเหรียญ
หนังสือ Bayesian ของ Kruschke กล่าวว่าเกี่ยวกับการใช้การแจกแจงเบต้าสำหรับการพลิกเหรียญ ตัวอย่างเช่นหากเราไม่มีความรู้มาก่อนนอกจากความรู้ที่ว่าเหรียญมีด้านหัวและด้านท้ายนั่นเท่ากับการสังเกตก่อนหน้านี้หนึ่งหัวและหนึ่งหางซึ่งสอดคล้องกับ a = 1 และ b = 1 ทำไมไม่มีข้อมูลใดเท่ากับการได้เห็นหัวหนึ่งและหนึ่งหาง - 0 หัวและ 0 หางดูเหมือนเป็นธรรมชาติสำหรับฉัน

2
วิธีการแบบเบย์เรียงตามลำดับโดยเนื้อแท้หรือไม่?
นั่นคือการวิเคราะห์ตามลำดับ (คุณไม่ทราบล่วงหน้าว่าจะเก็บรวบรวมข้อมูลจำนวนเท่าใด) ด้วยวิธีการที่ต้องทำบ่อยๆต้องใช้ความระมัดระวังเป็นพิเศษ คุณไม่สามารถรวบรวมข้อมูลได้จนกว่าค่า p จะมีขนาดเล็กเพียงพอหรือช่วงความเชื่อมั่นนั้นสั้นพอ แต่เมื่อทำการวิเคราะห์แบบเบย์นี่เป็นข้อกังวลหรือไม่? เราสามารถทำสิ่งต่าง ๆ ได้อย่างอิสระเช่นรวบรวมข้อมูลจนกว่าช่วงเวลาที่เชื่อถือได้จะมีขนาดเล็กเพียงพอหรือไม่?

3
Jeffreys ก่อนหน้าสำหรับการแจกแจงแบบปกติพร้อมค่าเฉลี่ยและความแปรปรวนที่ไม่รู้จัก
ฉันอ่านค่าการกระจายก่อนหน้านี้และฉันคำนวณ Jeffreys ก่อนหน้านี้สำหรับตัวอย่างของตัวแปรสุ่มแบบกระจายที่มีค่าเฉลี่ยไม่ทราบและความแปรปรวนที่ไม่รู้จัก จากการคำนวณของฉันรายการต่อไปนี้ของ Jeffreys ก่อนหน้านี้: ที่นี่เป็นเมทริกซ์ข้อมูลของฟิชเชอร์ ผมp ( μ , σ2) = de t ( ฉัน)-----√= de t ( 1 / σ2001 / ( 2 σ4))------------------√= 12 σ6----√∝ 1σ3.พี(μ,σ2)=dอีเสื้อ(ผม)=dอีเสื้อ(1/σ2001/(2σ4))=12σ6α1σ3. p(\mu,\sigma^2)=\sqrt{det(I)}=\sqrt{det\begin{pmatrix}1/\sigma^2 & 0 \\ 0 & 1/(2\sigma^4)\end{pmatrix}}=\sqrt{\frac{1}{2\sigma^6}}\propto\frac{1}{\sigma^3}.ผมผมI อย่างไรก็ตามฉันได้อ่านสิ่งพิมพ์และเอกสารที่ระบุด้วย p ( μ , σ2) ∝ 1 / σ2พี(μ,σ2)α1/σ2p(\mu,\sigma^2)\propto 1/\sigma^2ดูหัวข้อ 2.2 ในKass …

3
คำจำกัดความของนักบวชคอนจูเกตกึ่งคอนจูเกตและมีเงื่อนไขคืออะไร?
คำจำกัดความของนักบวชกึ่งคอนจูเกตและนักคอนจูเกตแบบมีเงื่อนไขคืออะไร ฉันพบพวกมันในการวิเคราะห์ข้อมูลแบบเบย์ของเจลแมนแต่ไม่พบคำจำกัดความของพวกเขา
12 bayesian 

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

2
ทำไมโทมัสเบย์ถึงพบว่าทฤษฎีบทของเบย์ท้าทายมาก?
นี่คือประวัติศาสตร์ของคำถามวิทยาศาสตร์มากกว่านี้ แต่ฉันหวังว่ามันจะอยู่ในหัวข้อที่นี่ ฉันได้อ่านว่าโทมัสเบย์สามารถค้นพบทฤษฎีบทของเบย์สำหรับกรณีพิเศษของชุดยูนิฟอร์มมาก่อนเท่านั้นและถึงอย่างนั้นเขาก็ต้องดิ้นรนกับมัน เมื่อพิจารณาว่าทฤษฎีบทของนายพลเบย์นั้นสำคัญเพียงใดในการรักษาที่ทันสมัยทำไมมันถึงท้าทายสำหรับเบย์และนักคณิตศาสตร์คนอื่น ๆ ในเวลานั้น? สำหรับการเปรียบเทียบPhilosophiæ Naturalis Principia Principia Mathematica ของ Isaac Newton ได้รับการตีพิมพ์ 36 ปีก่อนงานหลักของ Bayes ซึ่งตีพิมพ์ในเชิงต้อ

4
การเปรียบเทียบการประมาณความเป็นไปได้สูงสุด (MLE) และทฤษฎีบทของเบย์
ในทฤษฎีบทแบบเบย์และจากหนังสือที่ฉันอ่านเรียกว่าความน่าจะเป็นแต่ฉันคิดว่ามันเป็นเพียงความน่าจะเป็นตามเงื่อนไขของให้จริงไหม?p ( y| x)= p ( x | y) p ( y)p ( x )p(y|x)=p(x|y)p(y)p(x)p(y|x) = \frac{p(x|y)p(y)}{p(x)}p ( x | y)p(x|y)p(x|y)xxxYyy การประมาณความน่าจะเป็นสูงสุดพยายามที่จะเพิ่มใช่ไหม? ถ้าเป็นเช่นนั้นฉันสับสนไม่ดีเพราะเป็นทั้งตัวแปรสุ่มใช่ไหม เพื่อเพิ่มให้ได้มากที่สุดคือ ? ปัญหาอีกข้อหนึ่งถ้าตัวแปรสุ่ม 2 ตัวนี้เป็นอิสระแล้วเป็นเพียงแค่ใช่ไหม? จากนั้นการเพิ่มคือการเพิ่ม(x)p ( x | y)p(x|y)p(x|y)x , yx,yx,yp ( x | y)p(x|y)p(x|y) Y^y^\hat yp ( x | y)p(x|y)p(x|y)p ( x )p(x)p(x)p ( x …

1
การจัดการแบบจำลองการถดถอยโลจิสติก
ฉันต้องการเข้าใจว่าโค้ดต่อไปนี้กำลังทำอะไร คนที่เขียนรหัสไม่สามารถใช้งานได้ที่นี่อีกต่อไปและเกือบจะไม่มีเอกสารทั้งหมด ฉันถูกขอให้ตรวจสอบโดยคนที่คิดว่า " เป็นแบบจำลองการถดถอยโลจิสติกแบบเบย์ " bglm <- function(Y,X) { # Y is a vector of binary responses # X is a design matrix fit <- glm.fit(X,Y, family = binomial(link = logit)) beta <- coef(fit) fs <- summary.glm(fit) M <- t(chol(fs$cov.unscaled)) betastar <- beta + M %*% rnorm(ncol(M)) p <- …

1
การสร้างแบบจำลองแบบเบส์ของเวลารอรถไฟ: การกำหนดโมเดล
นี่เป็นความพยายามครั้งแรกของฉันสำหรับใครบางคนที่มาจากค่ายบ่อย ๆ เพื่อทำการวิเคราะห์ข้อมูลแบบเบย์ ฉันอ่านบทช่วยสอนจำนวนหนึ่งและบทไม่กี่บทจากการวิเคราะห์ข้อมูลแบบเบย์โดย A. Gelman เนื่องจากตัวอย่างการวิเคราะห์ข้อมูลอิสระมากขึ้นหรือน้อยลงอย่างแรกที่ฉันเลือกคือเวลาในการรอรถไฟ ฉันถามตัวเองว่าอะไรคือการกระจายเวลารอคอย ชุดข้อมูลนั้นมีอยู่ในบล็อกและได้รับการวิเคราะห์แตกต่างกันเล็กน้อยและนอก PyMC เป้าหมายของฉันคือการประเมินเวลารอรถไฟที่คาดว่าจะได้รับจากข้อมูล 19 รายการ โมเดลที่ฉันสร้างขึ้นมีดังต่อไปนี้: μ∼N(μ^,σ^)μ∼N(μ^,σ^)\mu \sim N(\hat\mu,\hat\sigma) σ∼|N(0,σ^)|σ∼|N(0,σ^)|\sigma \sim |N(0,\hat\sigma)| λ∼Γ(μ,σ)λ∼Γ(μ,σ)\lambda \sim \Gamma(\mu,\sigma) ρ∼Poisson(λ)ρ∼Poisson(λ)\rho \sim Poisson(\lambda) โดยที่คือค่าเฉลี่ยของข้อมูลและคือส่วนเบี่ยงเบนมาตรฐานของข้อมูลคูณด้วย 1,000μ^μ^\hat\muσ^σ^\hat\sigma ฉันจำลองเวลารอคอยที่คาดว่าจะเป็นโดยใช้การแจกแจงปัวซอง พารามิเตอร์ rate สำหรับการแจกแจงนี้ถูกสร้างแบบจำลองโดยใช้การแจกแจงแกมม่าเนื่องจากเป็นการเชื่อมต่อแบบคอนจูเกตกับการแจกแจงแบบปัวซอง ไฮเปอร์ - ไพรเออร์และถูกสร้างแบบจำลองด้วยการแจกแจงแบบปกติและแบบครึ่งปกติ ค่าเบี่ยงเบนมาตรฐานถูกทำให้กว้างที่สุดเท่าที่จะเป็นได้ρρ\rhoμμ\muσσ\sigmaσσ\sigma ฉันมีคำถามมากมาย แบบจำลองนี้มีความเหมาะสมสำหรับงานหรือไม่ ฉันทำผิดพลาดเริ่มต้นหรือไม่? แบบจำลองสามารถทำให้ง่ายขึ้นได้หรือไม่ (ฉันมักจะทำให้สิ่งต่าง ๆ ง่ายขึ้น)? ฉันจะตรวจสอบได้อย่างไรว่าพารามิเตอร์ด้านหลัง ( ) เหมาะกับข้อมูลจริงหรือไม่?ρρ\rho ฉันจะดึงตัวอย่างจากการกระจาย Poisson ที่ติดตั้งเพื่อดูตัวอย่างได้อย่างไร …
12 bayesian  pymc 

2
ตัวอย่างง่ายๆที่แสดงให้เห็นถึงข้อดีของรูปแบบเฉลี่ยของ Bayesian (BMA)
ฉันกำลังผสมผสานวิธีการแบบเบอเซียนโมเดลเฉลี่ย (BMA) ในการวิจัยของฉันและอีกไม่นานจะมีการนำเสนอเกี่ยวกับงานของฉันกับเพื่อนร่วมงานของฉัน อย่างไรก็ตาม BMA ไม่ได้เป็นที่รู้จักกันดีในสาขาของฉันดังนั้นหลังจากนำเสนอพวกเขาด้วยทฤษฎีทั้งหมดและก่อนที่จะนำไปใช้กับปัญหาของฉันจริง ๆ ฉันต้องการนำเสนอตัวอย่างที่เรียบง่ายและให้คำแนะนำเกี่ยวกับสาเหตุที่ BMA ทำงาน ฉันกำลังคิดเกี่ยวกับตัวอย่างง่าย ๆ ที่มีสองแบบให้เลือก แต่แบบจำลองการสร้างข้อมูลที่แท้จริง (DGM) นั้นอยู่ที่ไหนสักแห่งในระหว่างนั้นและหลักฐานไม่ได้ให้ประโยชน์อย่างใดอย่างหนึ่งกับพวกเขา ดังนั้นหากคุณเลือกหนึ่งและดำเนินการต่อจากพวกเขาคุณจะไม่สนใจความไม่แน่นอนของแบบจำลองและทำผิดพลาด แต่ BMA ถึงแม้ว่าตัวแบบที่แท้จริงไม่ได้เป็นส่วนหนึ่งของชุดแบบจำลองอย่างน้อยก็ให้ความหนาแน่นหลังพารามิเตอร์ที่น่าสนใจ ตัวอย่างเช่นมีการพยากรณ์อากาศสองครั้งในแต่ละวัน (A และ B) และต้องการพยากรณ์อากาศที่ดีที่สุดดังนั้นในสถิติแบบดั้งเดิมคุณจะต้องพยายามค้นหาพยากรณ์ที่ดีที่สุดระหว่างสองคนนี้ แต่จะเป็นอย่างไรหากความจริงอยู่ที่ไหนสักแห่งระหว่าง (นั่นคือบางครั้ง A ถูกต้องบางครั้ง B) แต่ฉันทำมันไม่เป็นทางการ บางอย่างเช่นนั้น แต่ฉันเปิดกว้างต่อความคิด ฉันหวังว่าคำถามนี้เฉพาะเจาะจงมาก! ในวรรณคดีฉันไม่พบตัวอย่างที่ดีจากสิ่งที่ฉันได้อ่าน: Kruschke (2011)ในขณะที่การแนะนำที่ดีเกี่ยวกับสถิติ Bayesian ไม่ได้มุ่งเน้นไปที่ BMA อย่างแท้จริงและตัวอย่างการโยนเหรียญที่เขามีในบทที่ 4 นั้นยอดเยี่ยมสำหรับการแนะนำสถิติ Bayesian แต่ไม่ได้โน้มน้าวให้นักวิจัยคนอื่นใช้ BMA ("ทำไมฉันถึงมีสามรุ่นอีกครั้งหนึ่งพูดว่าเหรียญยุติธรรมและสองคนบอกว่ามันลำเอียงในทิศทางใดทิศทางหนึ่ง?") สิ่งอื่น ๆ ทั้งหมดที่ฉันอ่าน …

2
พารามิเตอร์โอกาสสูงสุดเบี่ยงเบนจากการแจกแจงหลัง
ฉันมีฟังก์ชั่นความน่าจะเป็นL (d| θ)L(d|θ)\mathcal{L}(d | \theta)สำหรับความน่าจะเป็นของข้อมูลของฉันdddรับพารามิเตอร์บางรุ่นθ∈RNθ∈RN\theta \in \mathbf{R}^Nซึ่งผมอยากจะประมาณการ สมมติว่ามีค่าคงที่ของพารามิเตอร์ระดับความน่าจะเป็นเป็นสัดส่วนกับความน่าจะเป็นหลัง ฉันใช้วิธี MCMC เพื่อสุ่มตัวอย่างความน่าจะเป็นนี้ เมื่อดูที่ลูกโซ่ที่เกิดขึ้นฉันพบว่าพารามิเตอร์ความน่าจะเป็นสูงสุดนั้นไม่สอดคล้องกับการแจกแจงแบบหลัง ตัวอย่างเช่นการกระจายความน่าจะเป็นด้านหลังของชายขอบสำหรับหนึ่งในพารามิเตอร์อาจเป็นθ0∼N(μ=0,σ2=1)θ0∼N(μ=0,σ2=1)\theta_0 \sim N(\mu=0, \sigma^2=1)ในขณะที่ค่าของθ0θ0\theta_0ที่จุดน่าจะเป็นสูงสุดคือθML0≈4θ0ML≈4\theta_0^{ML} \approx 4โดยพื้นฐานแล้ว เกือบจะเป็นค่าสูงสุดของθ0θ0\theta_0ผ่านการสุ่มตัวอย่างโดย MCMC นี่เป็นตัวอย่างที่แสดงไม่ใช่ผลลัพธ์ที่แท้จริงของฉัน การแจกแจงจริงนั้นซับซ้อนกว่า แต่พารามิเตอร์ ML บางตัวมีค่า p ที่ไม่น่าเหมือนกันในการแจกแจงหลัง ทราบว่าบางส่วนของพารามิเตอร์ของฉันจะกระโดด (เช่น0≤θ1≤10≤θ1≤10 \leq \theta_1 \leq 1 ); ภายในขอบเขตนักบวชจะเหมือนกันเสมอ คำถามของฉันคือ: การเบี่ยงเบนนั้นเป็นปัญหาต่อหรือเปล่า เห็นได้ชัดว่าฉันไม่ได้คาดหวังว่าพารามิเตอร์ ML จะเหมือนกันซึ่งสูงสุดของการกระจายหลังส่วนล่างของพวกเขาแต่ละคน แต่สังหรณ์ใจมันรู้สึกว่าพวกเขาไม่ควรพบลึกลงไปในหาง การเบี่ยงเบนนี้ทำให้ผลลัพธ์ของฉันเป็นโมฆะโดยอัตโนมัติหรือไม่ ไม่ว่าจะเป็นปัญหาหรือไม่มันเป็นอาการของโรคที่เฉพาะเจาะจงในบางช่วงของการวิเคราะห์ข้อมูลหรือไม่? ตัวอย่างเช่นเป็นไปได้หรือไม่ที่จะสร้างคำแถลงทั่วไปเกี่ยวกับว่าการเบี่ยงเบนดังกล่าวอาจเกิดจากการรวมกันของโซ่ที่ไม่ถูกต้องแบบจำลองที่ไม่ถูกต้องหรือขอบเขตที่แน่นเกินไปของพารามิเตอร์

3
เหตุใดการตัดค่าใช้สำหรับปัจจัยเบย์และค่า p จึงแตกต่างกันมาก
ฉันพยายามที่จะเข้าใจ Bayes Factor (BF) ฉันเชื่อว่าพวกเขาเป็นเหมือนอัตราส่วนความน่าจะเป็นของ 2 สมมติฐาน ดังนั้นถ้า BF เท่ากับ 5 หมายความว่า H1 มีโอกาสสูงกว่า H0 5 เท่า และค่า 3-10 หมายถึงหลักฐานระดับปานกลางขณะที่> 10 หมายถึงหลักฐานที่ชัดเจน อย่างไรก็ตามสำหรับค่า P จะใช้ค่า 0.05 เป็นแบบตัด ที่ค่า P นี้อัตราส่วนความน่าจะเป็นของ H1 / H0 ควรอยู่ที่ประมาณ 95/5 หรือ 19 เหตุใดจึงต้องตัดค่าตัด> 3 สำหรับ BF ขณะที่ตัดค่า> 19 เพื่อใช้ค่า P ค่าเหล่านี้ไม่ได้อยู่ใกล้กัน

2
Bayesians ตรวจสอบวิธีการของพวกเขาโดยใช้วิธีการจำลองมอนติคาร์โลได้อย่างไร
ความเป็นมา : ฉันมีปริญญาเอกในด้านจิตวิทยาสังคมซึ่งสถิติและคณิตศาสตร์ในเชิงทฤษฎีแทบจะไม่ครอบคลุมในหลักสูตรเชิงปริมาณของฉัน ผ่านการเรียนในระดับปริญญาตรีและระดับบัณฑิตศึกษาฉันได้รับการสอน (เช่นเดียวกับพวกคุณหลายคนในสังคมศาสตร์ด้วย) ผ่านโครงร่างของนักประพันธ์เพลง "คลาสสิค" ตอนนี้ฉันยังรัก R และใช้วิธีการจำลองเพื่อตรวจสอบว่าวิธีการทำงานเป็นวิธีความรู้สึกของฉันมากกว่าการพิสูจน์ทางคณิตศาสตร์ (อีกครั้ง: ภูมิหลังในเชิงสังคมศาสตร์เชิงปริมาณไม่ใช่สถิติเชิงทฤษฎี) วิธีการของผู้ใช้บ่อยและวิธีการจำลองด้วยกันทำให้ฉันมีเหตุผล เพราะผู้ที่พบเห็นความน่าจะเป็นเป็นอัตราเดิมพันระยะยาว (เช่นถ้าฉันทำสิ่งนี้เป็นจำนวนมากตามอำเภอใจและมันเกิดขึ้น 50% ของเวลาก็มีความน่าจะเป็น 50%) เราสามารถจำลองระยะยาวนี้ได้ด้วยวิธีการมอนติคาร์โล! ภาวะแทรกซ้อน : ตั้งแต่ปริญญาตรีผมได้รับมากตระหนักถึงวิธีการแบบเบย์และมีได้เสมอคนในชีวิตของฉันเรียกฉันไปทางด้านเบส์บอกว่าผลที่ได้ก็ง่ายต่อการตีความที่เราได้รับความน่าจะเป็นสำหรับสมมติฐานแทนของข้อมูล ให้สมมติฐานและอื่น ๆ ฉันเป็นแบบนี้จริง ๆ แล้วเอาชั้นเรียนแบบเบย์อ่านหนังสือและเอกสารแบบเบย์บางอันและตอนนี้ฉันก็ค่อนข้างคุ้นเคยกับสแตนและแพ็คเกจ R ที่เกี่ยวข้อง ใส่มายอ : หลังจากความคิด "แบบเบย์อาจจะเป็นวิธีของอนาคต" ในขณะที่ผมอ่านเดโบราห์เมโยสถิติอนุมานเป็นรุนแรงทดสอบ เธอบอกว่าเธอไม่ได้เลือกข้างในตอนเริ่มต้นของหนังสือ แต่เธอก็รู้ว่า: เธอเป็นคนที่เรียนบ่อยและหนังสือจำนวนมากกำลังปกป้องวิธีการที่ใช้บ่อย ฉันไม่ต้องการพูดคุยเกี่ยวกับว่าเราคิดว่าวิธีที่เธอเห็นหลักฐานนั้นถูกต้องหรือไม่ แต่สิ่งนี้ทำให้ฉันคิดว่า: Bayes เป็นสิ่งที่โฆษณาจริงๆหรือไม่? ฉันหมายความว่าฝูงชนเบย์แตกหักตัวเองจนฉันไม่รู้วิธีที่ถูกต้องในการวิเคราะห์ข้อมูลในกรอบเบย์บ่อยครั้ง ปกติฉันจะใช้rstanarmและการประมาณจุดปัจจุบันและช่วงเวลาที่น่าเชื่อถือ ... ซึ่งมักจะเข้าแถวอย่างใกล้ชิดกับการประมาณการบ่อยครั้งและช่วงความเชื่อมั่น ฉันอาจทำการเปรียบเทียบโมเดล แต่ฉันมักจะกลัวที่จะอธิบายปัจจัย Bayes เป็นการเปรียบเทียบความน่าจะเป็นหลังและอื่น ๆ …

3
คำศัพท์สำหรับ Bayesian posterior ค่าเฉลี่ยความน่าจะเป็นที่มีค่ามาก่อน
ถ้า Uniformและบินแล้วค่าเฉลี่ยหลังของจะได้รับจาก2}p∼p∼p \sim(0,1)(0,1)(0,1)X∼X∼X \sim(n,p)(n,p)(n, p)pppX+1n+2X+1n+2\frac{X+1}{n+2} มีชื่อสามัญสำหรับตัวประมาณค่านี้หรือไม่? ฉันพบว่ามันแก้ปัญหาของคนจำนวนมากและฉันต้องการที่จะชี้ให้ผู้คนอ้างอิง แต่ไม่สามารถหาชื่อที่ถูกต้องได้ ฉันจำได้ว่าสิ่งนี้เรียกว่า "+ 1 / + 2 ตัวประมาณ" อย่างคลุมเครือในสถิติ 101 หนังสือ แต่นั่นไม่ใช่คำที่ค้นหาได้มาก

5
ช่วงความมั่นใจมีประโยชน์หรือไม่?
ในสถิติที่ใช้บ่อยช่วงความมั่นใจ 95% เป็นขั้นตอนการสร้างช่วงเวลาซึ่งหากทำซ้ำจำนวนครั้งไม่สิ้นสุดจะมีพารามิเตอร์ที่แท้จริง 95% ของเวลา ทำไมถึงมีประโยชน์ ช่วงความเชื่อมั่นมักเข้าใจผิด พวกเขาไม่ใช่ช่วงเวลาที่เราสามารถมั่นใจได้ 95% ว่าพารามิเตอร์นั้นอยู่ใน (ยกเว้นว่าคุณกำลังใช้ช่วงความน่าเชื่อถือแบบเบย์ที่คล้ายกัน) ช่วงเวลาความมั่นใจรู้สึกเหมือนเป็นเหยื่อและสลับมาที่ฉัน กรณีการใช้งานอย่างหนึ่งที่ฉันคิดได้ก็คือกำหนดช่วงของค่าที่เราไม่สามารถปฏิเสธสมมติฐานว่างได้ว่าพารามิเตอร์คือค่านั้น ค่า p จะไม่ให้ข้อมูลนี้ แต่จะดีกว่าไหม โดยไม่ทำให้เข้าใจผิด? ในระยะสั้น: ทำไมเราต้องมีช่วงความมั่นใจ? เมื่อตีความอย่างถูกต้องมีประโยชน์อย่างไร?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.