คำถามติดแท็ก inference

สรุปผลเกี่ยวกับพารามิเตอร์ประชากรจากข้อมูลตัวอย่าง ดู https://en.wikipedia.org/wiki/Inference และ https://en.wikipedia.org/wiki/Statistical_inference

3
คุณจะทำ Bayesian ANOVA และการถดถอยใน R อย่างไร [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน2 ปีที่ผ่านมา ฉันมีชุดข้อมูลที่ค่อนข้างง่ายซึ่งประกอบด้วยตัวแปรอิสระหนึ่งตัวหนึ่งตัวแปรขึ้นอยู่กับหนึ่งตัวและตัวแปรเด็ดขาด ผมมีประสบการณ์มากมายการทดสอบการทำงาน frequentist ชอบaov()และlm()แต่ฉันไม่สามารถหาวิธีการดำเนินการเทียบเท่าแบบเบย์ในอาร์ ฉันต้องการเรียกใช้การถดถอยเชิงเส้นแบบเบย์ในสองตัวแปรแรกและการวิเคราะห์ความแปรปรวนแบบเบย์โดยใช้ตัวแปรหมวดหมู่เป็นการจัดกลุ่ม แต่ฉันไม่สามารถหาตัวอย่างง่ายๆเกี่ยวกับวิธีการทำเช่นนี้กับอาร์ ทั้งสอง? นอกจากนี้สถิติผลลัพธ์ที่สร้างขึ้นโดยการวิเคราะห์แบบเบย์คืออะไรและพวกเขาแสดงอะไร? ฉันไม่ได้มีความเชี่ยวชาญในสถิติมากนัก แต่ฉันทามติดูเหมือนว่าการใช้การทดสอบขั้นพื้นฐานที่มีค่า p นั้นตอนนี้คิดว่าค่อนข้างผิดและฉันพยายามติดตาม ความนับถือ.

2
ชุดซอฟต์แวร์ที่เหมาะสมที่สุดสำหรับการวิเคราะห์แบบเบย์
ฉันสงสัยว่าพวกคุณแนะนำแพคเกจทางสถิติสำหรับการดำเนินการอนุมานแบบเบย์ ตัวอย่างเช่นฉันรู้ว่าคุณสามารถเรียกใช้ openBUGS หรือ winBUGS เป็น standalones หรือคุณสามารถเรียกพวกเขาจาก R แต่ R ยังมีแพ็คเกจของตัวเองหลายตัว (MCMCPack, BACCO) ซึ่งสามารถทำการวิเคราะห์แบบเบส์ ไม่มีใครมีคำแนะนำใด ๆ ที่เป็นแพคเกจสถิติเบย์ใน R ที่ดีที่สุดหรือเกี่ยวกับทางเลือกอื่น ๆ (Matlab หรือ Mathematica?) คุณสมบัติหลักที่ฉันต้องการเปรียบเทียบคือประสิทธิภาพการใช้งานง่ายความเสถียรและความยืดหยุ่น

3
บทสรุปที่ดี (ความคิดเห็นหนังสือ) เกี่ยวกับการใช้งานที่หลากหลายของห่วงโซ่มาร์คอฟมอนติคาร์โล (MCMC)?
มีบทสรุปที่ดี (บทวิจารณ์หนังสือ) ในแอปพลิเคชั่นต่างๆของ Markov chain Monte Carlo (MCMC) หรือไม่? ฉันเคยเห็นมาร์คอฟเชนมอนติคาร์โลในทางปฏิบัติแต่หนังสือเล่มนี้ดูเก่าไปหน่อย มีหนังสืออัปเดตเพิ่มเติมเกี่ยวกับแอปพลิเคชันต่างๆของ MCMC ในด้านต่าง ๆ เช่นการเรียนรู้ด้วยคอมพิวเตอร์, การมองเห็นคอมพิวเตอร์และชีววิทยาการคำนวณหรือไม่?

6
การประมาณค่า MLE เทียบกับ MAP จะใช้เมื่อใด
MLE = การประมาณความน่าจะเป็นสูงสุด MAP = หลังที่ใหญ่ที่สุด MLE ใช้งานง่าย / ไร้เดียงสาโดยเริ่มจากความน่าจะเป็นของการสังเกตที่กำหนดพารามิเตอร์ (เช่นฟังก์ชันความน่าจะเป็น)และพยายามค้นหาพารามิเตอร์ที่สอดคล้องกับการสังเกตการณ์ที่สุด แต่มันไม่ได้คำนึงถึงความรู้เดิม MAP ดูเหมือนจะสมเหตุสมผลมากกว่าเนื่องจากคำนึงถึงความรู้เดิมผ่านกฎของเบย์ นี่คือคำถามที่เกี่ยวข้อง แต่คำตอบนั้นไม่ละเอียด /signals/13174/differences-using-maximum-likelihood-or-maximum-a-posteriori-for-deconvolution-d ดังนั้นฉันคิดว่า MAP ดีกว่ามาก นั่นถูกต้องใช่ไหม? และฉันควรใช้อันไหนดี?

2
ปัญหาความสามารถในการประมาณค่าพารามิเตอร์
ให้และเป็นตัวแปรสุ่มสี่ตัวซึ่งโดยที่เป็นพารามิเตอร์ที่ไม่รู้จัก นอกจากนี้สมมติว่า ,แล้วอันไหนที่เป็นจริงY1, วาย2, วาย3Y1,Y2,Y3Y_1,Y_2,Y_3Y4Y4Y_4E( Y1) = θ1- θ3; E ( Y2) = θ1+ θ2- θ3; E ( Y3) = θ1- θ3; E ( Y4) = θ1- θ2- θ3E(Y1)=θ1−θ3; E(Y2)=θ1+θ2−θ3; E(Y3)=θ1−θ3; E(Y4)=θ1−θ2−θ3E(Y_1)=\theta_1-\theta_3;\space\space E(Y_2)=\theta_1+\theta_2-\theta_3;\space\space E(Y_3)=\theta_1-\theta_3;\space\space E(Y_4)=\theta_1-\theta_2-\theta_3θ1, θ2, θ3θ1,θ2,θ3\theta_1,\theta_2,\theta_3VR ( Yผม) = σ2Var(Yi)=σ2Var(Y_i)=\sigma^2i = 1 , 2 , 3 , 4i=1,2,3,4.i=1,2,3,4. A.สามารถประมาณได้θ1, …

1
การอนุมานตามเงื่อนไขบ่อยครั้งยังคงถูกใช้ในทางปฏิบัติหรือไม่?
ฉันเพิ่งตรวจสอบเอกสารเก่าบางฉบับโดย Nancy Reid, Barndorff-Nielsen, Richard Cox และใช่ Ronald Fisher เล็กน้อยเกี่ยวกับแนวคิดของ "การอนุมานตามเงื่อนไข" ในกระบวนทัศน์ประจำซึ่งดูเหมือนจะหมายถึงการอนุมานอิงเพียง "เซตย่อยที่เกี่ยวข้อง" ของพื้นที่ตัวอย่างไม่ใช่พื้นที่ตัวอย่างทั้งหมด เป็นตัวอย่างที่สำคัญเป็นที่ทราบกันดีว่าช่วงความเชื่อมั่นที่อิงตามสถิติ t สามารถปรับปรุงได้(Goutis & Casella, 1992)หากคุณยังพิจารณาค่าสัมประสิทธิ์การเปลี่ยนแปลงของตัวอย่างด้วย (เรียกว่าสถิติเสริม) ในฐานะที่เป็นคนที่ใช้ความน่าจะเป็นไปตามการอนุมานเป็นประจำฉันคิดว่าเมื่อฉันสร้างช่วงเวลาที่ไม่มั่นใจ % - ความมั่นใจฉันกำลังทำการอนุมานตามเงื่อนไข (โดยประมาณ) เนื่องจากความน่าจะเป็นเป็นเงื่อนไขในตัวอย่างที่สังเกตαα\alpha คำถามของฉันคือนอกเหนือจากการถดถอยโลจิสติกตามเงื่อนไขแล้วฉันไม่เคยเห็นการใช้ความคิดเกี่ยวกับการปรับแต่งสถิติเพิ่มเติมก่อนที่จะอนุมาน การอนุมานแบบนี้ จำกัด อยู่กับตระกูลชี้แจงหรือไม่หรือจะใช้ชื่ออื่นในทุกวันนี้เพื่อให้ดูเหมือนจะถูก จำกัด ฉันพบบทความล่าสุด(Spanos, 2011)ที่ดูเหมือนว่าจะสงสัยอย่างจริงจังเกี่ยวกับวิธีการที่ใช้โดยการอนุมานตามเงื่อนไข (เช่นบรรพบุรุษ) แต่มันเสนอข้อเสนอแนะที่สมเหตุสมผลและมีความซับซ้อนทางคณิตศาสตร์น้อยกว่าที่การอนุมานพารามิเตอร์ในกรณี "ผิดปกติ" (ซึ่งการสนับสนุนของการแจกแจงถูกกำหนดโดยพารามิเตอร์) สามารถแก้ไขได้โดยการตัดทอนการแจกแจงการสุ่มตัวอย่างแบบไม่มีเงื่อนไข Fraser (2004)ให้การปกป้องที่ดีของเงื่อนไข แต่ฉันยังคงทิ้งความรู้สึกว่ามีมากกว่าโชคเล็กน้อยและความฉลาดจะต้องใช้การอนุมานตามเงื่อนไขกับกรณีที่ซับซ้อน ... แน่นอนซับซ้อนกว่าการเรียกไคสแควร์ การประมาณค่าอัตราส่วนความน่าจะเป็นสำหรับการอนุมานตามเงื่อนไข "โดยประมาณ" เวลส์ (2011, p. 163)อาจตอบคำถามของฉัน …

3
ทำไมการติดตาม
ในโมเดลY= Xβ+ ϵy=Xβ+ϵ{y} = X \beta + \epsilonเราสามารถประมาณββ\betaโดยใช้สมการปกติ: β^= ( X'X)- 1X'Y,β^=(X′X)−1X′y,\hat{\beta} = (X'X)^{-1}X'y,และเราจะได้รับ Y =XβY^= Xβ^.y^=Xβ^.\hat{y} = X \hat{\beta}. เวกเตอร์ของส่วนที่เหลือประมาณโดย ε^= y- Xβ^= ( I- X( X'X)- 1X') y= Q y= Q ( Xβ+ ϵ ) = Q ϵ ,ϵ^=y−Xβ^=(I−X(X′X)−1X′)y=Qy=Q(Xβ+ϵ)=Qϵ,\hat{\epsilon} = y - X \hat{\beta} = (I - X …

1
การอนุมานไม่ถูกต้องเมื่อการสังเกตไม่เป็นอิสระ
ฉันเรียนรู้ในสถิติเบื้องต้นว่าด้วยโมเดลเชิงเส้นทั่วไปเพื่อให้การอนุมานมีเหตุผลการสังเกตต้องเป็นอิสระ เมื่อการรวมกลุ่มเกิดขึ้นความเป็นอิสระอาจไม่ได้นำไปสู่การอนุมานที่ไม่ถูกต้องอีกต่อไปหากไม่นับรวม วิธีหนึ่งในการทำบัญชีสำหรับการทำคลัสเตอร์ดังกล่าวคือการใช้ตัวแบบผสม ฉันต้องการค้นหาชุดข้อมูลตัวอย่างจำลองหรือไม่ซึ่งแสดงให้เห็นอย่างชัดเจน ฉันพยายามใช้หนึ่งในชุดข้อมูลตัวอย่างบนไซต์ UCLA สำหรับการวิเคราะห์ข้อมูลคลัสเตอร์ > require(foreign) > require(lme4) > dt <- read.dta("http://www.ats.ucla.edu/stat/stata/seminars/svy_stata_intro/srs.dta") > m1 <- lm(api00~growth+emer+yr_rnd, data=dt) > summary(m1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 740.3981 11.5522 64.092 <2e-16 *** growth -0.1027 0.2112 -0.486 0.6271 emer -5.4449 0.5395 -10.092 <2e-16 *** yr_rnd -51.0757 19.9136 -2.565 …

2
ตัวอย่างของตัวประมาณค่าความน่าจะเป็นสูงสุดที่ไม่สอดคล้องกัน
ฉันกำลังอ่านความคิดเห็นต่อกระดาษและผู้เขียนกล่าวว่าบางครั้งถึงแม้ว่าตัวประมาณ (พบโดย ML หรือ quasilikelihood สูงสุด) อาจไม่สอดคล้องกันพลังของอัตราส่วนความน่าจะเป็นหรือการทดสอบอัตราส่วนกึ่งโอกาส 1 เมื่อจำนวนข้อมูลที่สังเกตมีแนวโน้มที่จะไม่มีที่สิ้นสุด (ความสอดคล้องของการทดสอบ) สิ่งนี้เกิดขึ้นได้อย่างไรและเมื่อไหร่? คุณรู้จักบรรณานุกรมบ้างไหม?

2
“ การอนุมาน” รวมถึงการประมาณค่าหรือการทดสอบเท่านั้นหรือไม่?
คำว่า "อนุมานเชิงสถิติ" มีเพียงการทดสอบสมมติฐานหรือรวมถึงการประมาณจุดการประมาณช่วงเวลาเป็นต้น การอ้างอิงที่เชื่อถือได้จะได้รับการชื่นชมอย่างมาก

1
อัตราส่วนความน่าจะเป็นและการเปรียบเทียบตัวแบบเบย์ให้ทางเลือกที่ดีกว่าและเพียงพอสำหรับการทดสอบสมมติฐานว่างหรือไม่?
ในการตอบสนองต่อร่างกายที่เพิ่มขึ้นของนักสถิติและนักวิจัยที่วิพากษ์วิจารณ์ยูทิลิตี้ของการทดสอบสมมติฐานว่าง (NHT) สำหรับวิทยาศาสตร์เป็นความพยายามสะสมสมาคมจิตวิทยาอเมริกันกองเรือรบในการอนุมานทางสถิติหลีกเลี่ยงการห้ามทันที NHT แต่แทนที่จะแนะนำว่านักวิจัย รายงานขนาดเอฟเฟกต์เพิ่มเติมจากค่า p ที่ได้จาก NHT อย่างไรก็ตามขนาดของเอฟเฟกต์นั้นไม่สามารถสะสมได้ง่ายในการศึกษา วิธีการวิเคราะห์ Meta สามารถสะสมการกระจายขนาดผล แต่โดยทั่วไปขนาดคำนวณเป็นอัตราส่วนระหว่างขนาดผลดิบและ "เสียง" ไม่ได้อธิบายในข้อมูลของการทดลองที่กำหนดหมายความว่าการกระจายขนาดของผลกระทบไม่เพียง ความแปรปรวนในขนาดที่แท้จริงของผลกระทบในการศึกษา แต่ยังมีความแปรปรวนในการแสดงของเสียงในการศึกษา ในทางตรงกันข้ามการวัดทางเลือกของความแข็งแรงของเอฟเฟกต์อัตราส่วนความน่าจะเป็นช่วยให้ตีความได้ง่ายทั้งบนพื้นฐานการศึกษาโดยการศึกษาและสามารถรวบรวมได้ง่ายในการศึกษาเพื่อการวิเคราะห์อภิมาน ในแต่ละการศึกษาโอกาสที่จะแสดงน้ำหนักของหลักฐานสำหรับแบบจำลองที่มีผลกระทบที่กำหนดเมื่อเทียบกับแบบจำลองที่ไม่ได้มีผลกระทบและโดยทั่วไปสามารถรายงานเป็นตัวอย่างเช่น "การคำนวณอัตราส่วนความน่าจะเป็นสำหรับผลของ X เผยหลักฐานเพิ่มเติมอีก 8 เท่าสำหรับเอฟเฟกต์มากกว่าโมฆะที่เกี่ยวข้อง " ยิ่งไปกว่านั้นอัตราส่วนความน่าจะเป็นยังอนุญาตให้แสดงถึงความแข็งแกร่งของการค้นพบโมฆะได้อย่างง่าย ๆ ในขณะที่อัตราส่วนความน่าจะเป็นต่ำกว่า 1 แสดงสถานการณ์ที่โมฆะได้รับการสนับสนุนและรับส่วนกลับของค่านี้แทนน้ำหนักของหลักฐาน โดยเฉพาะอย่างยิ่ง อัตราส่วนความน่าจะเป็นทางคณิตศาสตร์เป็นอัตราส่วนของความแปรปรวนที่ไม่ได้อธิบายของทั้งสองรุ่นซึ่งแตกต่างกันเฉพาะในความแปรปรวนที่อธิบายโดยผลกระทบและจึงไม่ได้เป็นแนวคิดขนาดใหญ่ออกจากขนาดผล ในอีกทางหนึ่งการคำนวณอัตราส่วนความน่าจะเป็น meta-analytic ซึ่งแสดงถึงน้ำหนักของหลักฐานสำหรับผลในการศึกษาเป็นเพียงเรื่องของการใช้ผลิตภัณฑ์ของอัตราส่วนความน่าจะเป็นในการศึกษา ดังนั้นฉันยืนยันว่าสำหรับวิทยาศาสตร์ที่กำลังมองหาเพื่อสร้างระดับของหลักฐานขั้นต้นในความโปรดปรานของผลกระทบ / แบบจำลองอัตราส่วนความน่าจะเป็นเป็นวิธีที่จะไป มีกรณีที่เหมาะสมยิ่งขึ้นซึ่งโมเดลสามารถสร้างความแตกต่างได้เฉพาะในขนาดเฉพาะของเอฟเฟกต์ซึ่งในกรณีนี้การแสดงช่วงเวลาที่เราเชื่อว่าข้อมูลสอดคล้องกับค่าพารามิเตอร์เอฟเฟกต์อาจต้องการ อันที่จริงคณะทำงาน APA ยังแนะนำให้มีการรายงานช่วงเวลาความเชื่อมั่นซึ่งสามารถนำมาใช้ในการนี้ แต่ฉันสงสัยว่านี่เป็นวิธีการที่ไม่ดี ช่วงความเชื่อมั่นมักตีความผิดอย่างน่าเศร้า ( โดยนักเรียนและนักวิจัยเหมือนกัน ) ฉันยังกลัวว่าความสามารถของพวกเขาสำหรับใช้ใน NHT …

2
แหล่งข้อมูลออนไลน์สำหรับการเรียนรู้สถิติแบบฝึกหัด (พร้อมโซลูชัน)
ปัจจุบันฉันทำงานเป็นผู้ช่วยสอนในมหาวิทยาลัยของฉันในหลักสูตรสถิติเบื้องต้น (สำหรับนักศึกษาแพทย์) ออฟไลน์มีหนังสือมากมายพร้อมข้อมูลเพื่อช่วยเหลือครู อย่างไรก็ตามสิ่งที่ฉันสนใจที่จะรู้คือถ้าคุณอาจนำฉันไปยังแหล่งข้อมูล (ดี) ใด ๆที่ให้แบบฝึกหัด (พร้อมคำตอบ) ในสถิติซึ่งมีให้ทางออนไลน์ (เช่น: บันทึกของครู) เนื้อหาวิชาอาจอยู่ในช่วงระหว่างสถิติเชิงพรรณนาความน่าจะเป็นและการอนุมานเชิงสถิติเชิงพารามิเตอร์ / ไม่ใช่เชิงพารามิเตอร์

2
วิธีการกำหนดเขตการปฏิเสธเมื่อไม่มี UMP
พิจารณาโมเดลการถดถอยเชิงเส้น ,y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} ,u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) 0E( u ∣ X ) = 0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} ขอ VS H 1 : σ 2 0 ≠ σ 2H0: σ20= σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1: σ20≠ σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 เราสามารถอนุมานได้ว่าที่วันที่ฉันm(X)=n×k และเอ็มเอ็กซ์เป็นสัญกรณ์ปกติสำหรับเมทริกซ์สังหาร,MXY= Yที่ YคือตัวแปรYถดถอยบนXYTMXYσ2∼ χ2( n - k )yTMXyσ2∼χ2(n−k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dฉันm ( X ) = n × kdim(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy = y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}Y^y^ \hat{\mathbf{y}}Yy\mathbf{y}XX\mathbf{X} หนังสือที่ฉันอ่านระบุดังต่อไปนี้: …

2
สูตรสำหรับช่วงความมั่นใจ 95% สำหรับ
ฉันค้นหาและค้นหาบน stats.stackexchange แต่ไม่พบสูตรการคำนวณช่วงความมั่นใจ 95% สำหรับค่าสำหรับการถดถอยเชิงเส้น ทุกคนสามารถให้ได้หรือไม่R2R2R^2 ยิ่งไปกว่านั้นสมมติว่าฉันใช้การถดถอยเชิงเส้นด้านล่างในอาร์ฉันจะคำนวณช่วงความมั่นใจ 95% สำหรับค่าโดยใช้รหัส R ได้อย่างไรR2R2R^2 lm_mtcars <- lm(mpg ~ wt, mtcars)

1
การอนุมานเครือข่ายแบบเบย์โดยใช้ pymc (ความสับสนของผู้เริ่มต้น)
ฉันกำลังเรียนหลักสูตร PGM โดย Daphne Koller บน Coursera โดยทั่วไปเราจะสร้างแบบจำลองเครือข่ายแบบเบย์เป็นเหตุและผลของกราฟกำกับของตัวแปรซึ่งเป็นส่วนหนึ่งของข้อมูลที่สังเกตได้ แต่ในบทเรียนและตัวอย่างของ PyMC ฉันเห็นว่ามันไม่ได้เป็นแบบอย่างในแบบเดียวกับ PGM หรือ atleast ที่ฉันสับสน ใน PyMC ผู้ปกครองของตัวแปรโลกแห่งความเป็นจริงใด ๆ ที่สังเกตได้มักจะเป็นพารามิเตอร์ของการแจกแจงที่คุณใช้ในการสร้างแบบจำลองตัวแปร ตอนนี้คำถามของฉันเป็นคำถามที่ใช้งานได้จริง สมมติว่าฉันมี 3 ตัวแปรซึ่งข้อมูลถูกสังเกต (A, B, C) (สมมติว่าพวกมันเป็นตัวแปรต่อเนื่องทั้งหมดเพียงเพื่อประโยชน์ของมัน) จากความรู้ด้านโดเมนเราสามารถพูดได้ว่า A และ B เป็นสาเหตุของ C ดังนั้นเราจึงมี BN ที่นี่ - A, B เป็นผู้ปกครองและ C คือเด็ก ๆ ตอนนี้จากสมการ BN P (A, B, C) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.