คำถามติดแท็ก prior

ในสถิติแบบเบย์การกระจายก่อนหน้านี้ทำให้ข้อมูลหรือความรู้เป็นระเบียบ (มักเป็นแบบอัตนัย) ซึ่งมีอยู่ก่อนตัวอย่างจะเห็นในรูปแบบของการแจกแจงความน่าจะเป็น การกระจายที่มีการแพร่กระจายขนาดใหญ่จะถูกใช้เมื่อมีความรู้เพียงเล็กน้อยเกี่ยวกับพารามิเตอร์ในขณะที่การกระจายก่อนหน้าแคบลงแสดงถึงระดับของข้อมูลที่มากขึ้น

3
ช่วยฉันเข้าใจการแจกแจงแบบเบย์ก่อนและหลัง
ในกลุ่มนักเรียนมี 2 จาก 18 คนที่ถนัดซ้าย ค้นหาการกระจายด้านหลังของนักเรียนที่ถนัดซ้ายในประชากรที่คาดไม่ถึงมาก่อน สรุปผลลัพธ์ ตามวรรณกรรม 5-20% ของคนถนัดซ้าย นำข้อมูลนี้ไปพิจารณาก่อนและคำนวณหลังใหม่ ฉันรู้ว่าควรใช้การกระจายเบต้าที่นี่ ก่อนอื่นด้วยค่าและเป็น 1? สมการที่ฉันพบในวัสดุสำหรับด้านหลังคือαα\alphaββ\beta π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)π(r|Y)∝r(Y+−1)×(1−r)(N−Y+−1)\pi(r \vert Y ) \propto r^{(Y +−1)} \times (1 − r)^{(N−Y +−1)} \\ Y=2Y=2Y=2N = 18 ,N=18N=18N=18 ทำไมในสมการนั้น? (แสดงถึงสัดส่วนของคนซ้ายส่ง) ไม่เป็นที่รู้จักดังนั้นมันจะอยู่ในสมการนี้ได้อย่างไร? สำหรับผมแล้วมันดูเหมือนว่าไร้สาระในการคำนวณรับและใช้ในสมการให้Rดีกับตัวอย่างผลที่ได้0,0019ฉันควรจะได้ข้อสรุปจากที่?rrrrrrrrrYYYrrrrrrr=2/18r=2/18r=2/180,00190,00190,0019fff สมการที่ให้ค่าคาดหวังของทราบและทำงานได้ดีขึ้นและให้ซึ่งฟังต้อง สมการเป็นE (R | X, N, α, β) = (α + X) / (α …

4
อะไรคือ "uninformative ก่อน" คืออะไร? เราสามารถมีข้อมูลที่ไม่มีข้อมูลได้จริงหรือไม่?
แรงบันดาลใจจากความคิดเห็นจากคำถามนี้ : เราคิดว่า "uninformative" ในอดีตคืออะไร - และข้อมูลใดที่ยังคงมีอยู่ใน uninformative ที่คาดคะเนมาก่อน? ฉันมักจะเห็นก่อนหน้านี้ในการวิเคราะห์ที่เป็นทั้งการวิเคราะห์แบบบ่อยครั้งที่พยายามที่จะยืมบางส่วนที่ดีจากการวิเคราะห์แบบเบย์ (ไม่ว่าจะเป็นการตีความที่ง่ายขึ้นไปจนถึง กระจายสม่ำเสมอทั่วทั้งขอบเขตของการวัดผลที่มีศูนย์กลางอยู่ที่ 0 แต่แม้กระทั่งว่าอ้างรูปร่างก่อน - มันเพิ่งเกิดขึ้นเป็นแบน มีความรู้ที่ดีกว่าก่อนใช้งานหรือไม่?
73 bayesian  prior 

5
เหตุใด Jeffreys ก่อนหน้าจึงมีประโยชน์
ฉันเข้าใจว่า Jeffreys ก่อนหน้านั้นคงที่ภายใต้การปรับพารามิเตอร์อีกครั้ง อย่างไรก็ตามสิ่งที่ฉันไม่เข้าใจคือเหตุผลที่ต้องการคุณสมบัตินี้ ทำไมคุณไม่ต้องการการเปลี่ยนแปลงก่อนหน้านี้ภายใต้การเปลี่ยนแปลงของตัวแปร?
61 bayesian  prior 

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

7
ทำไมบางคนจะใช้วิธีการแบบเบย์กับวิธีการที่ 'ไม่เป็นทางการ' ก่อนหน้าแทนที่จะเป็นวิธีแบบดั้งเดิม?
หากความสนใจเป็นเพียงการประมาณค่าพารามิเตอร์ของแบบจำลอง (การประมาณค่าแบบจุดและ / หรือช่วงเวลา) และข้อมูลก่อนหน้านี้ไม่น่าเชื่อถืออ่อนแอ (ฉันรู้ว่านี่เป็นบิตที่คลุมเครือ แต่ฉันพยายามสร้างสถานการณ์ที่เลือก ก่อนหน้านี้เป็นเรื่องยาก) ... ทำไมบางคนเลือกที่จะใช้วิธีการแบบเบย์กับนักบวชที่ไม่เหมาะสมแทนที่จะเป็นแบบดั้งเดิม


6
หากช่วงเวลาที่เชื่อถือได้มีค่าคงที่ก่อนหน้านี้ช่วงความมั่นใจ 95% เท่ากับช่วงเวลาที่เชื่อถือได้ 95% หรือไม่
ฉันใหม่มากกับสถิติแบบเบย์และนี่อาจเป็นคำถามที่โง่ อย่างไรก็ตาม: พิจารณาช่วงเวลาที่น่าเชื่อถือด้วยค่าก่อนหน้าซึ่งระบุการแจกแจงแบบสม่ำเสมอ ตัวอย่างเช่นจาก 0 ถึง 1 โดยที่ 0 ถึง 1 แสดงถึงช่วงเต็มของค่าที่เป็นไปได้ของเอฟเฟกต์ ในกรณีนี้ช่วงเวลาที่เชื่อถือได้ 95% จะเท่ากับช่วงความมั่นใจ 95% หรือไม่

3
R: การสุ่มฟอเรสต์การโยน NaN / Inf ในข้อผิดพลาด“ การเรียกฟังก์ชันต่างประเทศ” แม้จะไม่มีชุดข้อมูลของ NaN [ปิด]
ฉันใช้คาเร็ตเพื่อรันฟอเรสต์แบบสุ่มที่ผ่านการตรวจสอบความถูกต้องข้ามชุดข้อมูล ตัวแปร Y เป็นปัจจัย ไม่มีชุดข้อมูลของ NaN, Inf's หรือ NA ในชุดข้อมูลของฉัน อย่างไรก็ตามเมื่อใช้ป่าสุ่มฉันได้รับ Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) In addition: There were 28 warnings (use warnings() to see them) Warning messages: 1: In data.matrix(x) : NAs introduced by coercion 2: In data.matrix(x) : NAs …

3
เหตุใดนักบวช Jeffreys จึงถูกมองว่าไม่เป็นประโยชน์?
พิจารณา Jeffreys ก่อนที่ที่ฉันเป็นข้อมูลฟิชเชอร์p(θ)∝|i(θ)|−−−−√p(θ)∝|i(θ)|p(\theta) \propto \sqrt{|i(\theta)|}iii ฉันเคยเห็นสิ่งนี้ก่อนหน้านี้ถูกกล่าวถึงว่าเป็นคนที่ไม่รู้เรื่องมาก่อน แต่ฉันไม่เคยเห็นข้อโต้แย้งว่าทำไมมันถึงไม่เป็นที่รู้จัก ท้ายที่สุดมันไม่ได้เป็นค่าคงที่มาก่อนดังนั้นจึงต้องมีข้อโต้แย้งอื่น ๆ ฉันเข้าใจว่ามันไม่ได้ขึ้นอยู่กับ reparametrization ซึ่งนำฉันไปสู่คำถามต่อไป มันเป็นปัจจัยที่กำหนดข้อมูลฟิชเชอร์ไม่ได้ขึ้นอยู่กับการซ่อมแซมใหม่? เพราะข้อมูลชาวประมงขึ้นอยู่กับการแก้ไขปัญหาอย่างมาก ขอบคุณ
27 bayesian  prior 

5
จะคลุมเครือก่อนหน้าเช่นเดียวกับที่ไม่ให้ข้อมูลก่อน
นี่เป็นคำถามเกี่ยวกับคำศัพท์ "คลุมเครือก่อนหน้า" เหมือนกันกับที่ไม่ให้ข้อมูลมาก่อนหรือว่ามีความแตกต่างระหว่างทั้งสองหรือไม่? ความประทับใจของฉันคือพวกเขาเหมือนกัน (จากการค้นหาคลุมเครือและไม่ให้ข้อมูลด้วยกัน) แต่ฉันไม่สามารถมั่นใจได้

2
เหตุใดบทลงโทษของ Lasso จึงเทียบเท่ากับเลขชี้กำลังสองเท่า (Laplace) ก่อนหน้า?
ฉันได้อ่านจำนวนการอ้างอิงว่า Lasso ประมาณค่าสำหรับพารามิเตอร์การถดถอยเวกเตอร์เทียบเท่ากับโหมดหลังของซึ่งการแจกแจงก่อนหน้าสำหรับแต่ละเป็นการกระจายแบบเลขชี้กำลังสองเท่า (เรียกอีกอย่างว่าการกระจาย Laplace)B B iBBBBBBBiBiB_i ฉันพยายามพิสูจน์เรื่องนี้แล้วจะมีใครช่วยอธิบายรายละเอียดได้บ้างไหม?

3
นักปราชญ์ชาวเบย์กลายเป็นคนไม่เกี่ยวข้องกับกลุ่มตัวอย่างขนาดใหญ่หรือไม่?
เมื่อดำเนินการอนุมานแบบเบย์เราดำเนินการโดยเพิ่มฟังก์ชั่นโอกาสของเราให้มากที่สุดเมื่อใช้ร่วมกับนักบวชที่เรามีเกี่ยวกับพารามิเตอร์ เนื่องจากความเป็นไปได้ในการบันทึกมีความสะดวกมากขึ้นเราจึงเพิ่มโดยใช้ MCMC หรือสร้างการกระจายหลัง ความน่าจะเป็นของจุดแต่ละจุดก่อนหน้าและจุดข้อมูลแต่ละจุด)Σ ln( ก่อนหน้า) + ∑ ln( โอกาส)ΣLN⁡(ก่อน)+ΣLN⁡(ความเป็นไปได้)\sum \ln (\text{prior}) + \sum \ln (\text{likelihood}) หากเรามีข้อมูลจำนวนมากความน่าจะเป็นที่จะครอบงำข้อมูลใด ๆ ที่มีให้ก่อนหน้านี้โดยคณิตศาสตร์อย่างง่าย ในที่สุดสิ่งนี้เป็นสิ่งที่ดีและจากการออกแบบ เรารู้ว่าคนหลังจะมาบรรจบกันเพื่อโอกาสที่จะมีข้อมูลมากขึ้นเพราะมันควรจะเป็น สำหรับปัญหาที่กำหนดโดยนักบวชคอนจูเกตสิ่งนี้สามารถพิสูจน์ได้อย่างแน่นอน มีวิธีในการตัดสินใจว่านักบวชไม่สำคัญสำหรับฟังก์ชั่นความน่าจะเป็นและขนาดตัวอย่างหรือไม่?
26 bayesian  prior 

1
คุณสมบัติของการกระจายครึ่ง Cauchy คืออะไร?
ขณะนี้ฉันกำลังทำงานกับปัญหาซึ่งฉันจำเป็นต้องพัฒนาอัลกอริทึมMarkov chain Monte Carlo (MCMC) สำหรับแบบจำลองพื้นที่ของรัฐ เพื่อให้สามารถแก้ปัญหาได้ฉันได้รับความน่าจะเป็น : p ( ) = 2I ( > 0) / (1+ ) เป็นค่าเบี่ยงเบนมาตรฐานของxττ\tauττ\tauττ\tauτ2τ2\tau^2ττ\tauxxx ตอนนี้ฉันรู้แล้วว่ามันคือการแจกแจงครึ่งโคชีเพราะฉันจำได้จากการดูตัวอย่างและเพราะฉันถูกบอกอย่างนั้น แต่ฉันไม่เข้าใจว่าทำไมมันถึงเป็นการกระจาย "Half-Cauchy" และคุณสมบัติที่มาพร้อมกับมัน ในแง่ของคุณสมบัติฉันไม่แน่ใจว่าสิ่งที่ฉันต้องการ ฉันค่อนข้างใหม่สำหรับทฤษฎีเศรษฐมิติประเภทนี้ ดังนั้นฉันจึงเข้าใจการกระจายตัวและวิธีที่เราใช้ในบริบทของแบบจำลองพื้นที่ของรัฐ ตัวแบบมีลักษณะดังนี้: Yเสื้อxt + 1at + 1p ( σ2)p ( τ)= xเสื้อ+ eเสื้อ= xเสื้อ+ at + 1∼ N ( 0 , τ2)∝ 1 / …

3
ประวัติความเป็นมาของทฤษฎีก่อนหน้านี้ที่ไม่เป็นทางการ
ฉันกำลังเขียนเรียงความเชิงทฤษฎีสั้น ๆ สำหรับหลักสูตรสถิติแบบเบย์ (ในสาขาเศรษฐศาสตร์) กับนักบวชที่ไม่รู้เรื่องและฉันพยายามเข้าใจซึ่งเป็นขั้นตอนในการพัฒนาทฤษฎีนี้ ในตอนนี้ไทม์ไลน์ของฉันมีสามขั้นตอนหลัก: หลักการความเฉยเมยของ Laplace (1812), นักบวชที่ไม่แปรเปลี่ยน (Jeffreys (1946)), อ้างอิงจากเบอร์นาร์โดก่อน (1979) จากการทบทวนวรรณกรรมของฉันฉันได้เข้าใจว่าหลักการไม่แยแส (Laplace) เป็นเครื่องมือแรกที่ใช้แทนการขาดข้อมูลก่อนหน้านี้ แต่ความไม่แน่นอนของความไม่แปรเปลี่ยนได้นำไปสู่การละทิ้งจนกระทั่งยุค 40 เมื่อ Jeffreys แนะนำวิธีการของเขา คุณสมบัติที่ต้องการของค่าคงที่ การเกิดขึ้นของความขัดแย้งของคนชายขอบเนื่องจากการใช้ความไม่ระมัดระวังอย่างไม่เหมาะสมก่อนหน้าในยุค 70 ผลักให้เบอร์นาร์โดอธิบายรายละเอียดของทฤษฎีก่อนหน้านี้อย่างละเอียดเพื่อจัดการกับปัญหานี้ การอ่านวรรณกรรมผู้แต่งทุกคนต่างอ้างถึงการมีส่วนร่วม: เอนโทรปีสูงสุดของเจย์เนส, กล่องและความเป็นไปได้ในการแปลข้อมูล, Zellner, ... ในความเห็นของคุณอะไรคือขั้นตอนสำคัญที่ฉันขาดหายไป แก้ไข : ฉันเพิ่มการอ้างอิง (หลัก) ของฉันหากมีคนต้องการ: 1) การเลือกก่อนโดยกฎอย่างเป็นทางการ, Kass, Wasserman 2) แคตตาล็อกของนักบวชที่ไม่มีข้อมูล Yang, Berger 3) การตีความแบบไม่เป็นทางการของ Bayesians Priors และปัญหาเกี่ยวกับการก่อสร้างและการใช้งาน

2
แม่น Bayesian ก่อน
ฉันต้องการถามคำถามที่ได้รับแรงบันดาลใจจากคำตอบที่ยอดเยี่ยมสำหรับคำถามเกี่ยวกับสัญชาตญาณการแจกแจงเบต้า ฉันต้องการได้รับความเข้าใจที่ดีขึ้นเกี่ยวกับการได้มาของการกระจายก่อนหน้านี้สำหรับค่าเฉลี่ยการตี ดูเหมือนว่าดาวิดกำลังสนับสนุนพารามิเตอร์จากค่าเฉลี่ยและช่วง ภายใต้สมมติฐานที่ว่าค่าเฉลี่ยคือและส่วนเบี่ยงเบนมาตรฐานคือ0.18คุณสามารถถอยออกαและβได้โดยการแก้สมการทั้งสองนี้: α0.270.270.270.180.180.18αα\alphaββ\betaαα+β=0.27α⋅β(α+β)2⋅(α+β+1)=0.182αα+β=0.27α⋅β(α+β)2⋅(α+β+1)=0.182\begin{equation} \frac{\alpha}{\alpha+\beta}=0.27 \\ \frac{\alpha\cdot\beta}{(\alpha+\beta)^2\cdot(\alpha+\beta+1)}=0.18^2 \end{equation}
23 bayesian  prior 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.