คำถามติดแท็ก bayesian

การอนุมานแบบเบย์เป็นวิธีการอนุมานเชิงสถิติที่อาศัยการรักษาพารามิเตอร์แบบจำลองเป็นตัวแปรสุ่มและการใช้ทฤษฎีบทของเบส์เพื่ออนุมานความน่าจะเป็นแบบอัตนัยเกี่ยวกับพารามิเตอร์หรือสมมติฐานตามเงื่อนไขบนชุดข้อมูลที่สังเกต

5
การยืมข้อมูลหมายความว่าอย่างไร
ฉันมักจะพูดคุยเกี่ยวกับการยืมข้อมูลหรือการแบ่งปันข้อมูลในแบบจำลองลำดับชั้นแบบเบย์ ฉันดูเหมือนจะไม่ได้รับคำตอบที่ตรงเกี่ยวกับความหมายของสิ่งนี้จริง ๆ และถ้ามันเป็นเอกลักษณ์ของแบบจำลองลำดับชั้นแบบเบย์ ฉันได้รับแนวคิด: บางระดับในลำดับชั้นของคุณใช้พารามิเตอร์ร่วมกัน ฉันไม่รู้ว่านี่แปลว่า "การยืมข้อมูล" อย่างไร "การขอยืมข้อมูล" / "การแบ่งปันข้อมูล" เป็นคำที่ผู้คนอยากจะทิ้ง มีตัวอย่างของ posteriors แบบปิดที่แสดงปรากฏการณ์การแชร์นี้หรือไม่ การวิเคราะห์แบบเบย์นี้มีลักษณะเฉพาะหรือไม่? โดยทั่วไปเมื่อฉันเห็นตัวอย่างของ "การยืมข้อมูล" พวกเขาเป็นเพียงโมเดลผสม บางทีฉันอาจเรียนรู้โมเดลนี้ในแบบที่ล้าสมัย แต่ฉันไม่เห็นการแบ่งปันใด ๆ ฉันไม่สนใจที่จะเริ่มต้นการอภิปรายเชิงปรัชญาเกี่ยวกับวิธีการ ฉันแค่อยากรู้เกี่ยวกับการใช้คำนี้

2
โอกาสที่เหมาะสมก่อนและยกกำลังที่เหมาะสมสามารถนำไปสู่การหลังที่ไม่เหมาะสม?
(คำถามนี้ได้รับแรงบันดาลใจจากความคิดเห็นนี้จากซีอาน ) เป็นที่ทราบกันดีว่าถ้าการกระจายก่อนเป็นที่เหมาะสมและความน่าจะเป็นเป็นอย่างดีที่กำหนดไว้แล้วกระจายหลังมีความเหมาะสมเกือบแน่นอนπ(θ)π(θ)\pi(\theta)L(θ|x)L(θ|x)L(\theta | x)π(θ|x)∝π(θ)L(θ|x)π(θ|x)∝π(θ)L(θ|x)\pi(\theta|x)\propto \pi(\theta) L(\theta|x) ในบางกรณีเราใช้ความน่าจะเป็นแบบอารมณ์หรือแบบ exponentiated แทนซึ่งนำไปสู่การหลอกหลัง π~(θ|x)∝π(θ)L(θ|x)απ~(θ|x)∝π(θ)L(θ|x)α\tilde\pi(\theta|x)\propto \pi(\theta) L(\theta|x)^\alpha สำหรับ (ตัวอย่างเช่นนี้อาจมีข้อได้เปรียบในการคำนวณ)α>0α>0\alpha>0 ในการตั้งค่านี้เป็นไปได้หรือไม่ที่จะมีมาก่อน แต่มีหลอกหลอกที่ไม่เหมาะสม?

2
ตัวประมาณเบย์นั้นมีภูมิคุ้มกันต่อการเลือกอคติ
ตัวประมาณของ Bayes มีภูมิคุ้มกันต่อการเลือกอคติหรือไม่? เอกสารส่วนใหญ่ที่กล่าวถึงการประมาณค่าในมิติที่สูงเช่นข้อมูลลำดับจีโนมทั้งหมดมักจะทำให้เกิดปัญหาอคติในการคัดเลือก ความลำเอียงที่เลือกเกิดขึ้นจากข้อเท็จจริงที่ว่าแม้ว่าเรามีผู้ทำนายที่มีศักยภาพหลายพันคนเท่านั้นที่จะได้รับการคัดเลือกเพียงไม่กี่คนเท่านั้น ดังนั้นกระบวนการจึงมีสองขั้นตอน: (1) เลือกชุดย่อยของตัวทำนาย (2) ทำการอนุมานบนชุดที่เลือกเช่นประมาณอัตราต่อรอง Dawid ในกระดาษที่ขัดกันในปี 1994 ของเขามุ่งเน้นไปที่ตัวประมาณค่าที่เป็นกลางและตัวประมาณ Bayes เขาลดความยุ่งยากของปัญหาในการเลือกเอฟเฟกต์ที่ใหญ่ที่สุดซึ่งอาจเป็นผลการรักษา จากนั้นเขาก็บอกว่าตัวประมาณที่ไม่เอนเอียงได้รับผลกระทบจากอคติการคัดเลือก เขาใช้ตัวอย่าง: สมมติว่า จากนั้นแต่ละอันZi∼N(δi,1),i=1,…,NZi∼N(δi,1),i=1,…,N Z_i\sim N(\delta_i,1),\quad i=1,\ldots,N ZiZiZ_iเป็นกลางสำหรับ\ปล่อย , ตัวประมาณ อย่างไรก็ตามเอนเอียง ( บวก) สำหรับ\ สูงสุด \ {\ delta_1 \ delta_2 \ ldots \ delta_N \} ข้อความนี้สามารถพิสูจน์ได้อย่างง่ายดายด้วยความไม่เท่าเทียมของ Jensen ดังนั้นหากเรารู้ว่าi _ {\ max}ดัชนีของ\ delta_i ที่ใหญ่ที่สุดเราจะใช้Z_ {i …

1
ขัดขวางแบบเบย์และแผ่นเปรียบเทียบกับวิธีการลงโทษ
ฉันกำลังอ่านสไลด์ของ Steven Scott เกี่ยวกับแพ็คเกจ BSTS R (คุณสามารถค้นหาได้ที่นี่: สไลด์ ) เมื่อถึงจุดหนึ่งเมื่อพูดถึงการรวมถึง regressors จำนวนมากในโมเดลอนุกรมเวลาเชิงโครงสร้างเขาได้แนะนำค่าสัมประสิทธิ์การถดถอยและสแลบพื้นและบอกว่าพวกเขาดีกว่าเมื่อเทียบกับวิธีการลงโทษ Scott กล่าวซึ่งอ้างถึงตัวอย่างของชุดข้อมูลที่มีตัวทำนาย 100 ตัว: วิธีการลงโทษจะทำการตัดสินใจเพียงครั้งเดียวว่าตัวแปรใดที่จะถูกรวม / แยกออกซึ่งหมายความว่าพวกเขาจะเลือกเซตย่อยของตัวทำนายหนึ่งตัวอย่างเช่นแบบจำลองหนึ่งในเป็นไปได้2 100210021002^{100} "นักบวช Lasso (และที่เกี่ยวข้อง) ไม่กระจัดกระจายพวกเขาชักนำ sparsity ที่โหมด แต่ไม่ได้อยู่ในการกระจายหลัง" เมื่อมาถึงจุดนี้เขาแนะนำ Spike และ Slab Priors ฉันคิดว่าฉันได้รับปรีชาญาณ แต่ฉันต้องการให้แน่ใจว่า: พวกเขาดีขึ้นหรือไม่ในแง่ที่ว่าพวกเขาใช้วิธีการทดสอบแบบบังคับกำลังอันโหดร้ายในการทดสอบแต่ละชุดย่อยของ regressors ข้อเสียเปรียบคือเวลาในการคำนวณใช่หรือไม่? คุณคิดว่าเขาหมายถึงอะไรเมื่อพูดว่า "Lasso (และที่เกี่ยวข้อง) ... แต่ไม่ได้อยู่ในการกระจายหลัง"

6
การอ้างอิงพื้นฐานเกี่ยวกับ MCMC สำหรับสถิติแบบเบย์
ฉันกำลังมองหาเอกสารหรือหนังสือที่มีตัวอย่างเชิงปฏิบัติและเชิงทฤษฎีเกี่ยวกับMCMC พื้นฐานสำหรับสถิติแบบเบย์ (With R) ฉันไม่เคยเรียนเกี่ยวกับการจำลองและนั่นคือเหตุผลที่ฉันกำลังมองหาข้อมูล "พื้นฐาน" คุณสามารถให้คำแนะนำหรือคำแนะนำกับฉันได้ไหม?

3
การประมาณค่าพารามิเตอร์แบบเบส์หรือการทดสอบสมมติฐานแบบเบย์?
ดูเหมือนว่ามีการถกเถียงกันอย่างต่อเนื่องในชุมชน Bayesian ว่าเราควรทำการประมาณค่าพารามิเตอร์แบบ Bayesian หรือการทดสอบสมมติฐานแบบ Bayesian ฉันสนใจในการร้องขอความคิดเห็นเกี่ยวกับเรื่องนี้ อะไรคือจุดแข็งและจุดอ่อนของวิธีการเหล่านี้? บริบทใดที่เหมาะสมกว่าบริบทอื่น เราควรจะทำทั้งการประมาณค่าพารามิเตอร์และการทดสอบสมมติฐานหรือเพียงหนึ่ง?

2
เหตุใดตัวจําแนกแบบเบย์จึงเป็นลักษณนามในอุดมคติ
จะถือว่าเป็นกรณีที่เหมาะที่โครงสร้างความน่าจะเป็นพื้นฐานที่เป็นที่รู้จักกันอย่างสมบูรณ์แบบหมวดหมู่ เหตุใดจึงใช้ตัวจําแนกเบส์เพื่อให้ได้ประสิทธิภาพที่ดีที่สุดที่สามารถทำได้ หลักฐาน / คำอธิบายอย่างเป็นทางการสำหรับสิ่งนี้คืออะไร? เนื่องจากเราใช้ตัวจําแนกเบส์เป็นเกณฑ์มาตรฐานเพื่อเปรียบเทียบประสิทธิภาพของตัวจําแนกอื่น ๆ ทั้งหมด

3
การทำความเข้าใจคอนจูเกตเบต้าก่อนการอนุมานแบบเบย์เกี่ยวกับความถี่
ต่อไปนี้เป็นข้อความที่ตัดตอนมาจาก Bolstad ของรู้เบื้องต้นเกี่ยวกับคชกรรมสถิติ สำหรับสิ่งที่คุณผู้เชี่ยวชาญออกมีนี้อาจจะมีเล็ก ๆ น้อย ๆ แต่ผมไม่เข้าใจว่าผู้เขียนสรุปว่าเราไม่ต้องทำใด ๆ รวมในการคำนวณความน่าจะเป็นหลังมูลค่าของบาง\ผมเข้าใจการแสดงออกที่สองซึ่งเป็นสัดส่วนและสถานที่ที่เงื่อนไขทั้งหมดมาจาก ( โอกาส x ก่อน) นอกจากนี้ฉันเข้าใจว่าเราไม่ต้องกังวลเกี่ยวกับตัวส่วนเนื่องจากตัวเศษมีสัดส่วนโดยตรง แต่ย้ายไปยังสมการที่สามเราไม่ลืมเกี่ยวกับตัวส่วนของกฎเบย์ มันไปไหน และค่าที่คำนวณโดยฟังก์ชันแกมม่านั้นไม่ใช่ค่าคงที่ใช่หรือไม่ ค่าคงที่ไม่ได้ยกเลิกในทฤษฎีบทเบย์หรือไม่ππ\pi

2
เหตุใดจึงต้องใช้ MCMC เมื่อประเมินพารามิเตอร์โดยใช้ MAP
เมื่อกำหนดสูตรสำหรับการประมาณค่าพารามิเตอร์ของ MAP เหตุใดจึงต้องใช้วิธีการ MCMC (หรือคล้ายกัน) ฉันไม่สามารถใช้อนุพันธ์ตั้งค่าเป็นศูนย์แล้วแก้หาพารามิเตอร์ได้หรือไม่

1
นักสถิติใช้ Jeffreys 'มาก่อนในการใช้งานจริงหรือไม่?
เมื่อฉันเรียนรู้เกี่ยวกับ Jeffreys 'ก่อนหน้าในการอนุมานสถิติระดับบัณฑิตศึกษาของฉันอาจารย์ของฉันทำให้มันฟังดูเหมือนว่ามันน่าสนใจส่วนใหญ่ด้วยเหตุผลทางประวัติศาสตร์มากกว่าเพราะใครจะเคยใช้มัน จากนั้นเมื่อฉันทำการวิเคราะห์ข้อมูลแบบเบย์เราไม่เคยถูกขอให้ใช้นักบวชของเจฟฟรีย์ ไม่มีใครใช้จริงเหล่านี้ในทางปฏิบัติ ถ้าเป็นเช่นนั้น (หรือถ้าไม่) ทำไมหรือทำไมไม่ ทำไมนักสถิติบางคนถึงไม่จริงจัง

1
การเลือกแบบจำลอง Bayesian ใน PyMC3
ฉันใช้ PyMC3 เพื่อเรียกใช้แบบจำลอง Bayesian กับข้อมูลของฉัน ฉันใหม่สำหรับการสร้างแบบจำลอง Bayesian แต่จากการโพสต์บล็อกบางส่วน Wikipedia และQAจากเว็บไซต์นี้ดูเหมือนว่าจะเป็นแนวทางที่ถูกต้องในการใช้ตัวประกอบ Bayes และเกณฑ์ BIC เพื่อเลือกรูปแบบที่ดีที่สุดในการแสดงข้อมูลของฉัน ข้อมูลของฉัน) ในการคำนวณปัจจัย Bayes ฉันต้องการโอกาสที่สัมพันธ์กันสำหรับโมเดลที่ฉันต้องการเปรียบเทียบ อาจจะสับสนเล็กน้อยสำหรับฉัน แต่ฉันคิดว่ามีสองวิธีที่จะได้รับโอกาส (แก้ไขฉันหากฉันผิด): วิธีพีชคณิตเมื่อแบบจำลองง่าย: ดูตัวอย่างหน้าวิกิพีเดียของ Bayes วิธีตัวเลข: นี่คือสิ่งที่ PyMC3 กับอัลกอริทึม MCMC ฉันจะเข้าถึงโอกาสและเปรียบเทียบแบบจำลองของฉันใน PyMC3 ได้อย่างไร ฉันพบmodel.logpวิธีซึ่งตามเอกสารคือ "ฟังก์ชั่นความหนาแน่นของความน่าจะเป็นบันทึก" ฉันสามารถใช้สิ่งนั้นเพื่อสร้างโอกาสได้หรือไม่? คำถามโบนัส: เมื่อมีการเปรียบเทียบทั้งสองรุ่นอัตราส่วนระหว่างความน่าจะเป็นทั้งสองจะถูกคำนวณ จะเกิดอะไรขึ้นถ้าคุณต้องการเปรียบเทียบหลายรุ่น ตัวอย่าง PyMC3 ที่เป็นรูปธรรมจะมีประโยชน์มาก!

2
แบบจำลอง logit แบบเบส์ - คำอธิบายที่เข้าใจง่าย?
ฉันต้องยอมรับว่าก่อนหน้านี้ฉันไม่เคยได้ยินคำศัพท์นั้นในชั้นเรียนระดับปริญญาตรีหรือปริญญาโทเลย การถดถอยโลจิสติกหมายถึง Bayesian หมายความว่าอย่างไร ฉันกำลังมองหาคำอธิบายเกี่ยวกับการเปลี่ยนจากโลจิสติกส์ธรรมดาเป็นโลจิสติกส์แบบเบย์ดังต่อไปนี้: นี่คือสมการในรูปแบบการถดถอยเชิงเส้น:\E(y)=β0+β1x1+...+βnxnE(y)=β0+β1x1+...+βnxnE(y) = \beta_0 + \beta_1x_1 + ... + \beta_nx_n นี่คือสมการในรูปแบบการถดถอยโลจิสติก:\ สิ่งนี้จะกระทำเมื่อ y เป็นหมวดหมู่LN( E( y)1 - E( y)) = β0+ β1x1+ . . . + βnxnln⁡(E(y)1−E(y))=β0+β1x1+...+βnxn\ln(\frac{E(y)}{1-E(y)}) = \beta_0 + \beta_1x_1 + ... + \beta_nx_n สิ่งที่เราทำคือการเปลี่ยนแปลงเพื่อ\ LN (\ frac {E (y)} {1-E (y)})ln ( E ( …

2
ความเป็นมาของ Normal-Wishart หลัง
ฉันทำงานเกี่ยวกับการสืบทอดของ Normal-Wishart หลัง แต่ฉันติดอยู่ที่หนึ่งในพารามิเตอร์ (ด้านหลังของเมทริกซ์ระดับดูที่ด้านล่าง) สำหรับบริบทและความสมบูรณ์นี่คือแบบจำลองและส่วนที่เหลือของการพิสูจน์: xiμΛ∼N(μ,Λ)∼N(μ0,(κ0Λ)−1)∼W(υ0,W0)xi∼N(μ,Λ)μ∼N(μ0,(κ0Λ)−1)Λ∼W(υ0,W0)\begin{align} x_i &\sim \mathcal{N}(\boldsymbol{\mu}, \boldsymbol{\Lambda})\\ \boldsymbol{\mu} &\sim \mathcal{N}(\boldsymbol{\mu_0}, (\kappa_0 \boldsymbol{\Lambda})^{-1})\\ \boldsymbol{\Lambda} &\sim \mathcal{W}(\upsilon_0, \mathbf{W}_0) \end{align} รูปแบบที่ขยายของแต่ละปัจจัยทั้งสามคือ (ขึ้นอยู่กับค่าคงที่สัดส่วน) คือ: โอกาส: N(xi|μ,Λ)∝|Λ|N/2exp(−12∑i=1N(xTiΛxi−2μTΛxi+μTΛμ))N(xi|μ,Λ)∝|Λ|N/2exp⁡(−12∑i=1N(xiTΛxi−2μTΛxi+μTΛμ))\begin{align} \mathcal{N}(\mathbf{x}_i &| \boldsymbol{\mu}, \boldsymbol{\Lambda}) \propto\notag\\ &|\boldsymbol{\Lambda}|^{N/2} \exp{\left(-\frac{1}{2}\sum_{i=1}^N \left( \mathbf{x}_i^T\boldsymbol{\Lambda}\mathbf{x}_i - 2 \boldsymbol{\mu}^T \boldsymbol{\Lambda}\mathbf{x}_i + \boldsymbol{\mu}^T\boldsymbol{\Lambda}\boldsymbol{\mu}\right) \right)} \end{align} ปกติก่อนหน้า: N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp(−12(μTκ0Λμ−2μTκ0Λμ0+μT0κ0Λμ0))N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp⁡(−12(μTκ0Λμ−2μTκ0Λμ0+μ0Tκ0Λμ0))\begin{align} \mathcal{N}(\boldsymbol{\mu} &| (\boldsymbol{\mu}_0, \kappa_0 \boldsymbol{\Lambda})^{-1}) …

1
เกณฑ์การคำนวณสำหรับตัวแยกประเภทความเสี่ยงขั้นต่ำ
สมมติว่าสองชั้นและมีแอตทริบิวต์และมีการกระจายและ0.5) หากเรามีค่าเท่ากับก่อนหน้าสำหรับเมทริกซ์ต้นทุนต่อไปนี้:C 2 x N ( 0 , 0.5 ) N ( 1 , 0.5 ) P ( C 1 ) = P ( C 2 ) = 0.5ค1C1C_1ค2C2C_2xxxยังไม่มีข้อความ( 0 , 0 . 5 )N(0,0.5) \cal{N} (0, 0.5)ยังไม่มีข้อความ( 1 , 0 . 5 )N(1,0.5) \cal{N} (1, 0.5)P( C1) = P( …

2
เศรษฐมิติของวิธีการแบบเบย์ต่อวิธีการศึกษาเหตุการณ์
การศึกษาเหตุการณ์นั้นเกิดขึ้นอย่างกว้างขวางในด้านเศรษฐศาสตร์และการเงินเพื่อกำหนดผลกระทบของเหตุการณ์ที่เกิดขึ้นกับราคาหุ้น การถดถอย OLS - ในช่วงเวลาการอ้างอิงซึ่งแตกต่างจากหน้าต่างเหตุการณ์ - มักจะใช้เพื่อกำหนดพารามิเตอร์ที่จำเป็นในการสร้างแบบจำลองผลตอบแทนปกติสำหรับสินทรัพย์ หนึ่งแล้วกำหนดนัยสำคัญทางสถิติของผลตอบแทนที่ผิดปกติสะสม ( ) ของสินทรัพย์ต่อไปนี้เหตุการณ์ในช่วงเหตุการณ์ที่ระบุหน้าต่างจากเพื่อT_2การทดสอบสมมติฐานใช้เพื่อกำหนดว่าผลตอบแทนเหล่านี้มีนัยสำคัญหรือไม่ดังนั้นจึงผิดปกติหรือไม่ ดังนั้น:i T 1 T 2CARCAR\text{CAR}iiiT1T1T_1T2T2T_2 H0:CARi=0H0:CARi=0H_0 : \text{CAR}_i = 0 , ที่ไหน CARi=∑T2t=T1ARi,t=∑T2t=T1(ri,t−E[ri,t])CARi=∑t=T1T2ARi,t=∑t=T1T2(ri,t−E[ri,t])\text{CAR}_i = \sum_{t=T_1}^{T_2} \text{AR}_{i,t} = \sum_{t=T_1}^{T_2} \left( r_{i,t} -\mathbb{E}[r_{i,t}] \right)และ E[ri,t]E[ri,t]\mathbb{E}[r_{i,t}]คือผลตอบแทนของสินทรัพย์ที่คาดการณ์โดยแบบจำลอง หากจำนวนการสังเกตของเรามีขนาดใหญ่พอเราสามารถสันนิษฐานว่าเป็นเรื่องปกติเชิงเส้นกำกับของการกระจายผลตอบแทนของสินทรัพย์ แต่สิ่งนี้อาจไม่ได้รับการตรวจสอบสำหรับขนาดตัวอย่างที่เล็กลง มันอาจจะเป็นที่ถกเถียงกันอยู่ว่าเพราะเหตุนี้ บริษัท เดียว - เหตุการณ์การศึกษาเดียว (ตามที่ต้องการเช่นในคดี) ควรทำตามวิธีการแบบเบส์เพราะข้อสันนิษฐานของการทำซ้ำหลายครั้งอย่างไม่มีที่สิ้นสุด "มากขึ้นจากการตรวจสอบ" มากกว่าในกรณี ของหลาย บริษัท แต่วิธีการของผู้ใช้บ่อยยังคงเป็นเรื่องธรรมดา เมื่อพิจารณาจากวรรณกรรมที่ขาดแคลนในเรื่องนี้คำถามของฉันคือทำอย่างไรจึงจะเข้าใกล้การศึกษาเหตุการณ์ได้ดีที่สุดซึ่งคล้ายกับวิธีการที่อธิบายไว้ข้างต้นและสรุปในMacKinlay, 1997โดยใช้วิธี …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.