เมื่อใดที่ไม่สามารถตีความการแจกแจงการสุ่มตัวอย่างเป็นเบย์หลังในการตั้งค่าการถดถอยได้


11

คำถามจริงของฉันอยู่ในสองย่อหน้าสุดท้าย แต่จะกระตุ้นพวกเขา:

ถ้าฉันพยายามที่จะประมาณค่าเฉลี่ยของตัวแปรสุ่มที่ตามหลังการแจกแจงปกติที่มีความแปรปรวนที่รู้จักกันฉันได้อ่านว่าการใส่เครื่องแบบก่อนหน้าค่าเฉลี่ยจะส่งผลให้มีการแจกแจงด้านหลังซึ่งเป็นสัดส่วนกับฟังก์ชันความน่าจะเป็น ในสถานการณ์เหล่านี้ช่วงเวลาที่น่าเชื่อถือแบบเบย์คาบเกี่ยวกันอย่างสมบูรณ์แบบกับช่วงความเชื่อมั่นที่พบบ่อยและค่าสูงสุดหลังเบย์ที่ประมาณการหลังเท่ากับความเป็นไปได้สูงสุดที่เกิดขึ้นบ่อยครั้ง

ในการตั้งค่าการถดถอยเชิงเส้นอย่างง่าย

Y=Xβ+ϵ,ϵN(0,σ2)

ใส่เครื่องแบบไว้ก่อนหน้าและ inverse-gamma ก่อนหน้าด้วยค่าพารามิเตอร์เล็ก ๆ ส่งผลให้หลังที่จะคล้ายกันมากกับบ่อยครั้งและช่วงเวลาที่น่าเชื่อถือสำหรับการกระจายหลังของที่จะคล้ายกับช่วงความเชื่อมั่นมากที่สุดโดยประมาณค่าความน่าจะเป็นสูงสุด พวกเขาจะไม่เหมือนเดิมเพราะก่อนหน้านี้มีอิทธิพลเล็กน้อยและหากการประเมินหลังถูกดำเนินการผ่านการจำลอง MCMC ที่จะแนะนำแหล่งที่มาของความคลาดเคลื่อนอื่น แต่ช่วงเวลาที่น่าเชื่อถือของ Bayesian รอบσ 2 β M P β M L E β | X σ 2 β M Pβσ2β^MAPβ^MLEβ|Xσ2β^MAPและช่วงความมั่นใจบ่อยๆจะค่อนข้างใกล้ชิดกันและแน่นอนว่าเมื่อขนาดตัวอย่างเพิ่มขึ้นพวกเขาควรมาบรรจบกันเมื่ออิทธิพลของความน่าจะเป็นเพิ่มขึ้นก่อนหน้านี้β^MLE

แต่ฉันได้อ่านแล้วว่ายังมีสถานการณ์การถดถอยที่ไม่ได้อยู่ใกล้กันนี้ ตัวอย่างเช่นการถดถอยแบบลำดับชั้นที่มีเอฟเฟกต์แบบสุ่มหรือการถดถอยแบบลอจิสติก - นี่คือสถานการณ์ที่เมื่อฉันเข้าใจแล้วไม่มีวัตถุประสงค์ "ดี" หรือนักบวชอ้างอิง

ดังนั้นคำถามทั่วไปของฉันคือ - สมมติว่าฉันต้องการอนุมานเกี่ยวกับP(β|X)และฉันไม่ได้มีข้อมูลก่อนที่ฉันต้องการรวมทำไมฉันไม่สามารถดำเนินการกับการประเมินความเป็นไปได้สูงสุดบ่อยครั้งในสถานการณ์เหล่านี้และตีความการประมาณค่าสัมประสิทธิ์ที่เกิดขึ้นและข้อผิดพลาดมาตรฐานเป็นประมาณการแผนที่เบย์และส่วนเบี่ยงเบนมาตรฐาน ประมาณการ "หลัง" ซึ่งเป็นผลมาจากก่อนหน้านี้ที่จะต้องมี "uninformative" โดยไม่ต้องพยายามหาสูตรที่ชัดเจนของก่อนหน้านี้ที่จะนำไปสู่การดังกล่าวหลัง? โดยทั่วไปภายในขอบเขตของการวิเคราะห์การถดถอยเมื่อใดที่จะดำเนินการตามแนวทางเหล่านี้ (ในการรักษาโอกาสเช่นหลัง) และเมื่อใดที่ไม่เป็นไร สิ่งที่เกี่ยวกับวิธีการที่ใช้บ่อยซึ่งไม่ได้อิงกับความน่าจะเป็นเช่นวิธีเสมือนจริง

คำตอบนั้นขึ้นอยู่กับว่าเป้าหมายการอนุมานของฉันเป็นค่าประมาณค่าสัมประสิทธิ์หรือความน่าจะเป็นของสัมประสิทธิ์ที่อยู่ในช่วงเฉพาะหรือปริมาณของการแจกแจงทำนาย

คำตอบ:


6

นี้นั้นเป็นคำถามเกี่ยวกับ -valuesและความน่าจะเป็นสูงสุด ให้ฉันพูดโคเฮน (1994) ที่นี่p

สิ่งที่เราอยากรู้คือ "ให้ข้อมูลนี้ความน่าจะเป็นที่ เป็นจริงคืออะไร" แต่อย่างที่เรารู้ส่วนใหญ่สิ่งที่ [ ] บอกเราคือ "เนื่องจากนั้นเป็นจริงความน่าจะเป็นของข้อมูลนี้ (หรือมากไปกว่านั้น) คืออะไร" สิ่งเหล่านี้ไม่เหมือนกัน (... ) p H 0H0pH0

ดังนั้น -value บอกเราว่าอะไรคือในขณะที่เรามีความสนใจใน (ดูการอภิปรายในFisherian VS Neyman เพียร์สันกรอบ)P ( D | H 0 ) P ( H 0 | D )pP(D|H0)P(H0|D)

ขอลืมสำหรับช่วงเวลาที่เกี่ยวกับ -values ความน่าจะเป็นในการสังเกตข้อมูลของเราเนื่องจากพารามิเตอร์เป็นฟังก์ชันความน่าจะเป็นθpθ

L(θ|D)=P(D|θ)

นั่นเป็นวิธีหนึ่งในการดูข้อสรุปเชิงสถิติ อีกวิธีคือวิธีเบย์ที่เราต้องการเรียนรู้โดยตรง (มากกว่าทางอ้อม) เกี่ยวกับโดยใช้ทฤษฎีบทของเบส์และใช้ไพรเออร์สำหรับθP(θ|D)θ

P(θ|D)ด้านหลังαP(D|θ)ความเป็นไปได้×P(θ)ก่อน

ทีนี้ถ้าคุณดูภาพรวมคุณจะเห็นว่าค่าและค่าความน่าจะเป็นตอบคำถามต่างจากการประมาณแบบเบย์พี

ดังนั้นในขณะที่การประมาณการความน่าจะเป็นสูงสุดควรเป็นแบบเดียวกับการประมาณ MAP Bayesian ภายใต้ชุดนักบวชคุณต้องจำไว้ว่าพวกเขาตอบคำถามอื่น


โคเฮน, J. (1994) โลกกลม (p <.05) นักจิตวิทยาอเมริกันอายุ 49, 997-1003


ขอบคุณสำหรับการตอบกลับของคุณ @Tim ฉันควรชัดเจนกว่านี้ - ฉันเข้าใจว่า P (D | H) และ P (H | D) โดยทั่วไปไม่เหมือนกันและผู้ใช้บ่อยและ Bayesians มีความเห็นที่แตกต่างกันเกี่ยวกับความเหมาะสมในการกำหนดการแจกแจงความน่าจะเป็นให้กับพารามิเตอร์ หรือสมมติฐานโดยทั่วไปมากขึ้น) สิ่งที่ฉันถามคือสถานการณ์ที่การกระจายตัวตัวอย่าง (ความถี่) ของตัวประมาณจะเทียบเท่ากับการแจกแจงหลัง (Bayesian) ของค่าพารามิเตอร์จริง
Yakkanomica

ความคิดเห็นที่ผ่านมาของฉัน: คุณเขียนว่า: "ดังนั้นในขณะที่การประมาณการความเป็นไปได้สูงสุดควรจะเหมือนกับ MAP การประมาณแบบเบย์ภายใต้ชุดนักบวช" - ฉันถามว่ามีสถานการณ์ที่ความสัมพันธ์นี้สลาย - ทั้งในแง่ ของการประมาณจุดและการกระจายรอบตัว
Yakkanomica

ภาคผนวกสุดท้ายหนึ่ง - บางคนอาจกล่าวได้ว่าคุณธรรมหลักของวิธีการแบบเบย์คือความสามารถในการรวมความรู้ก่อนหน้าได้อย่างยืดหยุ่น สำหรับฉันการอุทธรณ์ของวิธีการแบบเบย์นั้นเป็นการตีความ - ความสามารถในการกำหนดการกระจายความน่าจะเป็นให้กับพารามิเตอร์ จำเป็นต้องระบุ priors เป็นรำคาญ ฉันต้องการที่จะรู้ว่าในสถานการณ์ใดที่ฉันสามารถใช้วิธีการประจำ แต่กำหนดการตีความแบบเบย์ให้กับผลลัพธ์โดยการพิสูจน์ว่าผลลัพธ์ของนักประจำและ Bayesian ตรงกับตัวเลขภายใต้นักบวช noninformative
Yakkanomica

2
@ Yakkanomica ฉันเข้าใจว่ามันเป็นคำถามที่น่าสนใจ แต่คำตอบง่ายๆ (ตามที่ระบุไว้ข้างต้น) คือคุณไม่ควรทำการตีความเช่นนี้เพราะวิธีการที่ใช้บ่อยที่สุดตอบคำถามที่แตกต่างจาก Bayesian การประมาณจุด ML และ MAP ควรเห็นด้วย แต่ช่วงความเชื่อมั่นและ HDI อาจแตกต่างกันและไม่ควรตีความการแลกเปลี่ยน
ทิม

แต่ @Tim มีสถานการณ์ที่ช่วงความมั่นใจและ HDI ทับซ้อนกัน ยกตัวอย่างเช่นการเปรียบเทียบประมาณการ ML ใน p.1906 กับคชกรรมหลังประมาณการ (ขึ้นอยู่กับไพรเออร์เครื่องแบบค่าสัมประสิทธิ์และ IG ก่อนในระดับ) บน p.1908: PROC GENMOD ตัวอย่างเช่น ค่า ML point และขีด จำกัด ของความเชื่อมั่น 95% นั้นใกล้เคียงกับค่าเฉลี่ยเบย์หลังและช่วง HPD 95%
Yakkanomica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.