การปรับปรุงแบบเบย์ด้วยข้อมูลใหม่


17

เราจะคำนวณหาด้านหลังด้วย N ~ (a, b) ก่อนหลังจากสังเกตจุดข้อมูลได้อย่างไร ฉันคิดว่าเราต้องคำนวณค่าเฉลี่ยตัวอย่างและความแปรปรวนของจุดข้อมูลและทำการคำนวณบางอย่างที่รวมหลังกับก่อนหน้านี้ แต่ฉันไม่แน่ใจว่าสูตรการรวมกันเป็นอย่างไร

คำตอบ:


22

แนวคิดพื้นฐานของการอัปเดตแบบเบย์คือให้ข้อมูลบางส่วนXและพารามิเตอร์ที่น่าสนใจก่อนหน้าθซึ่งความสัมพันธ์ระหว่างข้อมูลและพารามิเตอร์ถูกอธิบายโดยใช้ฟังก์ชันความน่าจะเป็นคุณใช้ทฤษฎีบทของเบส์เพื่อรับส่วนหลัง

p(θX)p(Xθ)p(θ)

ซึ่งสามารถทำได้ตามลำดับซึ่งหลังจากที่ได้เห็นจุดข้อมูลแรกx1 ก่อน θกลายเป็นการปรับปรุงเพื่อให้หลัง θ , ต่อไปที่คุณสามารถใช้จุดข้อมูลสองx2และการใช้งานหลังได้รับก่อนที่จะθเป็นของคุณก่อนที่จะอัปเดตอีกครั้ง ฯลฯ

ให้ฉันยกตัวอย่างให้คุณ ลองนึกภาพว่าคุณต้องการประมาณค่าเฉลี่ยμของการแจกแจงแบบปกติและคุณรู้จักσ2ในกรณีเช่นนี้เราสามารถใช้โมเดลปกติธรรมดาได้ เราถือว่าปกติก่อนหน้านี้สำหรับμด้วยพารามิเตอร์หลายมิติμ0,σ02:

XμNormal(μ, σ2)μNormal(μ0, σ02)

ตั้งแต่การกระจายปกติเป็นคอนจูเกตก่อนสำหรับของการกระจายปกติเราได้ปิดรูปแบบการแก้ปัญหาในการปรับปรุงก่อนμ

E(μx)=σ2μ+σ02xσ2+σ02Var(μx)=σ2σ02σ2+σ02

แต่น่าเสียดายที่ง่ายเช่นปิดรูปแบบการแก้ปัญหาที่ไม่สามารถใช้ได้สำหรับปัญหาที่มีความซับซ้อนมากขึ้นและคุณจะต้องพึ่งพาขั้นตอนวิธีการเพิ่มประสิทธิภาพ (สำหรับการประมาณการจุดใช้สูงสุด posterioriวิธี) หรือการจำลอง MCMC

ด้านล่างคุณสามารถดูตัวอย่างข้อมูล:

n <- 1000
set.seed(123)
x     <- rnorm(n, 1.4, 2.7)
mu    <- numeric(n)
sigma <- numeric(n)

mu[1]    <- (10000*x[i] + (2.7^2)*0)/(10000+2.7^2)
sigma[1] <- (10000*2.7^2)/(10000+2.7^2)
for (i in 2:n) {
  mu[i]    <- ( sigma[i-1]*x[i] + (2.7^2)*mu[i-1] )/(sigma[i-1]+2.7^2)
  sigma[i] <- ( sigma[i-1]*2.7^2                  )/(sigma[i-1]+2.7^2)
}

หากคุณพล็อตผลลัพธ์คุณจะเห็นว่าคนหลังเข้าหาค่าประมาณ (มันเป็นค่าจริงถูกทำเครื่องหมายด้วยเส้นสีแดง) เมื่อมีการสะสมข้อมูลใหม่

การอัพเดตก่อนหน้าในขั้นตอนถัดไปในโมเดลปกติ - ปกติ

สำหรับการเรียนรู้เพิ่มเติมคุณสามารถตรวจสอบสไลด์เหล่านั้นและการวิเคราะห์ Conjugate Bayesian ของกระดาษกระจาย Gaussianโดย Kevin P. Murphy ตรวจสอบสิ่งใดนักปราชญ์เบย์กลายเป็นไม่เกี่ยวข้องกับขนาดตัวอย่างขนาดใหญ่? นอกจากนี้คุณยังสามารถตรวจสอบบันทึกย่อเหล่านั้นและรายการบล็อกนี้เพื่อดูการแนะนำแบบทีละขั้นตอนเพื่อการอนุมานแบบเบย์


ขอบคุณสิ่งนี้มีประโยชน์มาก เราจะไปแก้ปัญหาตัวอย่างง่ายๆนี้อย่างไร (ความแปรปรวนที่ไม่รู้จักไม่เหมือนตัวอย่างของคุณ) สมมติว่าเรามีการแจกแจงก่อนหน้าของ N ~ (5, 4) จากนั้นเราสังเกต 5 จุดข้อมูล (8, 9, 10, 8, 7) สิ่งที่จะเป็นหลังหลังการสังเกตเหล่านี้? ขอบคุณล่วงหน้า. ชื่นชมมาก
statstudent

@ เคลลี่คุณสามารถค้นหาตัวอย่างสำหรับกรณีที่ไม่ทราบความแปรปรวนอย่างใดอย่างหนึ่งและรู้จักค่าเฉลี่ยหรือทั้งสองอย่างนั้นไม่เป็นที่รู้จักในรายการวิกิพีเดียเกี่ยวกับคอนจูเกจคอนจูเกตและลิงก์ที่ฉันให้ไว้ท้ายคำตอบ หากไม่ทราบค่าเฉลี่ยและความแปรปรวนทั้งสองจะมีความซับซ้อนเพิ่มขึ้นเล็กน้อย
ทิม

@Kelly ครับคุณสามารถตรวจสอบที่นี่สำหรับตัวอย่างของประมาณการทั้งและσ 2 μσ2
ทิม

4

หากคุณมีก่อนหน้าและฟังก์ชันความน่าจะเป็นP ( x θ )คุณสามารถคำนวณหลังด้วย:P(θ)P(xθ)

P(θx)=θP(xθ)P(θ)P(x)

เนื่องจากเป็นเพียงค่าคงที่การทำให้เป็นมาตรฐานเพื่อให้ผลรวมน่าจะเป็นหนึ่งคุณจึงสามารถเขียน:P(x)

P(θx)θP(xθ)P(θ)

เมื่อหมายถึง "เป็นสัดส่วนกับ"

กรณีของนักบวช conjugate (ที่คุณมักจะได้รับสูตรฟอร์มปิดดี)

บทความ Wikipedia นี้เกี่ยวกับ conjugate priorsอาจเป็นข้อมูล ให้เป็นเวกเตอร์ของพารามิเตอร์ของคุณ ให้P ( θ )เป็นพารามิเตอร์ก่อนหน้า ให้P ( xθ )θP(θ)P(xθ)เป็นฟังก์ชันความน่าจะเป็น, ความน่าจะเป็นของข้อมูลที่กำหนดพารามิเตอร์ ก่อนหน้านี้เป็นคอนจูเกตก่อนหน้าสำหรับฟังก์ชันความน่าจะเป็นหากก่อนหน้าและPหลัง( θ x )อยู่ในตระกูลเดียวกัน (เช่น Gaussian ทั้งสอง)P(θ) P(θx)

ตารางการแจกแจงแบบคอนจูเกตอาจช่วยสร้างสัญชาตญาณบางอย่าง (และให้ตัวอย่างที่เป็นประโยชน์ในการทำงานด้วยตนเอง)


1

นี่เป็นปัญหาการคำนวณส่วนกลางสำหรับการวิเคราะห์ข้อมูลแบบเบย์ มันขึ้นอยู่กับข้อมูลและการแจกแจงที่เกี่ยวข้อง สำหรับกรณีง่ายๆที่ทุกอย่างสามารถแสดงในรูปแบบปิด (เช่นกับนักบวชคอนจูเกต) คุณสามารถใช้ทฤษฎีบทของเบย์ได้โดยตรง ตระกูลที่ได้รับความนิยมมากที่สุดของเทคนิคสำหรับกรณีที่ซับซ้อนมากขึ้นคือมาร์คอฟโซ่มอนติคาร์โล สำหรับรายละเอียดโปรดดูหนังสือตำราเบื้องต้นเกี่ยวกับการวิเคราะห์ข้อมูลแบบเบย์


ขอบคุณมาก! ขออภัยถ้านี่เป็นคำถามติดตามที่โง่จริง ๆ แต่ในกรณีง่าย ๆ ที่คุณพูดถึงเราจะใช้ทฤษฎีบทของเบย์โดยตรงได้อย่างไร การแจกแจงที่สร้างขึ้นโดยค่าเฉลี่ยตัวอย่างและความแปรปรวนของจุดข้อมูลกลายเป็นฟังก์ชันความน่าจะเป็นหรือไม่ ขอบคุณมาก.
Statstudent

@ เคลลี่อีกครั้งมันขึ้นอยู่กับการกระจาย ดูเช่นen.wikipedia.org/wiki/Conjugate_prior#Example (ถ้าฉันตอบคำถามของคุณอย่าลืมยอมรับคำตอบของฉันโดยคลิกที่เครื่องหมายถูกใต้ลูกศรลงคะแนน)
วิทยาศาสตร์
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.