ในกรณีนี้คุณสามารถพิจารณาการประมาณค่าABCของความน่าจะเป็น (และจากMLE ) ภายใต้สมมติฐาน / ข้อ จำกัด ดังต่อไปนี้:
การสันนิษฐาน ขนาดตัวอย่างดั้งเดิมเป็นที่รู้จักกันn
นี่ไม่ใช่ข้อสันนิษฐานที่ชัดเจนว่าคุณภาพในแง่ของการลู่เข้าของตัวประมาณที่ใช้บ่อยขึ้นอยู่กับขนาดของกลุ่มตัวอย่างดังนั้นจึงไม่สามารถรับตัวประมาณที่ดีได้ตามอำเภอใจโดยไม่ทราบขนาดตัวอย่างดั้งเดิม
ความคิดที่จะสร้างตัวอย่างจากการกระจายหลังของและเพื่อผลิตประมาณของ MLEคุณสามารถใช้ความสำคัญการสุ่มตัวอย่างเทคนิคเช่นเดียวกับใน[1]หรือที่จะต้องพิจารณาเครื่องแบบก่อนในθกับการสนับสนุนที่เหมาะสม ตั้งเป็นใน[2]θθ
ฉันจะอธิบายวิธีการใน [2] ก่อนอื่นให้ฉันอธิบายตัวอย่าง ABC
ABC Sampler
Let เป็นรูปแบบที่สร้างตัวอย่างที่θ ∈ Θเป็นพารามิเตอร์ (จะประมาณ) Tเป็นสถิติ (ฟังก์ชั่นของกลุ่มตัวอย่าง) และT 0เป็นสถิติที่สังเกตในเบื้องต้นศัพท์แสง นี้เรียกว่าสถิติสรุป , ρจะเป็นตัวชี้วัดπ ( θ )การกระจายก่อนในθและε > 0ความอดทน จากนั้นตัวอย่างการปฏิเสธ ABC สามารถดำเนินการได้ดังนี้f(⋅|θ)θ∈ΘTT0ρπ(θ)θϵ>0
- ตัวอย่างจากπ ( ⋅ )θ∗π(⋅)
- สร้างตัวอย่างขนาดnจากแบบจำลองฉ( ⋅ | θ * )xnf(⋅|θ∗)
- Compute )T∗=T(x)
- ถ้ายอมรับθ *จำลองจากหลังของที่θρ(T∗,T0)<ϵθ∗θ
ขั้นตอนวิธีการนี้จะสร้างตัวอย่างตัวอย่างจากการกระจายหลังของรับT ( x ) = T 0 ดังนั้นสถานการณ์ที่ดีที่สุดคือเมื่อสถิติTเพียงพอ แต่สามารถใช้สถิติอื่น ๆ ได้ สำหรับคำอธิบายรายละเอียดเพิ่มเติมของเอกสารนี้θT(x)=T0T
ตอนนี้ในกรอบทั่วไปหากมีการใช้เครื่องแบบก่อนหน้านี้ที่มี MLE ในการสนับสนุนของมันแล้วสูงสุดposteriori (MAP) เกิดขึ้นพร้อมกับการประเมินความน่าจะเป็นสูงสุด (MLE) ดังนั้นหากคุณพิจารณาเครื่องแบบที่เหมาะสมก่อนใน ABC Sampler คุณสามารถสร้างตัวอย่างโดยประมาณของการแจกแจงหลังซึ่ง MAP ตรงกับ MLE ขั้นตอนที่เหลือประกอบด้วยการประเมินโหมดนี้ ปัญหานี้ได้รับการกล่าวถึงในประวัติเช่นใน"การประมาณค่าที่มีประสิทธิภาพคอมพิวเตอร์ของโหมดการหลายตัวแปร"
ตัวอย่างของเล่น
ให้เป็นตัวอย่างจากN ( μ , 1 )และคิดว่าข้อมูลที่ใช้ได้เฉพาะจากตัวอย่างนี้เป็นˉ x = 1(x1,...,xn)N(μ,1)เจ ให้ρเป็นแบบยุคลิดเมตริกในการวิจัยและε=0.001 รหัส R ต่อไปนี้แสดงวิธีรับ MLE โดยประมาณโดยใช้วิธีที่อธิบายไว้ข้างต้นโดยใช้ตัวอย่างจำลองที่มีn=100และμ=0ตัวอย่างของการแจกแจงหลังขนาด1,000ซึ่งเป็นชุดก่อนหน้าสำหรับμบน(-0.3,0.3)และตัวประมาณความหนาแน่นของเคอร์เนลสำหรับการประเมินโหมดของตัวอย่างหลัง (MAP = MLE)x¯=1n∑nj=1xjρRϵ=0.001n=100μ=01000μ(−0.3,0.3)
rm(list=ls())
# Simulated data
set.seed(1)
x = rnorm(100)
# Observed statistic
T0=mean(x)
# ABC Sampler using a uniform prior
N=1000
eps = 0.001
ABCsamp = rep(0,N)
i=1
while(i<N+1){
u = runif(1,-0.3,0.3)
t.samp = rnorm(100,u,1)
Ts = mean(t.samp)
if(abs(Ts-T0)<eps){
ABCsamp[i]=u
i=i+1
print(i)
}
}
# Approximation of the MLE
kd = density(ABCsamp)
kd$x[which(kd$y==max(kd$y))]
อย่างที่คุณเห็นการใช้ความอดทนเล็กน้อยเราได้การประมาณค่า MLE ที่ดีมาก (ซึ่งในตัวอย่างเล็ก ๆ น้อย ๆ นี้สามารถคำนวณได้จากสถิติที่ระบุว่าเพียงพอ) สิ่งสำคัญคือต้องสังเกตว่าการเลือกสถิติสรุปเป็นสิ่งสำคัญ โดยทั่วไปปริมาณจะเป็นตัวเลือกที่ดีสำหรับสถิติสรุป แต่ตัวเลือกทั้งหมดไม่สามารถสร้างการประมาณที่ดีได้ อาจเป็นกรณีที่สถิติสรุปไม่ได้ให้ข้อมูลมากนักและจากนั้นคุณภาพของการประมาณค่าอาจไม่ดีซึ่งเป็นที่รู้จักกันดีในชุมชน ABC
อัปเดต:มีการเผยแพร่วิธีคล้ายกันในFan และ al (2012) ดูรายการนี้สำหรับการอภิปรายบนกระดาษ