ตัวอย่างข้อผิดพลาดในอัลกอริทึม MCMC


28

ฉันกำลังตรวจสอบวิธีการตรวจสอบอัตโนมัติของวิธีมาร์คอฟโซ่มอนติคาร์โลและฉันต้องการตัวอย่างข้อผิดพลาดที่อาจเกิดขึ้นเมื่อสร้างหรือใช้อัลกอริทึมดังกล่าว คะแนนโบนัสหากใช้วิธีการที่ไม่ถูกต้องในเอกสารเผยแพร่

ฉันสนใจโดยเฉพาะอย่างยิ่งในกรณีที่ข้อผิดพลาดหมายความว่า chain มีการกระจายตัวที่ไม่ถูกต้องถึงแม้ว่าข้อผิดพลาดประเภทอื่น (เช่น chain ไม่ใช่ ergodic) ก็น่าสนใจเช่นกัน

ตัวอย่างของข้อผิดพลาดดังกล่าวจะล้มเหลวในการส่งออกค่าเมื่อ Metropolis-Hastings ปฏิเสธการย้ายที่เสนอ


7
หนึ่งในตัวอย่างที่ฉันชอบคือตัวประมาณค่าเฉลี่ย Harmonicเพราะมันมีคุณสมบัติเชิงซีมโทติคที่ดี แต่ไม่สามารถทำงานได้จริง Radford Nealกล่าวถึงเรื่องนี้ในบล็อกของเขา: "ข่าวร้ายคือจำนวนคะแนนที่จำเป็นสำหรับตัวประมาณนี้เพื่อให้ได้คำตอบที่ถูกต้องมักจะมากกว่าจำนวนอะตอมในเอกภพที่สังเกตได้" วิธีนี้มีการใช้อย่างกว้างขวางในแอปพลิเคชัน

3
อีกหนึ่งความอนุเคราะห์จากศ. โอนีล
Cyan

5
@ Cyan สำหรับ Neal ที่จะดำเนินการอย่างจริงจังฉันคิดว่าเขาควรจะได้พบวารสารที่จะยอมรับบทความของเขามากกว่าที่จะเพียงแค่ส่งมันบนอินเทอร์เน็ต ฉันเชื่อได้อย่างง่ายดายว่าเขาพูดถูกและผู้ตัดสินและผู้เขียนไม่ถูกต้อง แม้ว่ามันจะเป็นเรื่องยากที่จะได้รับการตีพิมพ์เอกสารที่ขัดแย้งกับผลการตีพิมพ์และการปฏิเสธ JASA เป็นกำลังใจ แต่ฉันคิดว่าเขาควรจะลองวารสารอื่น ๆ อีกหลายจนกว่าเขาจะประสบความสำเร็จ คุณต้องมีผู้ตัดสินที่เป็นกลางและเป็นอิสระในการเพิ่มความน่าเชื่อถือให้กับการค้นพบของคุณ
Michael R. Chernick

4
เราควรใช้ศาสตราจารย์โอนีลอย่างจริงจังเสมอ! ; o) เป็นเรื่องน่าละอายที่ผลลัพธ์เช่นนี้ยากที่จะเผยแพร่และน่าเสียดายที่วัฒนธรรมการศึกษาสมัยใหม่ดูเหมือนจะไม่เห็นคุณค่าของสิ่งนั้นดังนั้นจึงเป็นที่เข้าใจได้หากไม่ใช่กิจกรรมที่มีความสำคัญสูงสำหรับเขา คำถามที่น่าสนใจฉันสนใจคำตอบมาก
Dikran Marsupial

6
@Michael: บางที จากสถานการณ์ที่คล้ายคลึงกันทุกด้านรวมถึงในตำแหน่งของศาสตราจารย์โอนีลหลายต่อหลายครั้งการสังเกตการณ์ของฉันก็คือการปฏิเสธกระดาษนั้นมีเนื้อหาข้อมูลน้อยมากในกรณีส่วนใหญ่เช่นเดียวกับการยอมรับจำนวนมาก ทบทวนคำสั่งของขนาดที่มีเสียงดังมากขึ้นกว่าคนสนใจที่จะยอมรับและมักจะเป็นอาจจะเป็นกรณีที่นี่มีบางส่วนและความสนใจ (เช่นไม่ได้เป็นอิสระ) กิจการและผลประโยชน์ที่เล่น ที่กล่าวว่าฉันไม่ได้ตั้งใจแสดงความคิดเห็นต้นฉบับของฉันที่จะนำเราไปไกลถึงหัวข้อที่อยู่ในมือ ขอบคุณที่แบ่งปันความคิดของคุณในเรื่องนี้
พระคาร์ดินัล

คำตอบ:


11

1. ค่าประมาณความน่าจะเป็นและค่าเฉลี่ยฮาร์มอนิก

โอกาสร่อแร่จะถูกกำหนดเป็นค่าคงที่ normalizing ของการกระจายหลัง

p(x)=Θp(x|θ)p(θ)dθ.

ความสำคัญของปริมาณนี้มาจากบทบาทในการเปรียบเทียบรูปแบบผ่านปัจจัย Bayes

มีการเสนอวิธีการหลายวิธีเพื่อประมาณปริมาณนี้ Raftery และคณะ (2007)เสนอตัวประมาณค่าเฉลี่ยฮาร์มอนิกซึ่งได้รับความนิยมอย่างรวดเร็วเนื่องจากความเรียบง่าย แนวคิดประกอบด้วยการใช้ความสัมพันธ์

1พี(x)=Θพี(θ|x)พี(x|θ)dθ.

ดังนั้นหากเรามีตัวอย่างจากคนหลังให้พูดปริมาณนี้สามารถประมาณได้โดย(θ1,...,θยังไม่มีข้อความ)

1พี(x)1ยังไม่มีข้อความΣJ=1ยังไม่มีข้อความ1พี(x|θJ).

ประมาณนี้จะเกี่ยวข้องกับแนวคิดของการสุ่มตัวอย่างสำคัญ

ตามกฎหมายจำนวนมากตามที่กล่าวไว้ในโอนีลบล็อกเรามีที่ประมาณการนี้อยู่ที่สอดคล้องกัน ปัญหาคือว่าจำเป็นสำหรับการประมาณที่ดีสามารถมีขนาดใหญ่มาก ดูบล็อกของ Neal หรือบล็อกของ Robert 1 , 2 , 3 , 4สำหรับตัวอย่างยังไม่มีข้อความ

ทางเลือก

มีหลายทางเลือกสำหรับการใกล้เคียงกับที่มีx}) Chopin และ Robert (2008)นำเสนอวิธีการสุ่มตัวอย่างตามความสำคัญพี(x)

2. ไม่ใช้งานตัวอย่าง MCMC ของคุณนานพอ (โดยเฉพาะเมื่อมี multimodality)

Mendoza และ Gutierrez-Peña (1999)อนุมานการอ้างอิงก่อน / หลังสำหรับอัตราส่วนของสองวิธีปกติและนำเสนอตัวอย่างของการอนุมานที่ได้รับกับรุ่นนี้โดยใช้ชุดข้อมูลจริง โดยใช้วิธีการ MCMC พวกเขาได้รับตัวอย่างขนาดของอัตราส่วนท้ายของค่าเฉลี่ยของวิธีซึ่งแสดงด้านล่างφ2000φ

ป้อนคำอธิบายรูปภาพที่นี่

และรับช่วง HPD สำหรับ( 0.63 , 5.29 ) หลังจากการวิเคราะห์การแสดงออกของการแจกแจงหลังมันเป็นเรื่องง่ายที่จะเห็นว่ามันมีความแปลกประหลาดที่ 0และหลังควรมีลักษณะเช่นนี้จริง ๆ (หมายเหตุความแปลกประหลาดที่ 0 )φ (0.63,5.29)00

ป้อนคำอธิบายรูปภาพที่นี่

ซึ่งสามารถตรวจพบได้เฉพาะเมื่อคุณเรียกใช้ตัวอย่าง MCMC ของคุณนานพอหรือใช้วิธีการปรับตัว HPD ที่ได้รับด้วยหนึ่งในวิธีการต่อไปนี้คือตามที่ได้รายงานไปแล้ว ความยาวของช่วงเวลา HPD เพิ่มขึ้นอย่างมีนัยสำคัญซึ่งมีนัยสำคัญเมื่อเปรียบเทียบกับความยาวของวิธีการแบบดั้งเดิม / แบบดั้งเดิม(0,7.25)

3. ปัญหาอื่น ๆ บางอย่างเช่นการประเมินการลู่เข้าการเลือกค่าเริ่มต้นพฤติกรรมที่ไม่ดีของโซ่สามารถพบได้ในการสนทนานี้โดย Gelman, Carlin และ Neal

4. การสุ่มตัวอย่างความสำคัญ

ก.

ผม=(x)dx=(x)ก.(x)ก.(x)dx.

ก.(x1,...,xยังไม่มีข้อความ)ผม

ผม1ยังไม่มีข้อความΣJ=1ยังไม่มีข้อความ(xJ)ก.(xJ).

ก.ยังไม่มีข้อความ

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
พวกเขาเป็นตัวอย่างที่ดี สำหรับผู้ที่สนใจจดหมายถึงบรรณาธิการพร้อมรูปอยู่ที่นี่: onlinelibrary.wiley.com/doi/10.1002/bimj.200800256/abstract
Simon Byrne

2
สรุปดีมากและชัดเจน !! (+1)
gui11aume

12

Darren Wilkinson ในบล็อกของเขาให้รายละเอียดตัวอย่างของข้อผิดพลาดทั่วไปในการเดินแบบสุ่ม Metropolis-Hastings ฉันแนะนำให้อ่านแบบเต็ม แต่นี่คือเวอร์ชัน tl; dr

หากการกระจายเป้าหมายเป็นค่าบวก (เช่นการแจกแจงแกมม่าฯลฯ ) ในมิติเดียวมันเป็นการดึงดูดให้ปฏิเสธข้อเสนอที่มีค่าลบในมิตินั้นทันที ข้อผิดพลาดคือการละทิ้งข้อเสนออย่างที่ไม่เคยเกิดขึ้นและประเมินอัตราส่วนการยอมรับของ Metropolis-Hastings (MH) ของข้อเสนออื่น ๆ เท่านั้น นี่เป็นข้อผิดพลาดเพราะใช้สำหรับความหนาแน่นของข้อเสนอที่ไม่สมมาตร

ผู้เขียนแนะนำให้ใช้หนึ่งในสองแก้ไข

  1. นับ "เชิงลบ" เป็นการยอมรับที่ล้มเหลว (และเสียประสิทธิภาพเล็กน้อย)

  2. ใช้อัตราส่วน MH ที่ถูกต้องในกรณีนั้นคือ

π(x* * * *)π(x)Φ(x)Φ(x* * * *),

πΦφ Φ(x)=0φ(Y-x)dY


1
+1 ตัวอย่างที่น่าสนใจ ฉันยังคิดถึงประเด็นอื่น ๆ ที่เกี่ยวข้องกับ MH ที่เกี่ยวข้องกับอัตราการยอมรับ ฉันคิดว่าอัตราที่เหมาะสมที่สุด0.234ถูกใช้มากเกินไป

@Procrastinator คุณรู้วรรณกรรม MCMC ได้เป็นอย่างดี นี่คือโดเมนของคุณหรือไม่
gui11aume

ขอบคุณสำหรับความคิดเห็นของคุณ ฉันชอบสถิติแบบเบย์แล้วฉันต้องพก MCMC ข้าม;)

1

กรณีที่ชัดเจนมาก (เชื่อมต่อกับการประมาณความน่าจะเป็นชายขอบที่กล่าวถึงในคำตอบแรก) ที่บรรจบกันจริงเป็นตัวอย่างของปัญหาของการเปลี่ยนป้ายชื่อในรูปแบบผสมควบคู่ไปกับการใช้งานของChib ของ (1995) ประมาณการ ดังที่เรดฟอร์ดโอนีล (1999)ชี้ให้เห็นว่าหากโซ่ MCMC ไม่ได้มาบรรจบกันอย่างถูกต้องในแง่ที่ว่ามันทำการสำรวจบางส่วนของโหมดการกระจายเป้าหมายการประมาณ Monte Carlo ของ Chib ไม่สามารถเข้าถึงค่าตัวเลขที่ถูกต้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.