เมื่อใดที่ควรใช้เทคนิคบูตสแตรปกับเทคนิคแบบเบย์?


12

ฉันมีปัญหาในการวิเคราะห์การตัดสินใจที่ค่อนข้างซับซ้อนซึ่งเกี่ยวข้องกับการทดสอบความน่าเชื่อถือและวิธีการทางตรรกะ (สำหรับฉัน) ดูเหมือนว่าจะเกี่ยวข้องกับการใช้ MCMC เพื่อสนับสนุนการวิเคราะห์แบบเบย์ อย่างไรก็ตามมีการแนะนำว่าควรใช้วิธี bootstrapping ใครช่วยแนะนำอ้างอิง (หรือสาม) ที่อาจสนับสนุนการใช้เทคนิคอย่างใดอย่างหนึ่งมากกว่าอีก (แม้สำหรับสถานการณ์เฉพาะ)? FWIW ฉันมีข้อมูลจากหลายแหล่งที่แตกต่างกันและการสังเกตความล้มเหลวน้อย / ศูนย์ ฉันยังมีข้อมูลที่ระบบย่อยและระดับระบบ

ดูเหมือนว่าจะมีการเปรียบเทียบแบบนี้ แต่ฉันไม่โชคดีที่ค้นหาผู้ต้องสงสัยตามปกติ ขอบคุณล่วงหน้าสำหรับพอยน์เตอร์ใด ๆ


1
เนื่องจาก bootstrap แบบคลาสสิกสามารถคิดได้ว่าเป็นวิธีที่มีความเป็นไปได้สูงสุดในการใช้งานคอมพิวเตอร์ (เช่นเทคนิคที่ไม่ใช่แบบเบย์ (แบบแบนก่อน)) จะเป็นการดีกว่าถ้าคุณใช้ถ้อยคำของคำถามซ้ำ ๆ ?" พื้นหลังบางส่วนใน bootstrap: stats.stackexchange.com/questions/18469/…
Yevgeny

1
อืม .. ฉันเดาว่าฉันไม่เห็นด้วย หวังว่า 'bootstrap' จะแสดงลักษณะเฉพาะของช่วงเวลานั้นโดยเฉพาะ มีความสำคัญมากกว่าแค่ 'ผู้ใช้บ่อย ๆ ' อย่างน้อย 'bootstrap' จะทำให้คลั่งศาสนาส่วนใหญ่อยู่ที่อ่าว นอกจากนี้ขอขอบคุณสำหรับลิงค์ แต่ฉันคุ้นเคยกับความคิดเห็นก่อนหน้าของคุณก่อนที่จะโพสต์นี้
Aengus

1
ให้ฉันใช้ถ้อยคำใหม่คุณมีข้อมูลก่อนหน้านี้ที่เป็นประโยชน์หรือมีปัญหามีโครงสร้างแบบลำดับขั้น (ซ้อนกัน) หรือไม่? ถ้าเป็นเช่นนั้นเทคนิคเบย์อาจจะดีกว่า (โดยเฉพาะถ้าจำนวนพารามิเตอร์แบบจำลองมีขนาดใหญ่เมื่อเทียบกับจำนวนข้อมูลที่มีอยู่ดังนั้นการประเมินจะได้รับประโยชน์จาก "การหดตัวแบบเบย์") มิฉะนั้น MLE / bootstrap ก็เพียงพอแล้ว
Yevgeny

ฉันคิดว่าแนวทางที่เป็นไปได้อีกวิธีหนึ่งคือการใช้โมเดลเอฟเฟ็กต์แบบผสม (เช่นการใช้ R package lme4) เพื่อทำโมเดลโครงสร้างลำดับชั้นที่คุณได้กล่าวอ้าง สิ่งนี้จะช่วยในการประมาณค่าแบบจำลอง (ลำดับชั้น) ที่มีพารามิเตอร์จำนวนมาก
Yevgeny

1
การวิเคราะห์ bootstrap นั้นสามารถถูกมองว่าเป็นการวิเคราะห์แบบ Bayesian ได้ดังนั้นคำถามของคุณอาจจะเป็น "เมื่อใดที่จะใช้ bootstrap กับแบบจำลอง Bayesian อื่น" (คำถามของคุณกระตุ้นให้ฉันเขียนการตีความ bootstrap นี้เป็นแบบจำลอง Bayesian : sumsar.net/blog/2015/04/… ) ด้วยคำถามนี้ฉันเห็นด้วยกับ @Yevgeny ว่าเราอาจต้องการข้อมูลเพิ่มเติมเกี่ยวกับปัญหาเฉพาะของคุณก่อนที่เราจะสามารถแนะนำแบบจำลองได้
Rasmus Bååth

คำตอบ:


15

สำหรับความคิดของฉันคำอธิบายปัญหาของคุณชี้ไปที่ประเด็นหลักสองประเด็น ครั้งแรก:

ฉันมีการวิเคราะห์การตัดสินใจที่ค่อนข้างซับซ้อน ...

สมมติว่าคุณมีฟังก์ชั่นการสูญเสียในมือคุณต้องตัดสินใจว่าคุณใส่ใจกับความเสี่ยงที่เกิดขึ้นบ่อยหรือการสูญเสียที่คาดหวังไว้ bootstrap ช่วยให้คุณสามารถประมาณฟังก์ชั่นการกระจายข้อมูลโดยประมาณดังนั้นมันจะช่วยให้กับอดีต; และตัวอย่างหลังจาก MCMC จะช่วยให้คุณประเมินหลัง แต่...

ฉันยังมีข้อมูลที่ระบบย่อยและระดับระบบ

ดังนั้นข้อมูลเหล่านี้มีโครงสร้างแบบลำดับชั้น The Bayesian approach model ข้อมูลดังกล่าวเป็นธรรมชาติอย่างมากในขณะที่ bootstrap ได้รับการออกแบบมาสำหรับข้อมูลที่จำลองเป็น iid ในขณะที่มันถูกขยายไปยังข้อมูลลำดับชั้น (ดูการอ้างอิงในการแนะนำบทความนี้ ) บทความนี้ )

เพื่อสรุป: หากเป็นความเสี่ยงที่คุณสนใจอยู่บ่อยครั้งคุณอาจจำเป็นต้องมีงานวิจัยต้นฉบับบางส่วนในการใช้ bootstrap กับทฤษฎีการตัดสินใจ อย่างไรก็ตามหากการลดความสูญเสียที่คาดหวังไว้หลังน้อยที่สุดนั้นเป็นเรื่องที่เป็นธรรมชาติมากขึ้นสำหรับปัญหาการตัดสินใจของคุณ Bayes เป็นหนทางที่แน่นอนในการไป


ขอบคุณฉันไม่ได้วิ่งข้ามสิ่งเหล่านี้ บทความหลังนี้ดูน่าสนใจเป็นพิเศษ
Aengus

5

ฉันได้อ่านว่า bootstrap ที่ไม่ใช่พารามิเตอร์นั้นสามารถมองได้ว่าเป็นกรณีพิเศษของแบบจำลอง Bayesian ที่มีข้อมูลที่ไม่ต่อเนื่อง (มาก) ก่อนหน้านี้ซึ่งข้อสมมติฐานที่ทำในรูปแบบนั้นคือข้อมูลนั้นไม่ต่อเนื่องและโดเมนของ การกระจายเป้าหมายของคุณถูกสังเกตอย่างสมบูรณ์ในตัวอย่างของคุณ

ที่นี่มีสองอ้างอิง:

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.