bootstrap (ผู้ใช้บ่อย) ใช้ข้อมูลเป็นการประมาณที่สมเหตุสมผลในการกระจายประชากรที่ไม่รู้จัก ดังนั้นการกระจายตัวตัวอย่างของสถิติ (ฟังก์ชั่นของข้อมูล) สามารถประมาณได้โดยการสุ่มใหม่การสังเกตซ้ำด้วยการแทนที่และคำนวณสถิติสำหรับแต่ละตัวอย่าง
Let แสดงข้อมูลเดิม (ในตัวอย่างที่กำหนดให้n = 5 ) ให้y b = ( y b 1 , … , y b n )แสดงถึงตัวอย่างบูตสแตรป ตัวอย่างดังกล่าวน่าจะมีการสังเกตซ้ำหลายครั้งหรือมากกว่าและการสังเกตอื่น ๆ จะหายไป ค่าเฉลี่ยของตัวอย่าง bootstrap ถูกกำหนดโดยm b = 1y=(y1,…,yn)n=5yb=(yb1,…,ybn) มันคือการกระจายของmb
mb=1n∑i=1nybi.
mbมากกว่าจำนวนซ้ำของ bootstrap ที่ใช้ในการประมาณการกระจายตัวตัวอย่างจากประชากรที่ไม่รู้จัก
เพื่อให้เข้าใจการเชื่อมต่อระหว่าง bootstrap ที่พบบ่อยและ bootstrap ของ Bayesian มันเป็นคำแนะนำเพื่อดูวิธีการคำนวณmbจากมุมมองที่แตกต่างกัน
ในแต่ละตัวอย่างบูต , การสังเกตแต่ละปีผมเกิดขึ้นที่ใดก็ได้จาก 0 ถึงnครั้ง Let ชั่วโมงขฉันหมายถึงจำนวนครั้งที่Y ฉันเกิดขึ้นในปีขและปล่อยให้เอชข = ( H ข1 , ... , เอชขn ) ดังนั้นh b i ∈ { 0 , 1 , … , n - 1 , n }ybyinhbiyiybhb=(hb1,…,hbn)hbi∈{0,1,…,n−1,n}และ n ได้รับชมขเราสามารถสร้างคอลเลกชันของค่าลบน้ำหนักว่าผลรวมให้เป็นหนึ่ง: W ข = H ข/ nที่W ขฉัน = H ขฉัน / n ด้วยสัญกรณ์นี้เราสามารถแสดงค่าเฉลี่ยของตัวอย่าง bootstrap เป็น
m b = n ∑ i = 1 w b i∑ni=1hbi=nชั่วโมงขwb=hb/nwbi=hbi/n
mb=∑i=1nwbiyi.
วิธีการที่สังเกตจะถูกเลือกสำหรับตัวอย่างบูตกำหนดร่วมกันจำหน่ายสำหรับข โดยเฉพาะอย่างยิ่งh bมีการกระจายแบบพหุนามและดังนั้น( nwbhbดังนั้นเราจึงสามารถคำนวณมขโดยการวาด W ขจากการกระจายและการคำนวณผลิตภัณฑ์จุดด้วยY จากมุมมองใหม่นี้ปรากฏว่าการสังเกตได้รับการแก้ไขในขณะที่น้ำหนักมีการเปลี่ยนแปลง
(nwb)∼Multinomial(n,(1/n)ni=1).
mbwby
ในการอนุมานแบบเบย์การสังเกตจะได้รับการแก้ไขแน่นอนดังนั้นมุมมองใหม่นี้จึงเป็นที่พอใจของวิธีการแบบเบย์ อันที่จริงการคำนวณค่าเฉลี่ยตาม bootstrap แบบเบย์แตกต่างกันเฉพาะในการกระจายน้ำหนัก (อย่างไรก็ตามจากมุมมองแนวคิด Bootesrap แบบเบย์ค่อนข้างแตกต่างจากเวอร์ชั่นที่ใช้บ่อย) ข้อมูลได้รับการแก้ไขและน้ำหนักที่wเป็นพารามิเตอร์ที่ไม่รู้จัก เราอาจสนใจฟังก์ชั่นของข้อมูลที่ขึ้นอยู่กับพารามิเตอร์ที่ไม่รู้จัก:
μ = n ∑ i = 1 w iyw
μ=∑i=1nwiyi.
นี่คือภาพย่อขนาดย่อของแบบจำลองที่อยู่ด้านหลังรองเท้าบู๊ตแบบเบย์: การแจกแจงการสุ่มตัวอย่างสำหรับการสังเกตนั้นมีหลายรูปแบบและน้ำหนักก่อนหน้านี้คือการกระจายตัวแบบดิริชเล็ตที่ จำกัด ซึ่งทำให้น้ำหนักทั้งหมดอยู่บนจุดยอด (ผู้เขียนบางคนอ้างถึงโมเดลนี้ว่าเป็นโมเดลความน่าจะเป็นแบบหลายส่วน)
w∼Dirichlet(1,…,1).
(การแจกแจงแบบนี้ค่อนข้างเรียบง่าย) การแจกแจงสองแบบสำหรับตุ้มน้ำหนัก (ผู้ถี่ถ้วนและเบย์) มีลักษณะคล้ายกัน: พวกมันมีวิธีการเหมือนกันและโควาเรียสที่คล้ายกัน การกระจายแบบดิริชเล็ตนั้น 'ราบรื่นกว่าการกระจายแบบมัลติโนเมียลดังนั้นการบูตแบบเบย์อาจเรียกได้ว่าการบูตแบบสมู ธ เราอาจตีความ bootstrap เป็นประจำเพื่อประมาณค่า bootstrap แบบเบย์
μwy
∑i=1nwig(yi,θ)=0–,
g(yi,θ)θ0–θywwจากการกระจายหลังและประเมินผลการแก้ปัญหาที่ กรอบการประมาณสมการใช้กับ
โอกาสเชิงประจักษ์และด้วยวิธีการทั่วไปของช่วงเวลา (GMM).)
∑i=1nwi(yi−μ)=0.
θ=(μ,v)g(yi,θ)=(yi−μ(yi−μ)2−v).