โอกาสที่ตัวอย่าง bootstrap นั้นเหมือนกับตัวอย่างดั้งเดิม


9

แค่ต้องการตรวจสอบเหตุผลบางอย่าง

หากตัวอย่างดั้งเดิมของฉันมีขนาดและฉันบูตมันแล้วกระบวนการคิดของฉันเป็นดังนี้:n

1nเป็นโอกาสของการสังเกตใด ๆ ที่ดึงมาจากตัวอย่างดั้งเดิม เพื่อให้แน่ใจว่าการวาดต่อไปคือไม่ได้สังเกตตัวอย่างก่อนหน้านี้เรา จำกัด ขนาดของกลุ่มตัวอย่างที่จะn-1ดังนั้นเราจึงได้รูปแบบนี้:n-1

1n1n-11n-21n-(n-1)=1n!.

ถูกต้องหรือไม่ ฉันสะดุดที่สาเหตุที่ไม่สามารถแทน(1n)n


1
ฉันไม่แน่ใจว่าฉันกำลังติดตามคุณ ทำไมคุณถึงต้องการ "ตรวจสอบให้แน่ใจว่าการวาดครั้งต่อไปไม่ใช่ตัวอย่างก่อนหน้า" ในการเริ่มต้นความคิดคือการสุ่มตัวอย่างด้วยการเปลี่ยน นั่นคือคุณไม่อยากให้มันเป็นไปได้ว่าวาดถัดไปเป็นเช่นเดียวกับคนที่คุณได้วาดแล้ว
gung - Reinstate Monica

แต่นั่นไม่ได้หมายความว่าตัวอย่าง bootstrapped ไม่เหมือนกับตัวอย่างต้นฉบับใช่ไหม
Jayant.M

ฉันไม่ได้ติดตามคุณ คุณไม่ต้องการให้รองเท้าบูทตัวอย่างเหมือนกันกับตัวอย่างของคุณคุณแค่ต้องการให้ตัวอย่างเป็นตัวอย่างของประชากร
gung - Reinstate Monica

1
ดังนั้นคำถามของฉันคือโอกาสของตัวอย่าง bootstrap นั้นเหมือนกับตัวอย่างดั้งเดิม ฉันสนใจใน bootstrap ที่เหมือนกับตัวอย่าง
Jayant.M

ขออภัยถ้าคำถามของฉันไม่ชัดเจน!
Jayant.M

คำตอบ:


17

โปรดทราบว่าในแต่ละตำแหน่งการสังเกต (ผม=1,2,...,n) เราสามารถเลือกใด ๆ ของ n การสังเกตจึงมี nn resamples ที่เป็นไปได้ (เก็บคำสั่งที่พวกเขาจะวาด) ซึ่ง n! คือ "ตัวอย่างเดียวกัน" (เช่นมีทั้งหมด nการสังเกตการณ์ดั้งเดิมโดยไม่เกิดซ้ำ บัญชีนี้เป็นวิธีการสั่งซื้อตัวอย่างที่เราเริ่มต้นด้วย)

ตัวอย่างเช่นการสังเกตสามรายการ a, b และ c คุณมีตัวอย่างที่เป็นไปได้ 27 ข้อ:

aaa aab aac aba abb abc aca acb acc 
baa bab bac bba bbb bbc bca bcb bcc 
caa cab cac cba cbb cbc cca ccb ccc 

หกในนั้นประกอบด้วยหนึ่ง, a, b และ c

ดังนั้น n!/nn ความน่าจะเป็นที่จะได้ค่าตัวอย่างดั้งเดิมกลับมา

นอกเหนือ - การประมาณความน่าจะเป็นอย่างรวดเร็ว:

พิจารณาว่า :

2π nn+12อี-nn!อี nn+12อี-n

ดังนั้น

2π n12อี-nn!/nnอี n12อี-n

ด้วยขอบเขตที่ต่ำกว่าจะเป็นค่าปกติที่กำหนดไว้สำหรับการประมาณค่า Stirling (ซึ่งมีข้อผิดพลาดสัมพัทธ์ต่ำสำหรับขนาดใหญ่ n)

[Gosper ได้แนะนำให้ใช้n!(2n+13)πnnอี-n ซึ่งจะทำให้การประมาณ (2n+13)πอี-n สำหรับความน่าจะเป็นนี้ซึ่งทำงานได้ดีพอสมควรถึง n=3หรือแม้กระทั่งลงไป n=1 ขึ้นอยู่กับว่าเกณฑ์ของคุณเข้มงวดแค่ไหน]


(การตอบสนองต่อความคิดเห็น :) ความน่าจะเป็นที่จะไม่ได้รับการสังเกตโดยเฉพาะในตัวอย่างที่กำหนดคือ (1-1n)n ซึ่งสำหรับขนาดใหญ่ n ประมาณ อี-1.

สำหรับรายละเอียดดู
เหตุใดตัวอย่าง bootstrap โดยเฉลี่ยจึงมีการสังเกตประมาณสองในสาม


ขอบคุณ! ในฐานะที่เป็นจุดสนใจอะไรคือโอกาสที่จะไม่ได้รับรายการเฉพาะในตัวอย่าง? เช่นกับการกระจายของa,, คุณให้มีโอกาส 8/27 ที่จะไม่ได้รับตัวอย่างด้วย a
Jayant.M.M

1
มีอยู่ในคำตอบอื่น ๆ ในเว็บไซต์แล้ว แต่ฉันได้เพิ่มไว้ด้านบน (สั้น ๆ )
Glen_b -Reinstate Monica

1
นี่คือความน่าจะเป็นที่ได้ตัวอย่างซึ่งเป็นการเปลี่ยนรูปของตัวอย่างเดิม แต่ความน่าจะเป็นที่จะได้ลำดับที่แน่นอนเหมือนกันในตัวอย่างดั้งเดิม (ดังนั้นองค์ประกอบเดียวกันในลำดับเดียวกัน) คือ(1n)n. ขวา?
DeltaIV

1
@deltaiv ใช่เพียงหนึ่งในนั้น n!การจัดเรียงอยู่ในลำดับเดิม
Glen_b -Reinstate Monica

1
การประมาณค่าของ Gosper ใช้งานไม่ได้แม้กระทั่งถึง n=1ไม่ใช่แค่ลงไป n=3? ฉันคิดว่า 0.499 (สำหรับn=2) เป็นค่าประมาณที่ดีถึง 0.5 และ 0.996 (สำหรับ n=1) ก็ค่อนข้างใกล้เคียงกับ 1.0
Karl Ove Hufthammer
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.