การรับและตีความช่วงความเชื่อมั่นที่บูตสแตรปจากข้อมูลลำดับชั้น


10

ฉันสนใจที่จะรับช่วงความมั่นใจในการบูตที่มีปริมาณ X เมื่อปริมาณนี้วัดได้ 10 ครั้งในแต่ละ 10 คน

วิธีหนึ่งคือการได้รับค่าเฉลี่ยต่อบุคคลจากนั้น bootstrap หมายถึง (เช่น resample วิธีที่มีการเปลี่ยน)

อีกวิธีคือทำตามขั้นตอนต่อไปนี้ของขั้นตอน bootstrapping: ในแต่ละบุคคลให้ทดลองการสังเกตซ้ำของบุคคลที่ 10 ด้วยการแทนที่จากนั้นคำนวณค่าเฉลี่ยใหม่สำหรับบุคคลนั้นและคำนวณค่าเฉลี่ยกลุ่มใหม่ ในวิธีการนี้แต่ละบุคคลที่สังเกตเห็นในชุดข้อมูลดั้งเดิมจะมีส่วนร่วมกับค่าเฉลี่ยของกลุ่มในการวนซ้ำของโพรซีเดอร์บูตสแตรปทุกครั้ง

ในที่สุดวิธีที่สามคือการรวมสองวิธีข้างต้น: resample บุคคลแล้ว resample ภายในบุคคลเหล่านั้น วิธีนี้แตกต่างจากวิธีการก่อนหน้านี้ที่อนุญาตให้บุคคลเดียวกันมีส่วนร่วมคูณกับค่าเฉลี่ยของกลุ่มในการทำซ้ำแต่ละครั้งเนื่องจากการบริจาคแต่ละครั้งถูกสร้างขึ้นผ่านขั้นตอนการสุ่มตัวอย่างอิสระการมีส่วนร่วมเหล่านี้อาจแตกต่างกันเล็กน้อย

ในทางปฏิบัติฉันพบว่าวิธีการเหล่านี้ให้ผลการประมาณที่แตกต่างกันสำหรับช่วงความมั่นใจ (เช่นชุดข้อมูลหนึ่งฉันพบว่าวิธีที่สามให้ช่วงความเชื่อมั่นที่มากกว่าช่วงสองวิธีแรก) ดังนั้นฉันสงสัยว่าแต่ละสิ่งอาจเป็นอย่างไร ตีความเพื่อเป็นตัวแทน

คำตอบ:


7

วิธีแรกของคุณเกี่ยวกับระหว่าง S CI หากคุณต้องการวัดค่าภายใน S นั่นเป็นวิธีที่ผิด

วิธีที่สองจะสร้างภายใน S CI ที่จะใช้กับบุคคลเหล่านั้นเท่านั้น

วิธีสุดท้ายคือวิธีที่ถูกต้องสำหรับภายใน S CI การเพิ่มขึ้นของ CI ใด ๆ เป็นเพราะ CI ของคุณเป็นตัวแทนของ CI มากกว่าที่สามารถนำไปใช้กับประชากรแทนที่จะเป็น 10 S


6

ตาม Davison และ Hinckley ("วิธี Bootstrap และการประยุกต์ใช้", 1997, Section 3.8) อัลกอริธึมที่สามนั้นเป็นแบบอนุรักษ์นิยม พวกเขาสนับสนุนแนวทางที่สี่: เพียงแค่สุ่มตัวอย่างอีกครั้ง


1
น่าสนใจฉันจะต้องดูการอ้างอิงนั้น คุณแน่ใจหรือว่าคุณหมายถึง "Fourth" approach รายการแรกที่ฉันอธิบายดูเหมือนจะอธิบายว่า
Mike Lawrence

1
ใช่มันทำ แต่มันอธิบายการ resampling ค่าเฉลี่ยของหัวเรื่อง ผู้สนับสนุน D&H ทำการสุ่มตัวอย่างอีกครั้งและปรับแบบจำลองดั้งเดิมให้เหมาะสม
Andrew Robinson

2
คุณอาจต้องการดูการตีพิมพ์เมื่อเร็ว ๆ นี้: Ren, Shiquan, Lai, Hong, Tong, Wenjing, Aminzadeh, Mostafa, Hou, Xuezhang และ Lai, Shenghan (2010) 'การบูตสต็อกแบบ Nonparametric สำหรับข้อมูลลำดับขั้น' 37: 9, 1487 - 1498
Andrew Robinson

2
@ ไมค์: resampling clsuter ทั้งหมดเป็นสิ่งที่นักสถิติการสำรวจทำใน bootstraps ของพวกเขา นั่นเป็นขั้นตอนที่แตกต่างกันซึ่งจะเทียบเท่ากับวิธี "ครั้งแรก" ของคุณหาก (i) คุณประเมินค่าเฉลี่ยเท่านั้นและ (ii) ข้อมูลไม่ได้ถ่วงและสมดุล ดูเพิ่มเติมciteulike.org/user/ctacmo/article/1334050 , citeulike.org/user/ctacmo/article/1475866 , citeulike.org/user/ctacmo/article/582039
StasK
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.