มีชื่อสำหรับ bootstrapping ประเภทนี้หรือไม่?


9

พิจารณาการทดสอบกับผู้เข้าร่วมหลายคนแต่ละคนวัดหลายครั้งในสองเงื่อนไข รูปแบบเอฟเฟกต์แบบผสมสามารถกำหนดได้ (ใช้ไวยากรณ์lme4 ) เป็น:

fit = lmer(
    formula = measure ~ (1|participant) + condition
)

ตอนนี้บอกว่าฉันต้องการสร้างช่วงความมั่นใจบูตสแตรปสำหรับการคาดการณ์ของรุ่นนี้ ฉันคิดว่าฉันคิดวิธีที่ง่ายและมีประสิทธิภาพในการคำนวณและฉันแน่ใจว่าฉันไม่ใช่คนแรกที่คิด แต่ฉันมีปัญหาในการค้นหาสิ่งพิมพ์ก่อนหน้าใด ๆ ที่อธิบายวิธีการนี้ นี่มันคือ:

  1. พอดีกับรุ่น (ตามด้านบน) เรียกสิ่งนี้ว่า "แบบจำลองดั้งเดิม"
  2. รับการทำนายจากแบบจำลองต้นฉบับเรียกว่า "การคาดการณ์ดั้งเดิม" เหล่านี้
  3. รับส่วนที่เหลือจากรูปแบบดั้งเดิมที่เชื่อมโยงกับการตอบสนองแต่ละครั้งจากผู้เข้าร่วมแต่ละคน
  4. resample the residual, สุ่มตัวอย่างผู้เข้าร่วมที่มีการแทนที่
  5. พอดีกับโมเดลเอฟเฟกต์แบบเชิงเส้นที่มีข้อผิดพลาดแบบเกาส์กับส่วนที่เหลือเรียกสิ่งนี้ว่า "โมเดลชั่วคราว"
  6. คำนวณการทำนายจากตัวแบบชั่วคราวสำหรับแต่ละเงื่อนไข (การคาดการณ์เหล่านี้จะใกล้เคียงกับศูนย์มาก) เรียกสิ่งเหล่านี้ว่า "การทำนายระหว่างกาล"
  7. เพิ่มการคาดการณ์ระหว่างกาลลงในการคาดการณ์ดั้งเดิมเรียกผลการค้นหา "resample ทำนาย"
  8. ทำซ้ำขั้นตอนที่ 4 ถึง 7 หลาย ๆ ครั้งสร้างการกระจายการคาดการณ์ตัวอย่างสำหรับแต่ละเงื่อนไขซึ่งครั้งหนึ่งสามารถคำนวณ CIs ได้

ฉันเคยเห็น"ขั้นตอนการตกค้างส่วนที่เหลือ"ในบริบทของการถดถอยแบบง่าย ๆ (เช่นไม่ใช่แบบผสม) ที่มีการสุ่มตัวอย่างส่วนที่เหลือเป็นหน่วยของการ resampling แล้วเพิ่มการคาดการณ์ของรูปแบบเดิมก่อนที่จะติดตั้งรุ่นใหม่ในแต่ละรอบ bootstrap แต่ดูเหมือนว่าจะค่อนข้างแตกต่างจากวิธีการที่ฉันอธิบายว่าที่เหลือไม่ถูก resampled ผู้คนและหลังจากโมเดลระหว่างกาลนั้นได้รับการทำนายแบบดั้งเดิม คุณลักษณะสุดท้ายนี้มีประโยชน์ด้านดีมากโดยไม่ว่าความซับซ้อนของแบบจำลองดั้งเดิมจะเป็นแบบจำลองแบบผสมระหว่างเกาส์ซึ่งสามารถทำได้เร็วกว่าในบางกรณี ตัวอย่างเช่นเมื่อเร็ว ๆ นี้ฉันมีข้อมูลทวินามและตัวแปรทำนาย 3 ตัวซึ่งหนึ่งในนั้นฉันสงสัยว่าจะทำให้เกิดผลกระทบที่ไม่ใช่เชิงเส้นอย่างรุนแรงดังนั้นฉันจึงต้องใช้Generalized Additive Mixed Modelingโดยใช้ฟังก์ชันลิงค์ทวินาม การติดตั้งแบบจำลองดั้งเดิมในกรณีนี้ใช้เวลามากกว่าหนึ่งชั่วโมงในขณะที่การปรับแบบเกาส์ LMM ในการทำซ้ำแต่ละครั้งใช้เวลาเพียงไม่กี่วินาที

ฉันไม่ต้องการอ้างสิทธิ์ในลำดับความสำคัญนี้หากเป็นกระบวนการที่ทราบแล้วดังนั้นฉันจะขอบคุณมากหากใครสามารถให้ข้อมูลเกี่ยวกับสถานที่ซึ่งอาจอธิบายไว้ก่อนหน้านี้ (นอกจากนี้หากมีปัญหาใด ๆ ที่จ้องมองด้วยวิธีนี้โปรดแจ้งให้เราทราบ!)


1
เพียงแค่แสดงความคิดเห็นด้านข้าง แต่อาจมีความเกี่ยวข้อง Peter McCullagh มีกระดาษในBernoulliที่ซึ่งเขาแสดงให้เห็นว่าไม่มี bootstrap อย่างถูกต้องประเมินความแปรปรวนในแบบจำลองลักษณะพิเศษแบบสุ่ม
พระคาร์ดินัล

@ Mike (+1) นั่นเป็นคำถามที่เขียนได้ดีมาก!
CHL

1
เหตุใดคุณจะไม่ลองผู้เข้าร่วมที่มีการแทนที่แล้วลองสุ่มข้อมูลอีกครั้ง ดูเหมือนว่าจะรักษาวิญญาณของโมเดลหลายระดับได้มากขึ้นโดยมีการแจกจ่ายหนึ่งซ้อนอยู่ภายในอีกรุ่นหนึ่ง อีกประเด็นหนึ่งคือว่ามีปัญหาที่อาจเกิดขึ้นกับข้อมูลทวินามเพราะปลายสุดของตัวอย่างจะมีโอกาสน้อยที่จะมาบรรจบกัน
John

@ จอห์น: ฉันชอบที่จะ resampling ส่วนที่เหลือเพราะ (1) มันจะเร็วกว่าสำหรับเมื่อแบบเดิมจะลำบากในการประมาณและ (2) มันจะให้ CIs ที่ได้ลบความแปรปรวนที่เกิดจากความแปรปรวนระหว่างผู้เข้าร่วม # 2 หมายความว่าคุณไม่จำเป็นต้องสร้างหลาย ๆ แปลงเมื่อคุณต้องการแสดงข้อมูลดิบและผลกระทบซ้ำ ๆ คุณสามารถพล็อต CIs ที่ลบล้างความแปรปรวนเหล่านี้กับข้อมูลดิบและพวกเขาจะเหมาะสมสำหรับการเปรียบเทียบเงื่อนไขที่ทำซ้ำภายในบุคคล ได้รับอาจมีความสับสนในความหมายของ CIs เช่นนี้ แต่นั่นคือสิ่งที่รูปคำอธิบายภาพสำหรับ
Mike Lawrence

@ จอห์น: คุณช่วยอธิบายถึงความกลัวของคุณเกี่ยวกับการบังคับใช้วิธีการนี้กับข้อมูลทวินามได้หรือไม่?
Mike Lawrence

คำตอบ:


-1

หนังสือวิธี Bootstrap ของฉันรุ่นที่ 2 มีบรรณานุกรมขนาดใหญ่มากถึงปี 2007 ดังนั้นแม้ว่าฉันจะไม่ครอบคลุมเนื้อหาในหนังสือ แต่การอ้างอิงอาจอยู่ในบรรณานุกรม แน่นอนว่าการค้นหาโดย Google ด้วยคำสำคัญที่เหมาะสมอาจดีกว่า Freedman, Peters และ Navidi ทำการ bootstrapping เพื่อทำนายการถดถอยเชิงเส้นและแบบจำลองเศรษฐมิติ แต่ฉันไม่แน่ใจว่าเกิดอะไรขึ้นกับตัวแบบผสม Stine's 1985 JASA paper Bootstrap ช่วงการทำนายสำหรับการถดถอยเป็นสิ่งที่คุณจะพบว่าน่าสนใจมากถ้าคุณยังไม่ได้เห็นมัน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.