หากคู่การตอบสนองของผู้ทำนายได้มาจากกลุ่มตัวอย่างโดยสุ่มมันปลอดภัยที่จะใช้รูปแบบการสุ่มตัวอย่าง case / random-x / your-first หากมีการควบคุมตัวทำนายหรือค่าของตัวทำนายถูกตั้งค่าโดยผู้ทดลองคุณอาจพิจารณาใช้รูปแบบการสุ่มตัวอย่างที่เหลือ / ตามโมเดล / คงที่ / x- ของคุณ - วินาที
ทั้งสองแตกต่างกันอย่างไร การแนะนำให้รู้จักกับ bootstrap กับแอปพลิเคชันใน Rโดย Davison และ Kounen มีการอภิปรายที่เกี่ยวข้องกับคำถามนี้ (ดูหน้า 9) โปรดดูรหัส R ในภาคผนวกนี้โดย John Foxโดยเฉพาะฟังก์ชั่น boot.huber บนหน้า 5 สำหรับชุดรูปแบบสุ่ม -x และ boot.huber.fixed บนหน้า 10 สำหรับชุดรูปแบบคงที่ x ในขณะที่ในบันทึกการบรรยายโดย Shaliziทั้งสองรูปแบบจะถูกนำไปใช้กับชุดข้อมูล / ปัญหาที่แตกต่างกันภาคผนวกของ Fox แสดงให้เห็นถึงความแตกต่างเพียงเล็กน้อยทั้งสองรูปแบบที่มักจะทำ
เมื่อใดที่ทั้งสองคาดว่าจะให้ผลลัพธ์ใกล้เคียงกัน สถานการณ์หนึ่งคือเมื่อแบบจำลองการถดถอยถูกระบุอย่างถูกต้องเช่นไม่มีความไม่เชิงเส้นที่ไม่ได้ถอดรหัสและสมมติฐานการถดถอยปกติ (เช่นข้อผิดพลาดของ iid ไม่มีค่าผิดปกติ) ดูบทที่ 21 ของหนังสือของ Fox (ซึ่งภาคผนวกข้างต้นที่มีรหัส R เป็นของทางอ้อม) โดยเฉพาะการอภิปรายในหน้า 598 และแบบฝึกหัด 21.3 ชื่อ "สุ่มกับ resampling สุ่มในการถดถอย" เพื่ออ้างอิงจากหนังสือ
By randomly reattaching resampled residuals to fitted values, the [fixed-x/model-based]
procedure implicitly assumes that the errors are identically distributed. If, for
example, the true errors have non-constant variance, then this property will not be
reflected in the resampled residuals. Likewise, the unique impact of a high-leverage
outlier will be lost to the resampling.
นอกจากนี้คุณยังจะได้เรียนรู้จากการอภิปรายว่าเหตุใด fixed-x bootstrap โดยปริยายถือว่ารูปแบบการทำงานของโมเดลนั้นถูกต้อง (แม้ว่าจะไม่มีการสันนิษฐานเกี่ยวกับรูปร่างของการแจกแจงข้อผิดพลาด)
ดูคำบรรยายนี้12 เรื่องสำหรับ Society of Actuaries ในไอร์แลนด์โดย Derek Bain นอกจากนี้ยังมีภาพประกอบของสิ่งที่ควรพิจารณา "ผลลัพธ์เดียวกัน":
The approach of re-sampling cases to generate pseudo data is the more usual form of
bootstrapping. The approach is robust in that if an incorrect model is fitted an
appropriate measure of parameter meter uncertainty is still obtained. However re
sampling residuals is more efficient if the correct model has been fitted.
The graphs shows both approaches in estimating the variance of a 26 point data sample
mean and a 52 point sample mean. In the larger sample the two approaches are
equivalent.