มีวิธีการอย่างน้อยสาม (อาจมากกว่า) ในการดำเนินการ bootstrap สำหรับการถดถอยเชิงเส้นด้วยข้อมูลที่เป็นอิสระ แต่ไม่ได้กระจายข้อมูลเหมือนกัน (หากคุณมีการละเมิดอื่น ๆ ของสมมติฐาน "มาตรฐาน" เช่นเนื่องจากการบันทึกอัตโนมัติด้วยข้อมูลอนุกรมเวลาหรือการจัดกลุ่มเนื่องจากการออกแบบการสุ่มตัวอย่างสิ่งต่าง ๆ มีความซับซ้อนมากขึ้น)
- คุณสามารถ resample สังเกตโดยรวมคือนำตัวอย่างกับการเปลี่ยนของจากข้อมูลเดิม\} นี้จะเป็น asymptotically เทียบเท่ากับการดำเนินการแก้ไข heteroskedasticity ฮิวขาว(y∗j,x∗j){(yi,xi)}
- คุณสามารถใส่แบบจำลองของคุณได้รับส่วนที่เหลือและลองสุ่มตัวอย่างอย่างอิสระและโดยแทนที่จากการแจกแจงเชิงประจักษ์ แบ่งรูปแบบ heteroskedasticity ถ้ามีดังนั้นฉันสงสัยว่า bootstrap นี้สอดคล้องกันei=yi−x′iβ^x∗je∗j
- คุณสามารถดำเนินการbootstrap wildที่คุณลองตัวอย่างสัญลักษณ์ที่เหลือซึ่งควบคุมช่วงเวลาที่สองตามเงื่อนไข (และด้วยการปรับแต่งเพิ่มเติมบางอย่างสำหรับช่วงเวลาที่สามตามเงื่อนไข) นี่จะเป็นขั้นตอนที่ฉันอยากจะแนะนำ (หากคุณสามารถเข้าใจและปกป้องผู้อื่นเมื่อถูกถามว่า "คุณทำอะไรเพื่อควบคุมความแตกต่างจาก heteroskedasticity? คุณรู้ได้อย่างไรว่ามันทำงานได้?")
การอ้างอิงขั้นสุดท้ายคือวู (1986)แต่พงศาวดารไม่ตรงกับการอ่านหนังสือภาพ
ปรับปรุงตามคำถามติดตามของ OP ถามในความคิดเห็น:
จำนวนซ้ำของฉันดูใหญ่สำหรับฉัน การอภิปรายที่ดีเท่านั้นพารามิเตอร์บูตนี้ที่ฉันรู้อยู่ในEfron & Tibshirani ของแนะนำหนังสือ
ฉันเชื่อว่าการแก้ไขที่คล้ายกันโดยทั่วไปสำหรับการขาดสมมติฐานการกระจายสามารถรับได้ด้วยข้อผิดพลาดมาตรฐาน Huber / White หนังสือเรียนของ Cameron & Triverdiพูดถึงความเท่าเทียมกันของ bootstrap คู่และ White's heteroskedasticity correction ความเท่าเทียมกันดังต่อไปนี้จากทฤษฎีความทนทานทั่วไปสำหรับ -estimates: การแก้ไขทั้งสองนี้มีจุดมุ่งหมายเพื่อแก้ไขการตั้งสมมติฐานการกระจายสิ่งที่พวกเขาอาจจะเป็นกับสมมติฐานที่น้อยที่สุดของช่วงเวลาที่เหลือของวินาทีและความเป็นอิสระระหว่างการสังเกต ดูเพิ่มเติมHausman และ Palmer (2012)ในการเปรียบเทียบที่เฉพาะเจาะจงมากขึ้นในตัวอย่าง จำกัด (รุ่นของเอกสารนี้มีอยู่ในหนึ่งในเว็บไซต์ของผู้เขียนM) ในการเปรียบเทียบระหว่างการบูตและการแก้ไข heteroskedasticity