คำถามนี้ถูกกระตุ้นโดยสิ่งที่ฉันอ่านในหนังสือเรียนระดับบัณฑิตศึกษานี้และยังมีการได้ยิน (อิสระ) ระหว่างการนำเสนอนี้ในงานสัมมนาทางสถิติ ในทั้งสองกรณีคำสั่งนั้นเป็นไปตามเส้นของ "เนื่องจากขนาดตัวอย่างมีขนาดค่อนข้างเล็กเราจึงตัดสินใจทำการประมาณค่าผ่าน bootstrap แทน (หรือพร้อมกับ) วิธีการพารามิเตอร์นี้ "
พวกเขาไม่ได้ลงรายละเอียด แต่อาจเหตุผลดังนี้วิธีถือว่าข้อมูลตามบางพารากระจายD ในความเป็นจริงการกระจายไม่ตรงDแต่ก็โอเคตราบใดที่ขนาดตัวอย่างใหญ่พอ เนื่องจากในกรณีนี้ขนาดตัวอย่างเล็กเกินไปลองเปลี่ยนเป็น bootstrap (ที่ไม่ใช่พารามิเตอร์) ที่ไม่ได้ตั้งสมมติฐานการกระจาย แก้ไขปัญหา!
ในความคิดของฉันนั่นไม่ใช่สิ่งที่ bootstrap มีไว้สำหรับ นี่คือวิธีที่ฉันเห็น: bootstrap สามารถให้ขอบเมื่อเห็นได้ชัดว่ามีข้อมูลเพียงพอหรือไม่ แต่ไม่มีวิธีแก้ปัญหาแบบปิดเพื่อรับข้อผิดพลาดมาตรฐานค่า p และสถิติที่คล้ายกัน ตัวอย่างคลาสสิกคือการได้รับ CI สำหรับค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับตัวอย่างจากการแจกแจงปกติแบบ bivariate: การแก้ปัญหาแบบปิดมีอยู่ แต่มันซับซ้อนมากที่ bootstrapping ง่าย อย่างไรก็ตามไม่มีสิ่งใดที่บ่งบอกว่า bootstrap สามารถช่วยได้ด้วยขนาดตัวอย่างที่เล็ก
การรับรู้ของฉันถูกต้องหรือไม่
หากคุณพบว่าคำถามนี้น่าสนใจมีคำถาม bootstrap ที่เฉพาะเจาะจงมากขึ้นจากฉัน:
Bootstrap: ปัญหาการ overfitting
ป.ล. ฉันไม่สามารถช่วยแบ่งปันหนึ่งตัวอย่างที่น่าเกรงขามของ "วิธีบูตสแตรป" ฉันไม่ได้เปิดเผยชื่อผู้แต่ง แต่เขาเป็นหนึ่งใน "คนรุ่นเก่า" ที่เขียนหนังสือเกี่ยวกับการเงินเชิงปริมาณในปี 2547 ตัวอย่างนี้นำมาจากที่นั่น
ลองพิจารณาปัญหาต่อไปนี้: สมมติว่าคุณมีสินทรัพย์ 4 รายการและการสังเกตผลตอบแทน 120 เดือนต่อครั้ง เป้าหมายคือการสร้าง cdf 4 มิติร่วมของผลตอบแทนรายปี แม้จะเป็นทรัพย์สินชิ้นเดียวงานก็ดูเหมือนจะบรรลุได้ยากด้วยการสังเกตเพียง 10 ปีเท่านั้นนับประสาประมาณ 4 มิติ cdf แต่ไม่ต้องกังวล“ bootstrap” จะช่วยคุณออก: นำการสังเกตแบบ 4 มิติทั้งหมดที่มีอยู่มาทำการสุ่มตัวอย่างที่ 12 ด้วยการแทนที่ ทำซ้ำ 1,000 ครั้งและแท้จริงแล้วดูเถิดคุณมี“ ตัวอย่างบูตสแตรป” ของผลตอบแทน 1,000 ครั้งต่อปี ใช้สิ่งนี้เป็นตัวอย่าง iid ขนาด 1,000 เพื่อจุดประสงค์ในการประมาณค่า cdf หรือการอนุมานอื่น ๆ ที่สามารถดึงมาจากประวัติพันปี