Bootstrap: การประเมินอยู่นอกช่วงความมั่นใจ


10

ฉันทำการ bootstrapping ด้วยโมเดลผสม (มีหลายตัวแปรที่มีการโต้ตอบและหนึ่งตัวแปรสุ่ม) ฉันได้รับผลลัพธ์นี้ (บางส่วนเท่านั้น):

> boot_out

ORDINARY NONPARAMETRIC BOOTSTRAP

Call:
boot(data = a001a1, statistic = bootReg, R = 1000)

Bootstrap Statistics :
          original        bias     std. error
t1*   4.887383e+01 -1.677061e+00 4.362948e-01
t2*   3.066825e+01  1.264024e+00 5.328387e-01
t3*   8.105422e+01  2.368599e+00 6.789091e-01
t4*   1.620562e+02  4.908711e+00 1.779522e+00
......

ตอนนี้ฉันต้องการได้รับช่วงความเชื่อมั่นสำหรับการสกัดกั้น:

> boot.ci(boot_out,type=c("norm","basic","perc"), index=1)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 1000 bootstrap replicates

CALL : 
boot.ci(boot.out = boot_out, type = c("norm", "basic", 
"perc"), index = 1)

Intervals : 
Level      Normal              Basic              Percentile     
95%   (49.70, 51.41 )   (49.70, 51.41 )   (46.34, 48.05 )  
Calculations and Intervals on Original Scale

ค่าประมาณที่แก้ไขโดยประมาณคือ:

48.873 -1.677
1 47.196

ปัญหาที่ฉันมีคือ CI ปกติและพื้นฐานอยู่นอกการประมาณการ (ดั้งเดิมและถูกแก้ไข) ฉันแค่สงสัยว่าจะรับมือยังไง

อัปเดต 1:
ต่อไปนี้เป็นคำถามที่คล้ายกันพร้อมคำตอบมากมาย


2
เพียงความเห็น: Efron & Tibshirani (1993) ในหนังสือคลาสสิกกำลังโต้เถียงกันมากกว่าการแก้ไขอคติบอกว่ามันเป็น "อันตราย" และ "ปัญหา" การฝึกฝนที่อาจนำไปสู่ข้อผิดพลาดมาตรฐานที่เพิ่มขึ้น
ทิม

@Tim ขอบคุณสำหรับความคิดเห็นของคุณ ฉันจะดูหนังสือ บางทีวิธีแก้ไขคือใช้การประมาณและและ bootstrap se * เพื่อคำนวณช่วงความมั่นใจ ในกรณีของฉันอคติส่งผลกระทบต่อการประมาณการเพียงเล็กน้อย
giordano

คำตอบ:


1

ความยากลำบากที่คุณเผชิญอยู่นั้นมาจากคณิตศาสตร์โดยนัย ศูนย์กลางของตัวประมาณตำแหน่งหรือตัวประมาณช่วงเวลาสามารถคิดได้ว่าเป็นการลดฟังก์ชั่นค่าใช้จ่ายให้น้อยกว่าการแจกแจง ค่าเฉลี่ยตัวอย่างเหนือ Gaussian ลดการสูญเสียกำลังสองในขณะที่มัธยฐานลดฟังก์ชันการสูญเสียเชิงเส้นแบบสัมบูรณ์เหนือ Gaussian แม้ว่าในประชากรที่ตั้งอยู่ในจุดเดียวกันพวกเขาจะค้นพบโดยใช้ฟังก์ชั่นค่าใช้จ่ายที่แตกต่างกัน

เราให้อัลกอริทึมแก่คุณและพูดว่า "ทำสิ่งนี้" แต่ก่อนที่อัลกอริทึมจะได้รับการพัฒนาให้ใครบางคนแก้ไขปัญหาการปรับให้เหมาะสม

คุณได้ใช้ฟังก์ชั่นต้นทุนที่แตกต่างกันสี่แบบเพื่อให้คุณมีสามช่วงเวลาและประมาณค่าจุด เนื่องจากฟังก์ชั่นค่าใช้จ่ายแตกต่างกันพวกเขาจึงให้คะแนนและช่วงเวลาต่างกัน ไม่มีอะไรที่ต้องทำเกี่ยวกับมันยกเว้นการรวมวิธีการด้วยตนเอง

คุณจำเป็นต้องค้นหาเอกสารอ้างอิงและดูที่โค้ดอ้างอิงเพื่อทำความเข้าใจว่าเอกสารใดจับคู่กับปัญหาประเภทใด

ขอโทษที่พูดแบบนี้ แต่คุณถูกซอฟต์แวร์ทรยศ มันใช้งานได้และโดยเฉลี่ยก็ใช้งานได้ดี แต่คุณได้รับตัวอย่างที่ซอฟต์แวร์ไม่ทำงาน หรือค่อนข้างจะทำงานได้อย่างสมบูรณ์แบบและคุณจำเป็นต้องใช้วิธีการของคุณย้อนหลังผ่านวรรณกรรมเพื่อตรวจสอบสิ่งที่มันกำลังทำจริงๆ


ขอบคุณสำหรับมันทำงานได้ดีและโดยเฉลี่ยนี่ใช้งานได้ดี แต่คุณได้รับตัวอย่างที่ซอฟต์แวร์ไม่ทำงานและข้อมูลเชิงลึกอื่น ๆ อันที่จริงตัวอย่างนั้นแปลกที่ฉันต้องการใช้บู๊ทสแตรปเพื่อคำนวณ CI เห็นได้ชัดว่าวิธีนี้ดูเหมือนจะไม่ง่ายอย่างที่ปรากฏ
giordano
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.