มีปัญหาบางอย่างที่พบได้ทั่วไปในการประเมินความเชื่อมั่นแบบ nonparametric bootstrapping (CI) บางปัญหาที่มีทั้ง "empirical" (เรียกว่า "พื้นฐาน" ในการboot.ci()
ทำงานของboot
แพ็คเกจ R และอ้างอิง 1 ) และ CI "เปอร์เซ็นไทล์" (ตามที่อธิบายไว้ในข้อ 2 ) และบางอย่างที่สามารถทำให้รุนแรงขึ้นด้วยCI เปอร์เซ็นไทล์
TL; DR : ในบางกรณีการประมาณค่า bootstrap CI เปอร์เซ็นไทล์อาจทำงานได้อย่างพอเหมาะ แต่ถ้าสมมติฐานบางอย่างไม่ได้เก็บไว้ CI เปอร์เซ็นไทล์อาจเป็นตัวเลือกที่แย่ที่สุด การประมาณ bootstrap CI อื่น ๆ สามารถเชื่อถือได้มากขึ้นพร้อมการครอบคลุมที่ดีกว่า ทั้งหมดอาจเป็นปัญหาได้ ดูแปลงวินิจฉัยเช่นเคยช่วยหลีกเลี่ยงข้อผิดพลาดที่อาจเกิดขึ้นเพียงแค่รับเอาท์พุทของชุดคำสั่งซอฟต์แวร์
การตั้งค่า Bootstrap
โดยทั่วไปต่อไปนี้คำศัพท์และข้อโต้แย้งของการอ้างอิง 1เรามีตัวอย่างของข้อมูลมาจากตัวแปรสุ่มอิสระและกันกระจายร่วมฟังก์ชั่นการแจกแจงสะสมFฟังก์ชั่นการกระจายเชิงประจักษ์ (EDF) สร้างจากตัวอย่างข้อมูลที่F เรามีความสนใจในลักษณะของประชากรประมาณโดยสถิติที่มีค่าในตัวอย่างเป็นเสื้อเราอยากจะทราบวิธีที่ดีประมาณการตัวอย่างเช่นการกระจายของtheta)Y ฉัน F F θY1, . . . , ynYผมFF^θเสื้อT θ ( T - θ )Tเสื้อTθ( T- θ )
nonparametric ใช้บูตสุ่มตัวอย่างจาก EDFเพื่อสุ่มตัวอย่างเลียนแบบจาก , การกลุ่มตัวอย่างแต่ละขนาดด้วยการเปลี่ยนจากy_iค่าที่คำนวณจากตัวอย่าง bootstrap จะแสดงด้วย "*" ยกตัวอย่างเช่นสถิติคำนวณตัวอย่างบูตเจมีค่า * FRnF^FRn T T * JYผมTT* * * *J
เชิงประจักษ์ / ขั้นพื้นฐานเมื่อเทียบกับเปอร์เซ็นต์บูต bootstrap CIs
เชิงประจักษ์ / bootstrap พื้นฐานใช้การกระจายของในกลุ่มตัวอย่าง bootstrapจากเพื่อประเมินการกระจายตัวของภายในประชากรที่อธิบายโดยเอง ค่าประมาณ CI ของมันจึงขึ้นอยู่กับการกระจายตัวของโดยที่คือค่าของสถิติในตัวอย่างดั้งเดิมR F ( T - θ )( T* * * *- t )RF^( T- θ )( T * - T ) TF( T* * * *- t )เสื้อ
วิธีการนี้ใช้หลักการพื้นฐานของการบูตสแตรป ( อ้างอิงที่ 3 ):
ประชากรคือกลุ่มตัวอย่างเนื่องจากกลุ่มตัวอย่างเป็นกลุ่มตัวอย่างบูตสแตรป
บูตสแตรปเปอร์ไทล์แทนใช้ quantiles ของค่าเพื่อกำหนด CI ประมาณการเหล่านี้สามารถแตกต่างกันมากถ้ามีเอียงหรืออคติในการกระจายของtheta) ( T - θ )T* * * *J( T- θ )
บอกว่ามีอคติที่สังเกตได้เช่นนั้น:
ˉ T ∗ = t + B ,B
T¯* * * *= เสื้อ+ B ,
ที่เป็นค่าเฉลี่ยของ * สำหรับ concreteness ให้บอกว่าเปอร์เซ็นไทล์ที่ 5 และ 95 ของแสดงเป็นและโดยที่เป็นค่าเฉลี่ยของตัวอย่าง bootstrap และแต่ละตัวมีค่าเป็นบวกและอาจแตกต่างกันเพื่อให้เอียง การประมาณค่าเปอร์เซ็นไทล์ตามอันดับที่ 5 และ 95 จะได้รับโดยตรงตามลำดับโดย:T ∗ j T ∗ j ˉ T ∗-δ1 ˉ T ∗+δ2T¯* * * *T* * * *JT* * * *JT¯* * * *- δ1T¯* * * *+ δ2δ1,δ2T¯* * * *δ1, δ2
T¯* * * *- δ1= t + B - δ1; T¯* * * *+ δ2= t + B + δ2.
การประมาณค่า CI เปอร์เซ็นไทล์ที่ 5 และ 95 ตามวิธีการบูต / สแตรปพื้นฐานจะอ้างอิงตามลำดับ ( Ref. 1 , eq. 5.6, หน้า 194):
2 t - ( T¯* * * *+ δ2) = t - B - δ2; 2 t - ( T¯* * * *- δ1) = t - B + δ1.
ดังนั้นCIs ที่ยึดตามเปอร์เซ็นต์ไทล์จะได้รับอคติผิด ๆ และพลิกทิศทางของตำแหน่งที่ไม่สมมาตรของความเชื่อมั่นที่ จำกัด รอบจุดศูนย์กลางสองเท่า เปอร์เซ็นต์ CIs จาก bootstrapping ในกรณีเช่นนี้ไม่ได้เป็นตัวแทนกระจายของtheta)( T−θ)
พฤติกรรมนี้แสดงให้เห็นอย่างชัดเจนในหน้านี้สำหรับการบูตสถิติเพื่อลำเอียงในทางลบดังนั้นการประมาณการตัวอย่างดั้งเดิมต่ำกว่า 95% CIs ตามวิธีเชิงประจักษ์ / พื้นฐาน (ซึ่งรวมถึงการแก้ไขอคติที่เหมาะสม) CIs 95% ขึ้นอยู่กับวิธีการเปอร์เซ็นไทล์, จัดรอบศูนย์ลำเอียงทวีคูณเป็นจริงทั้งสองด้านล่างแม้กระทั่งการประเมินจุดที่มีอคติลบจากตัวอย่างเดิม!
ไม่ควรใช้ bootstrap เปอร์เซ็นไทล์หรือไม่?
นั่นอาจเป็นการคุยโวหรือเกินจริงขึ้นอยู่กับมุมมองของคุณ หากคุณสามารถบันทึกความเอนเอียงและความเบ้น้อยที่สุดได้เช่นโดยการแสดงภาพการแจกแจงด้วยฮิสโทแกรมหรือพล็อตความหนาแน่น Bootstrap เปอร์เซ็นไทล์ควรให้ CI เดียวกับ CI เชิงประจักษ์ / พื้นฐาน สิ่งเหล่านี้น่าจะดีกว่าการประมาณค่าปกติอย่างง่ายของ CI(T∗−t)
อย่างไรก็ตามวิธีการทั้งสองไม่ให้ความแม่นยำในการครอบคลุมที่สามารถให้ได้โดยวิธีการบูตอื่น ๆ Efron จากจุดเริ่มต้นได้รับการยอมรับข้อ จำกัด ที่เป็นไปได้ของ CI เปอร์เซ็นไทล์ แต่กล่าวว่า: "ส่วนใหญ่เราจะพอใจที่จะให้ระดับความสำเร็จที่แตกต่างกันของตัวอย่างพูดด้วยตนเอง" ( Ref. 2หน้า 3)
งานที่ตามมาสรุปโดย DiCiccio และ Efron ( อ้างอิง 4 ) วิธีการที่พัฒนาขึ้นซึ่ง "ปรับปรุงโดยลำดับความสำคัญตามความถูกต้องของช่วงเวลามาตรฐาน" โดยวิธีเชิงประจักษ์ / ขั้นพื้นฐานหรือเปอร์เซ็นไทล์ ดังนั้นหนึ่งอาจยืนยันว่าไม่ควรใช้วิธีการเชิงประจักษ์ / พื้นฐานหรือเปอร์เซ็นไทล์หากคุณสนใจความถูกต้องของช่วงเวลา
ในกรณีที่รุนแรงเช่นการสุ่มตัวอย่างโดยตรงจากการกระจาย lognormal โดยไม่ต้องเปลี่ยนแปลงประมาณการไม่มี CI bootstrapped อาจจะน่าเชื่อถือและเป็นแฟรงก์ฮาร์เรลได้ตั้งข้อสังเกต
อะไรเป็นข้อ จำกัด ของความเชื่อถือได้ของ CIs เหล่านี้และ bootstrapped อื่น ๆ
มีปัญหาหลายอย่างที่ทำให้ CIs ที่ bootstrapped ไม่น่าเชื่อถือ บางวิธีสามารถใช้ได้กับทุกวิธีส่วนอื่น ๆ สามารถแก้ไขได้ด้วยวิธีอื่นนอกเหนือจากวิธีเชิงประจักษ์ / พื้นฐานหรือเปอร์เซ็นไทล์
ครั้งแรกโดยทั่วไปปัญหาก็คือวิธีการที่ดีการกระจายเชิงประจักษ์หมายถึงการกระจายของประชากรFหากไม่เป็นเช่นนั้นจะไม่มีวิธีการบูตสแตรปที่เชื่อถือได้ โดยเฉพาะอย่างยิ่ง bootstrapping เพื่อพิจารณาว่าอะไรที่ใกล้เคียงกับค่าสุดขีดของการแจกจ่ายนั้นไม่น่าเชื่อถือ ปัญหานี้จะกล่าวถึงที่อื่น ๆ บนเว็บไซต์นี้เช่นที่นี่และที่นี่ ค่าที่ไม่ต่อเนื่องไม่กี่ค่าที่มีอยู่ในส่วนท้ายของสำหรับตัวอย่างใด ๆ อาจไม่ได้เป็นตัวแทนของส่วนท้ายของต่อเนื่องได้เป็นอย่างดี กรณีตัวอย่างที่รุนแรง แต่มีความพยายามที่จะใช้ความร่วมมือเพื่อประเมินสถิติการสั่งซื้อสูงสุดของกลุ่มตัวอย่างแบบสุ่มจากเครื่องแบบF^F FFF^FU[0,θ]กระจายตามที่อธิบายไว้อย่างดีที่นี่ โปรดทราบว่า bootstrapped 95% หรือ 99% CI นั้นอยู่ที่ส่วนท้ายของการกระจายและอาจประสบปัญหาดังกล่าวโดยเฉพาะอย่างยิ่งกับกลุ่มตัวอย่างขนาดเล็ก
ประการที่สองมีความมั่นใจว่าการสุ่มตัวอย่างของปริมาณใด ๆ จากจะมีการกระจายเช่นเดียวกับการสุ่มตัวอย่างจากFแต่ข้อสันนิษฐานนั้นอยู่ภายใต้หลักการพื้นฐานของการบูตสแตรป ปริมาณที่มีคุณสมบัติที่พึงประสงค์ที่จะเรียกว่าการพิจาณา ขณะที่AdamO อธิบาย : FF^F
ซึ่งหมายความว่าหากพารามิเตอร์พื้นฐานเปลี่ยนแปลงรูปร่างของการแจกแจงจะเลื่อนโดยค่าคงที่เท่านั้นและระดับไม่จำเป็นต้องเปลี่ยน นี่คือสมมติฐานที่แข็งแกร่ง!
ตัวอย่างเช่นถ้ามีอคติมันเป็นสิ่งสำคัญที่จะรู้ว่าการสุ่มตัวอย่างจากรอบเป็นเช่นเดียวกับการสุ่มตัวอย่างจากรอบทีและนี่เป็นปัญหาเฉพาะในการสุ่มตัวอย่างแบบไม่มีพารามิเตอร์ ในฐานะที่เป็นอ้างอิง 1วางไว้ในหน้า 33:θFθเสื้อF^t
ในปัญหาที่ไม่ใช่พารามิเตอร์สถานการณ์มีความซับซ้อนมากขึ้น ตอนนี้ไม่น่าเป็นไปได้ (แต่ไม่เป็นไปไม่ได้อย่างเด็ดขาด) ว่าปริมาณใด ๆ สามารถเป็นสิ่งสำคัญ
ดังนั้นสิ่งที่ดีที่สุดที่เป็นไปได้คือการประมาณ อย่างไรก็ตามปัญหานี้สามารถแก้ไขได้อย่างเพียงพอ มันเป็นไปได้ที่จะประเมินว่าใกล้ชิดปริมาณตัวอย่างคือการการพิจาณาเช่นกับแปลงหมุนตามคำแนะนำของCanty et al, สิ่งเหล่านี้สามารถแสดงว่าการแจกแจงของการประมาณค่า bootstrappedแตกต่างกันอย่างไรกับหรือการแปลงให้ปริมาณได้ดีเพียงใด วิธีการสำหรับการปรับปรุง bootstrapped CIs สามารถลองหาการแปลงซึ่งใกล้กับจุดสำคัญสำหรับการประมาณค่า CIs ในสเกลที่แปลงแล้วเปลี่ยนกลับไปเป็นสเกลดั้งเดิมt h ( h ( T ∗ ) - h ( t ) ) h ( h ( T ∗ ) - h ( t ) )(T∗−t)th(h(T∗) - h(t))h(h(T∗) - h ( t))
boot.ci()
ฟังก์ชั่นให้ studentized บูต CIs (เรียกว่า "bootstrap- ที " โดยDiCiccio และ Efron ) และ CIs (อคติการแก้ไขและเร่งที่ "เร่ง" ข้อตกลงกับลาด) ที่มี "สองคำสั่งที่ถูกต้อง" ในการที่แตกต่างระหว่าง ที่ต้องการและได้รับความคุ้มครอง (เช่น 95% CI) อยู่ในคำสั่งของเทียบกับความถูกต้องอันดับแรกเท่านั้น (ลำดับ ) สำหรับวิธีเชิงประจักษ์ / พื้นฐานและเปอร์เซ็นไทล์ ( Ref 1 , pp. 212-3; Ref. 4 ) อย่างไรก็ตามวิธีการเหล่านี้ต้องการการติดตามความแปรปรวนภายในแต่ละตัวอย่างของ bootstrapped ไม่ใช่เฉพาะค่าแต่ละค่าของ α n - 1 n - 0.5 T ∗ jBCaαn- 1n- 0.5T∗J ใช้โดยวิธีที่ง่ายกว่านั้น
ในกรณีที่รุนแรงที่สุดคนหนึ่งอาจต้องหันไปใช้วิธีการ bootstrapping ภายในตัวอย่างของ bootstrapped เองเพื่อให้มีการปรับช่วงความมั่นใจอย่างเพียงพอ "Bootstrap คู่" นี้มีการอธิบายไว้ในส่วนที่ 5.6 ของการอ้างอิง 1กับบทอื่น ๆ ในหนังสือเล่มนี้แนะนำวิธีการลดความต้องการในการคำนวณที่มากที่สุด
เดวิสัน, AC และ Hinkley, DV วิธีการบูตและการประยุกต์ใช้ของพวกเขา, Cambridge University Press, 1997
Efron, B. วิธี Bootstrap: ดูที่ jacknife, Ann statist 7: 1-26 1979
Fox, J. และ Weisberg, S. โมเดลการถดถอยของ Bootstrapping ใน R. ภาคผนวกของ Companion R เพื่อการถดถอยประยุกต์, ฉบับที่สอง (Sage, 2011) การทบทวน ณ 10 ตุลาคม 2017
DiCiccio, TJ และ Efron, B. ช่วง Bootstrap ความมั่นใจ สถิติ วิทย์ 11: 189-228 1996
Canty, AJ, Davison, AC, Hinkley, DV และ Ventura, V. การวินิจฉัยและการเยียวยา Bootstrap สามารถ. J. สถิติ 34: 5-27 2006