เป็นความจริงหรือไม่ที่ไม่ควรใช้ bootstrap เปอร์เซ็นไทล์?


31

ใน MIT OpenCourseWare บันทึกสำหรับ 18.05 ความน่าจะเป็นและสถิติเบื้องต้นฤดูใบไม้ผลิ 2014 (ปัจจุบันมีให้บริการที่นี่ ) ระบุว่า:

วิธีบูตสแตรปเปอร์เซ็นไทล์น่าดึงดูดเนื่องจากความเรียบง่าย แต่มันขึ้นอยู่กับการกระจายของบูตอยู่บนพื้นฐานโดยเฉพาะอย่างยิ่งกลุ่มตัวอย่างเป็นประมาณการที่ดีการกระจายที่แท้จริงของ{x} ข้าวกล่าวว่าจากวิธีเปอร์เซ็นต์ "แม้ว่านี้สมโดยตรงของ quantiles ของการกระจายบูตสุ่มตัวอย่างกับข้อ จำกัด ของความเชื่อมั่นอาจจะดูเหมือนเป็นครั้งแรกที่น่าสนใจของมันเหตุผลค่อนข้างปิดบัง." [2] ในระยะสั้นไม่ได้ใช้บูตเปอร์เซ็นต์วิธีการ ใช้ bootstrap เชิงประจักษ์แทน (เราได้อธิบายทั้งสองด้วยความหวังว่าคุณจะไม่สับสน bootstrap เชิงประจักษ์สำหรับ bootstrap เปอร์เซ็นไทล์) ˉ xx¯x¯

[2] John Rice สถิติคณิตศาสตร์และการวิเคราะห์ข้อมูลรุ่นที่ 2 หน้า 272

หลังจากค้นหาออนไลน์นิดหน่อยนี่เป็นคำพูดเดียวที่ฉันได้พบว่ารัฐไหนที่ไม่ควรใช้ bootstrap เปอร์เซ็นไทล์

สิ่งที่ฉันจำได้จากการอ่านข้อความหลักการและทฤษฎีสำหรับการทำเหมืองข้อมูลและการเรียนรู้ของเครื่องโดย Clarke et al. นั่นคือเหตุผลหลักสำหรับ bootstrapping คือข้อเท็จจริงที่ว่า โดยที่คือ CDF เชิงประจักษ์ (ฉันจำรายละเอียดได้ไม่เกินนี้) F n

1ni=1nF^n(x)pF(x)
F^n

เป็นความจริงไหมว่าไม่ควรใช้วิธีบูตสแตรปเปอร์เซ็นไทล์? ถ้าเป็นเช่นนั้นมีทางเลือกอะไรบ้างเมื่อไม่จำเป็นต้องรู้ (เช่นมีข้อมูลไม่เพียงพอที่จะทำ parstetric bootstrap)F


ปรับปรุง

เนื่องจากมีการร้องขอการชี้แจงให้ชัดเจน "empirical bootstrap" จากบันทึกย่อ MIT เหล่านี้อ้างถึงขั้นตอนต่อไปนี้: พวกเขาคำนวณและพร้อมกับการประเมิน bootstrapped ของและประมาณการเต็มรูปแบบตัวอย่างและส่งผลให้ความเชื่อมั่นคาดจะdelta_1]δ1=(θ^θ^)α/2θ * θ θ θ [δ2=(θ^θ^)1α/2θ^θθ^θ[θ^δ2,θ^δ1]

ในสาระสำคัญความคิดหลักคือ: ประจักษ์ bootstrapping ประมาณจำนวนสัดส่วนกับความแตกต่างระหว่างการประเมินจุดและพารามิเตอร์ที่แท้จริงคือและใช้ความแตกต่างนี้มากับล่างและ ขอบเขต CI ด้านบนθ^θ

"เปอร์เซ็นไทล์บูตสแตรป" อ้างถึงสิ่งต่อไปนี้: ใช้เป็นช่วงความมั่นใจ สำหรับ\ในสถานการณ์นี้เราใช้ bootstrapping เพื่อคำนวณค่าประมาณของพารามิเตอร์ที่น่าสนใจและคำนวณเปอร์เซ็นต์ของค่าประมาณเหล่านี้สำหรับช่วงความมั่นใจθ[θ^α/2,θ^1α/2]θ


2
ฉันแก้ไขการอัปเดตของคุณอย่างหนัก โปรดตรวจสอบว่าการแก้ไขของฉันสมเหตุสมผล คำพูดของคุณจากหนังสือของ Efron สับสนเพราะสิ่งที่ Efron อธิบายไม่ตรงกับสิ่งที่ MIT โน้ตของคุณเรียกว่า "empirical bootstrap" ดังนั้นฉันเพิ่งออกจากคำอธิบายของบันทึกของ MIT BTW ฉันสับสนเกี่ยวกับสิ่งหนึ่งในคำอธิบายของพวกเขาของ "ประจักษ์ bootstrap": ด้านบนสุดของหน้า 6 มันบอกว่า "ตั้งแต่อยู่ที่เปอร์เซ็นไทล์ 90 ... " - ฉันไม่ ไม่เข้าใจสิ่งนี้ เห็นได้ชัดจากตัวอย่างที่ด้านซ้ายของ CI ถูกกำหนดโดยการลบเปอร์เซ็นไทล์ที่ 90 นั่นคือคุณ δ 2δ.1δ2
อะมีบาพูดว่า Reinstate Monica

2
@ amoeba การแก้ไขของคุณถูกต้อง ขอขอบคุณที่ช่วยเหลือตลอด ฉันคิดว่ามีปัญหาบางอย่างเกี่ยวกับบันทึกของ MIT; คำอธิบายของพวกเขาเกี่ยวกับความยากลำบากในการบูตบู๊ตแบบไทล์เปอร์เซนต์ยังไม่ชัดเจนนัก ฉันไม่สามารถทำซ้ำตัวอย่างตัวเลขสุดท้ายของพวกเขากับ bootstrap เปอร์เซ็นไทล์ อย่าคิดว่าพวกเขาทำงานผ่านรายละเอียดบางอย่างเช่นเดียวกับที่เรามีในขณะที่เราตอบคำถามที่มีประโยชน์นี้และข้อความของพวกเขาอาจมีข้อบกพร่องบางอย่างตามที่คุณชี้ให้เห็น
EdM

เมื่อดูที่บันทึกของ MIT ฉันไม่เห็นว่าผู้เขียนได้รับช่วงความมั่นใจในส่วนที่ 9 "วิธีบูตสแตรปเปอร์ไทล์เปอร์เซ็นต์ (ไม่ควรใช้)" ของ [37.4, 42.4] ดูเหมือนว่าตัวอย่างที่พวกเขาใช้นั้นไม่เหมือนกับตัวอย่างในข้อ 6 ซึ่งพวกเขากำลังทำการเปรียบเทียบ หากเรานำตัวอย่างสำหรับδ ∗ = x ∗ - x รายงานที่ด้านล่างของหน้า 5 และเพิ่มค่าเฉลี่ยตัวอย่าง 40.3 และนำ CIs กลับมาข้อ จำกัด ที่ฉันได้รับคือ [38.9, 41.9] ซึ่งมีความกว้างเท่ากัน 3 ตามขีด จำกัด ที่รายงานในหัวข้อ 6 ของ [38.7, 41.7]
สับสน

คำตอบ:


21

มีปัญหาบางอย่างที่พบได้ทั่วไปในการประเมินความเชื่อมั่นแบบ nonparametric bootstrapping (CI) บางปัญหาที่มีทั้ง "empirical" (เรียกว่า "พื้นฐาน" ในการboot.ci()ทำงานของbootแพ็คเกจ R และอ้างอิง 1 ) และ CI "เปอร์เซ็นไทล์" (ตามที่อธิบายไว้ในข้อ 2 ) และบางอย่างที่สามารถทำให้รุนแรงขึ้นด้วยCI เปอร์เซ็นไทล์

TL; DR : ในบางกรณีการประมาณค่า bootstrap CI เปอร์เซ็นไทล์อาจทำงานได้อย่างพอเหมาะ แต่ถ้าสมมติฐานบางอย่างไม่ได้เก็บไว้ CI เปอร์เซ็นไทล์อาจเป็นตัวเลือกที่แย่ที่สุด การประมาณ bootstrap CI อื่น ๆ สามารถเชื่อถือได้มากขึ้นพร้อมการครอบคลุมที่ดีกว่า ทั้งหมดอาจเป็นปัญหาได้ ดูแปลงวินิจฉัยเช่นเคยช่วยหลีกเลี่ยงข้อผิดพลาดที่อาจเกิดขึ้นเพียงแค่รับเอาท์พุทของชุดคำสั่งซอฟต์แวร์

การตั้งค่า Bootstrap

โดยทั่วไปต่อไปนี้คำศัพท์และข้อโต้แย้งของการอ้างอิง 1เรามีตัวอย่างของข้อมูลมาจากตัวแปรสุ่มอิสระและกันกระจายร่วมฟังก์ชั่นการแจกแจงสะสมFฟังก์ชั่นการกระจายเชิงประจักษ์ (EDF) สร้างจากตัวอย่างข้อมูลที่F เรามีความสนใจในลักษณะของประชากรประมาณโดยสถิติที่มีค่าในตัวอย่างเป็นเสื้อเราอยากจะทราบวิธีที่ดีประมาณการตัวอย่างเช่นการกระจายของtheta)Y ฉัน F F θy1,...,ynYiFF^θเสื้อT θ ( T - θ )TtTθ(Tθ)

nonparametric ใช้บูตสุ่มตัวอย่างจาก EDFเพื่อสุ่มตัวอย่างเลียนแบบจาก , การกลุ่มตัวอย่างแต่ละขนาดด้วยการเปลี่ยนจากy_iค่าที่คำนวณจากตัวอย่าง bootstrap จะแสดงด้วย "*" ยกตัวอย่างเช่นสถิติคำนวณตัวอย่างบูตเจมีค่า * FRnF^FRn T T * JyiTTj

เชิงประจักษ์ / ขั้นพื้นฐานเมื่อเทียบกับเปอร์เซ็นต์บูต bootstrap CIs

เชิงประจักษ์ / bootstrap พื้นฐานใช้การกระจายของในกลุ่มตัวอย่าง bootstrapจากเพื่อประเมินการกระจายตัวของภายในประชากรที่อธิบายโดยเอง ค่าประมาณ CI ของมันจึงขึ้นอยู่กับการกระจายตัวของโดยที่คือค่าของสถิติในตัวอย่างดั้งเดิมR F ( T - θ )(Tt)RF^(Tθ)( T * - T ) TF(Tt)t

วิธีการนี้ใช้หลักการพื้นฐานของการบูตสแตรป ( อ้างอิงที่ 3 ):

ประชากรคือกลุ่มตัวอย่างเนื่องจากกลุ่มตัวอย่างเป็นกลุ่มตัวอย่างบูตสแตรป

บูตสแตรปเปอร์ไทล์แทนใช้ quantiles ของค่าเพื่อกำหนด CI ประมาณการเหล่านี้สามารถแตกต่างกันมากถ้ามีเอียงหรืออคติในการกระจายของtheta) ( T - θ )Tj(Tθ)

บอกว่ามีอคติที่สังเกตได้เช่นนั้น: ˉ T = t + B ,B

T¯=t+B,

ที่เป็นค่าเฉลี่ยของ * สำหรับ concreteness ให้บอกว่าเปอร์เซ็นไทล์ที่ 5 และ 95 ของแสดงเป็นและโดยที่เป็นค่าเฉลี่ยของตัวอย่าง bootstrap และแต่ละตัวมีค่าเป็นบวกและอาจแตกต่างกันเพื่อให้เอียง การประมาณค่าเปอร์เซ็นไทล์ตามอันดับที่ 5 และ 95 จะได้รับโดยตรงตามลำดับโดย:Tj Tj ˉ T-δ1 ˉ T+δ2T¯TjTjT¯δ1T¯+δ2δ1,δ2T¯δ1,δ2

T¯δ1=t+Bδ1;T¯+δ2=t+B+δ2.

การประมาณค่า CI เปอร์เซ็นไทล์ที่ 5 และ 95 ตามวิธีการบูต / สแตรปพื้นฐานจะอ้างอิงตามลำดับ ( Ref. 1 , eq. 5.6, หน้า 194):

2t(T¯+δ2)=tBδ2;2t(T¯δ1)=tB+δ1.

ดังนั้นCIs ที่ยึดตามเปอร์เซ็นต์ไทล์จะได้รับอคติผิด ๆ และพลิกทิศทางของตำแหน่งที่ไม่สมมาตรของความเชื่อมั่นที่ จำกัด รอบจุดศูนย์กลางสองเท่า เปอร์เซ็นต์ CIs จาก bootstrapping ในกรณีเช่นนี้ไม่ได้เป็นตัวแทนกระจายของtheta)(Tθ)

พฤติกรรมนี้แสดงให้เห็นอย่างชัดเจนในหน้านี้สำหรับการบูตสถิติเพื่อลำเอียงในทางลบดังนั้นการประมาณการตัวอย่างดั้งเดิมต่ำกว่า 95% CIs ตามวิธีเชิงประจักษ์ / พื้นฐาน (ซึ่งรวมถึงการแก้ไขอคติที่เหมาะสม) CIs 95% ขึ้นอยู่กับวิธีการเปอร์เซ็นไทล์, จัดรอบศูนย์ลำเอียงทวีคูณเป็นจริงทั้งสองด้านล่างแม้กระทั่งการประเมินจุดที่มีอคติลบจากตัวอย่างเดิม!

ไม่ควรใช้ bootstrap เปอร์เซ็นไทล์หรือไม่?

นั่นอาจเป็นการคุยโวหรือเกินจริงขึ้นอยู่กับมุมมองของคุณ หากคุณสามารถบันทึกความเอนเอียงและความเบ้น้อยที่สุดได้เช่นโดยการแสดงภาพการแจกแจงด้วยฮิสโทแกรมหรือพล็อตความหนาแน่น Bootstrap เปอร์เซ็นไทล์ควรให้ CI เดียวกับ CI เชิงประจักษ์ / พื้นฐาน สิ่งเหล่านี้น่าจะดีกว่าการประมาณค่าปกติอย่างง่ายของ CI(Tt)

อย่างไรก็ตามวิธีการทั้งสองไม่ให้ความแม่นยำในการครอบคลุมที่สามารถให้ได้โดยวิธีการบูตอื่น ๆ Efron จากจุดเริ่มต้นได้รับการยอมรับข้อ จำกัด ที่เป็นไปได้ของ CI เปอร์เซ็นไทล์ แต่กล่าวว่า: "ส่วนใหญ่เราจะพอใจที่จะให้ระดับความสำเร็จที่แตกต่างกันของตัวอย่างพูดด้วยตนเอง" ( Ref. 2หน้า 3)

งานที่ตามมาสรุปโดย DiCiccio และ Efron ( อ้างอิง 4 ) วิธีการที่พัฒนาขึ้นซึ่ง "ปรับปรุงโดยลำดับความสำคัญตามความถูกต้องของช่วงเวลามาตรฐาน" โดยวิธีเชิงประจักษ์ / ขั้นพื้นฐานหรือเปอร์เซ็นไทล์ ดังนั้นหนึ่งอาจยืนยันว่าไม่ควรใช้วิธีการเชิงประจักษ์ / พื้นฐานหรือเปอร์เซ็นไทล์หากคุณสนใจความถูกต้องของช่วงเวลา

ในกรณีที่รุนแรงเช่นการสุ่มตัวอย่างโดยตรงจากการกระจาย lognormal โดยไม่ต้องเปลี่ยนแปลงประมาณการไม่มี CI bootstrapped อาจจะน่าเชื่อถือและเป็นแฟรงก์ฮาร์เรลได้ตั้งข้อสังเกต

อะไรเป็นข้อ จำกัด ของความเชื่อถือได้ของ CIs เหล่านี้และ bootstrapped อื่น ๆ

มีปัญหาหลายอย่างที่ทำให้ CIs ที่ bootstrapped ไม่น่าเชื่อถือ บางวิธีสามารถใช้ได้กับทุกวิธีส่วนอื่น ๆ สามารถแก้ไขได้ด้วยวิธีอื่นนอกเหนือจากวิธีเชิงประจักษ์ / พื้นฐานหรือเปอร์เซ็นไทล์

ครั้งแรกโดยทั่วไปปัญหาก็คือวิธีการที่ดีการกระจายเชิงประจักษ์หมายถึงการกระจายของประชากรFหากไม่เป็นเช่นนั้นจะไม่มีวิธีการบูตสแตรปที่เชื่อถือได้ โดยเฉพาะอย่างยิ่ง bootstrapping เพื่อพิจารณาว่าอะไรที่ใกล้เคียงกับค่าสุดขีดของการแจกจ่ายนั้นไม่น่าเชื่อถือ ปัญหานี้จะกล่าวถึงที่อื่น ๆ บนเว็บไซต์นี้เช่นที่นี่และที่นี่ ค่าที่ไม่ต่อเนื่องไม่กี่ค่าที่มีอยู่ในส่วนท้ายของสำหรับตัวอย่างใด ๆ อาจไม่ได้เป็นตัวแทนของส่วนท้ายของต่อเนื่องได้เป็นอย่างดี กรณีตัวอย่างที่รุนแรง แต่มีความพยายามที่จะใช้ความร่วมมือเพื่อประเมินสถิติการสั่งซื้อสูงสุดของกลุ่มตัวอย่างแบบสุ่มจากเครื่องแบบF^F FFF^FU[0,θ]กระจายตามที่อธิบายไว้อย่างดีที่นี่ โปรดทราบว่า bootstrapped 95% หรือ 99% CI นั้นอยู่ที่ส่วนท้ายของการกระจายและอาจประสบปัญหาดังกล่าวโดยเฉพาะอย่างยิ่งกับกลุ่มตัวอย่างขนาดเล็ก

ประการที่สองมีความมั่นใจว่าการสุ่มตัวอย่างของปริมาณใด ๆ จากจะมีการกระจายเช่นเดียวกับการสุ่มตัวอย่างจากFแต่ข้อสันนิษฐานนั้นอยู่ภายใต้หลักการพื้นฐานของการบูตสแตรป ปริมาณที่มีคุณสมบัติที่พึงประสงค์ที่จะเรียกว่าการพิจาณา ขณะที่AdamO อธิบาย : FF^F

ซึ่งหมายความว่าหากพารามิเตอร์พื้นฐานเปลี่ยนแปลงรูปร่างของการแจกแจงจะเลื่อนโดยค่าคงที่เท่านั้นและระดับไม่จำเป็นต้องเปลี่ยน นี่คือสมมติฐานที่แข็งแกร่ง!

ตัวอย่างเช่นถ้ามีอคติมันเป็นสิ่งสำคัญที่จะรู้ว่าการสุ่มตัวอย่างจากรอบเป็นเช่นเดียวกับการสุ่มตัวอย่างจากรอบทีและนี่เป็นปัญหาเฉพาะในการสุ่มตัวอย่างแบบไม่มีพารามิเตอร์ ในฐานะที่เป็นอ้างอิง 1วางไว้ในหน้า 33:θFθเสื้อF^t

ในปัญหาที่ไม่ใช่พารามิเตอร์สถานการณ์มีความซับซ้อนมากขึ้น ตอนนี้ไม่น่าเป็นไปได้ (แต่ไม่เป็นไปไม่ได้อย่างเด็ดขาด) ว่าปริมาณใด ๆ สามารถเป็นสิ่งสำคัญ

ดังนั้นสิ่งที่ดีที่สุดที่เป็นไปได้คือการประมาณ อย่างไรก็ตามปัญหานี้สามารถแก้ไขได้อย่างเพียงพอ มันเป็นไปได้ที่จะประเมินว่าใกล้ชิดปริมาณตัวอย่างคือการการพิจาณาเช่นกับแปลงหมุนตามคำแนะนำของCanty et al, สิ่งเหล่านี้สามารถแสดงว่าการแจกแจงของการประมาณค่า bootstrappedแตกต่างกันอย่างไรกับหรือการแปลงให้ปริมาณได้ดีเพียงใด วิธีการสำหรับการปรับปรุง bootstrapped CIs สามารถลองหาการแปลงซึ่งใกล้กับจุดสำคัญสำหรับการประมาณค่า CIs ในสเกลที่แปลงแล้วเปลี่ยนกลับไปเป็นสเกลดั้งเดิมt h ( h ( T ) - h ( t ) ) h ( h ( T ) - h ( t ) )(Tt)th(h(T)h(t))h(h(T)h(t))

boot.ci()ฟังก์ชั่นให้ studentized บูต CIs (เรียกว่า "bootstrap- ที " โดยDiCiccio และ Efron ) และ CIs (อคติการแก้ไขและเร่งที่ "เร่ง" ข้อตกลงกับลาด) ที่มี "สองคำสั่งที่ถูกต้อง" ในการที่แตกต่างระหว่าง ที่ต้องการและได้รับความคุ้มครอง (เช่น 95% CI) อยู่ในคำสั่งของเทียบกับความถูกต้องอันดับแรกเท่านั้น (ลำดับ ) สำหรับวิธีเชิงประจักษ์ / พื้นฐานและเปอร์เซ็นไทล์ ( Ref 1 , pp. 212-3; Ref. 4 ) อย่างไรก็ตามวิธีการเหล่านี้ต้องการการติดตามความแปรปรวนภายในแต่ละตัวอย่างของ bootstrapped ไม่ใช่เฉพาะค่าแต่ละค่าของ α n - 1 n - 0.5 T jBCaαn1n0.5Tj ใช้โดยวิธีที่ง่ายกว่านั้น

ในกรณีที่รุนแรงที่สุดคนหนึ่งอาจต้องหันไปใช้วิธีการ bootstrapping ภายในตัวอย่างของ bootstrapped เองเพื่อให้มีการปรับช่วงความมั่นใจอย่างเพียงพอ "Bootstrap คู่" นี้มีการอธิบายไว้ในส่วนที่ 5.6 ของการอ้างอิง 1กับบทอื่น ๆ ในหนังสือเล่มนี้แนะนำวิธีการลดความต้องการในการคำนวณที่มากที่สุด


  1. เดวิสัน, AC และ Hinkley, DV วิธีการบูตและการประยุกต์ใช้ของพวกเขา, Cambridge University Press, 1997

  2. Efron, B. วิธี Bootstrap: ดูที่ jacknife, Ann statist 7: 1-26 1979

  3. Fox, J. และ Weisberg, S. โมเดลการถดถอยของ Bootstrapping ใน R. ภาคผนวกของ Companion R เพื่อการถดถอยประยุกต์, ฉบับที่สอง (Sage, 2011) การทบทวน ณ 10 ตุลาคม 2017

  4. DiCiccio, TJ และ Efron, B. ช่วง Bootstrap ความมั่นใจ สถิติ วิทย์ 11: 189-228 1996

  5. Canty, AJ, Davison, AC, Hinkley, DV และ Ventura, V. การวินิจฉัยและการเยียวยา Bootstrap สามารถ. J. สถิติ 34: 5-27 2006


1
ฉันไม่เข้าใจจริง ๆ ว่าทำไมคุณถึงพูดว่า "ประจักษ์บูทสแตรป" จะ "ไวน้อยกว่ามาก" ต่อการเบี่ยงเบนจากการกระจายประชากร ไม่ใช่บูตสแตรปเปอร์ไทล์และ "บูตเชิงประจักษ์" ที่ใช้ควอนไทล์เดียวกันของการกระจายสแตรป ฉันคิดว่าความแตกต่างเพียงอย่างเดียวคือถ้าการกระจาย bootstrap นั้นไม่สมมาตรรอบค่าเฉลี่ยตัวอย่างช่วงเวลาจากสองแนวทางนี้จะพลิก เช่นเดียวกับที่อธิบายไว้ที่นี่: en.wikipedia.org/wiki/… ("basic" vs "percentile")
อะมีบาพูดว่า Reinstate Monica

1
@ amoeba พวกเขาต่างกันในการจัดการความลำเอียงในการประมาณการ bootstrap ไม่ใช่เพียงแค่พลิกช่วงเวลา คำตอบนี้ต้องการงานมากขึ้นเพื่อแยกประเด็นของการทดสอบเชิงประจักษ์เทียบกับการแจกแจงเปอร์เซ็นไทล์กับปัญหาที่เกี่ยวข้องกับการแจกแจงหางซึ่งฉันค่อนข้างสับสนที่นี่และฉันหวังว่าจะชี้แจงในอีกสองสามวัน
EdM

1
ฉันไม่ถอนคำตอบนี้เพราะอ้างอิงตามที่ให้ไว้และเหตุผล (สมเหตุสมผลมาก) ที่นำเสนอ: " bootstrap เปอร์เซ็นไทล์ไม่ควรใช้ " เป็นเพียงคำกล่าวเกินจริงไม่ใช่ "นิดหน่อย" ใช่ถ้าเราทำได้เราควรใช้วิธี bootstrap ที่แก้ปัญหาด้วยอคติบางรูปแบบ แต่ไม่ควรใช้ bootstrap เปอร์เซ็นไทล์ที่ดีกว่าเพื่อให้ได้การประมาณค่า CI ที่ไม่มีประสิทธิภาพมากกว่าการประมาณ 2SE โดยไม่ตั้งใจและคิดว่าเราค้นพบอเมริกา (ฉันเห็นด้วยอย่างมากกับสิ่งที่เนื้อหาหลักของคำตอบพูดไม่ใช่ย่อหน้าสุดท้ายเมื่อฉันรู้สึกว่ามันเปิดประตูไปสู่การตีความผิด)
usεr11852พูดว่า Reinstate Monic

1
มีการจัดระเบียบและแก้ไขใหม่อย่างมีนัยสำคัญซึ่งเป็นส่วนหนึ่งในการตอบสนองต่อความคิดเห็น
EdM

1
@ ค้นพบสิ่งที่คุณเขียนเทียบเท่ากับแบบฟอร์มที่ฉันให้ไว้สำหรับ bootstrap เชิงประจักษ์ / พื้นฐาน โปรดทราบว่าของคุณคือโดยที่ เป็นเปอร์เซ็นต์ความสนใจสูงสุดของตัวอย่างบูตสแตรป ดังนั้น U ผมใช้ของคุณและแสดงเป็นบูตเฉลี่ยบวกชดเชย\* θ * U - θ θ * U θ - U * = θ - ( θ * U - θ ) = 2 θ - θ * Uเสื้อθ θ * U ˉ T * δ 2Uθ^Uθ^θ^Uθ^U=θ^(θ^Uθ^)=2θ^θ^Utθ^θ^UT¯δ2
EdM

8

ความคิดเห็นบางประการเกี่ยวกับคำศัพท์ต่าง ๆ ระหว่าง MIT / Rice และหนังสือของ Efron

ฉันคิดว่าคำตอบของ EdM ทำงานได้อย่างยอดเยี่ยมในการตอบคำถามเดิมของ OP เกี่ยวกับบันทึกการบรรยายของ MIT อย่างไรก็ตาม OP ยังเสนอราคาหนังสือจาก Efrom (2016) การอนุมานทางสถิติยุคคอมพิวเตอร์ซึ่งใช้คำจำกัดความแตกต่างกันเล็กน้อยซึ่งอาจนำไปสู่ความสับสน


บทที่ 11 - ตัวอย่างคะแนนความสัมพันธ์ตัวอย่างของนักเรียน

ตัวอย่างนี้ใช้ตัวอย่างที่พารามิเตอร์ที่น่าสนใจคือความสัมพันธ์ ในตัวอย่างที่เป็นที่สังเกตเป็น0.498 จากนั้น Efron จะทำการไม่ใช่พารามิเตอร์การบูตแบบจำลองสำหรับคะแนนความสัมพันธ์ตัวอย่างของนักเรียนและพล็อตฮิสโตแกรมของผลลัพธ์ (หน้า 186)B=2000θ^=0.498B=2000θ^

ป้อนคำอธิบายรูปภาพที่นี่

บูตช่วงเวลามาตรฐาน

จากนั้นเขากำหนดbootstrap ช่วงเวลามาตรฐานต่อไปนี้:

θ^±1.96se^

สำหรับความครอบคลุม 95% โดยที่เป็นข้อผิดพลาดมาตรฐาน bootstrap:หรือที่เรียกว่าค่าเบี่ยงเบนมาตรฐานเชิงประจักษ์ของค่า bootstrap sooTse^seboot

ค่าเบี่ยงเบนมาตรฐานเชิงประจักษ์ของค่า bootstrap:

ปล่อยให้ตัวอย่างดั้งเดิมเป็นและตัวอย่าง bootstrap เป็น*) แต่ละตัวอย่าง bootstrapให้การจำลองแบบ bootstrapของสถิติที่น่าสนใจ: x=(x1,x2,...,xn)x=(x1,x2,...,xn)b

θ^b=s(xb)  for b=1,2,...,B

การประมาณ bootstrap ที่ได้ของข้อผิดพลาดมาตรฐานสำหรับคือθ^

se^boot=[b=1B(θ^bθ^)2/(B1)]1/2
θ^=b=1Bθ^bB

คำจำกัดความนี้ดูเหมือนจะแตกต่างจากที่ใช้ในคำตอบของ EdM:

เชิงประจักษ์ / bootstrap พื้นฐานใช้การกระจายของในกลุ่มตัวอย่าง bootstrapจาก เพื่อประเมินการกระจายตัวของภายในประชากรที่อธิบายโดยเอง(Tt)RF^(Tθ)F


เปอร์เซ็นไทล์บูต

ที่นี่คำจำกัดความทั้งสองดูเหมือนอยู่ในแนวเดียวกัน จาก Efron หน้า 186:

วิธีเปอร์เซ็นต์ใช้รูปร่างของการกระจายบูตเพื่อปรับปรุงอยู่กับช่วงเวลาที่มาตรฐาน เมื่อสร้างเรพลิเคชันจากนั้นเราจะใช้เปอร์เซ็นไทล์ของการแจกแจงเพื่อกำหนดค่าความเชื่อมั่นของเปอร์เซ็นไทล์ .θ * 1 , θ * 2 , . . , θ * BBθ^1,θ^2,...,θ^B

ในตัวอย่างนี้ค่าเหล่านี้คือ 0.118 และ 0.758 ตามลำดับ

การอ้างอิง EdM:

บูตสแตรปเปอร์เซ็นไทล์แทนจะใช้ปริมาณของค่าตัวเองเพื่อกำหนด CITj


เปรียบเทียบวิธีมาตรฐานและเปอร์เซ็นต์ไทล์ตามที่ Efron กำหนดไว้

จากคำจำกัดความของเขาเอง Efron มีความยาวพอสมควรเพื่อยืนยันว่าวิธีเปอร์เซ็นไทล์เป็นการปรับปรุง สำหรับตัวอย่างนี้ CI ที่ได้คือ:

ป้อนคำอธิบายรูปภาพที่นี่


ข้อสรุป

ฉันจะยืนยันว่าคำถามเดิมของ OP นั้นสอดคล้องกับคำจำกัดความที่จัดทำโดย EdM การแก้ไขที่ทำโดย OP เพื่อชี้แจงคำจำกัดความนั้นสอดคล้องกับหนังสือของ Efron และไม่เหมือนกันสำหรับ Empirical vs Standard bootstrap CI

ความคิดเห็นยินดีต้อนรับ


2
ขอขอบคุณสำหรับคำอธิบายที่ชัดเจน ได้อย่างรวดเร็วก่อน "มาตรฐานช่วงบูต" CIs ดูเหมือนจะคล้ายกับ CIS ที่ "ปกติ" ที่ผลิตโดยboot.ci()ที่พวกเขาจะขึ้นอยู่กับการประมาณธรรมดาถึงข้อผิดพลาดและถูกบังคับให้เป็นสมมาตรเกี่ยวกับการประมาณการตัวอย่าง\มันแตกต่างจาก CIs "เชิงประจักษ์ / พื้นฐาน" ซึ่งเช่น CIs "เปอร์เซ็นไทล์" อนุญาตให้มีความไม่สมดุล ฉันรู้สึกประหลาดใจที่ CIs "เชิงประจักษ์ / พื้นฐาน" และ "เปอร์เซนต์" ในการจัดการอคตินั้นแตกต่างกันมาก ฉันไม่ได้คิดมากเกี่ยวกับเรื่องนั้นจนกว่าฉันจะพยายามตอบคำถามนี้ θ
EdM

เพิ่งตรวจสอบคู่มือสำหรับboot.ci(): "ช่วงเวลาปกติก็ใช้การปรับแก้บูตอคติ" ดังนั้นดูเหมือนว่าจะแตกต่างจาก "ช่วงเวลาบูตมาตรฐาน" ที่อธิบายโดย Efron
EdM

ยุติธรรมเพียงพอ - ช่วงเวลาปกติที่อธิบายไว้ในหนังสือเล่มนี้เป็นกรณีพื้นฐานที่เขาสร้างขึ้นมาเพื่อแนวทางที่ดีและแม่นยำยิ่งขึ้น (จนถึง BC และ BCa) ดังนั้นจึงไม่มีเหตุผลที่จะนำไปใช้
Xavier Bourret Sicotte

@EdM และซาเวียร์: การอนุมานทางสถิติคอมพิวเตอร์อายุอธิบาย CIs "เชิงประจักษ์ / พื้นฐาน" หรือไม่? ถ้าเป็นเช่นนั้นหนังสือจะเรียกพวกเขาอย่างไร ถ้าไม่มันไม่แปลกเหรอ?
อะมีบาพูดว่า Reinstate Monica

1
@ amoeba ไม่ใช่ว่าฉันจะได้เห็นครั้งแรกที่มองผ่าน หนังสือเล่มนี้เป็นไฟล์ PDFสำหรับการใช้งานส่วนตัว ตามที่ฉันโต้แย้งในคำตอบและตามที่ระบุไว้ในหนังสือมีทางเลือกที่ดีกว่า CIs "เชิงประจักษ์ / พื้นฐาน" และ "เปอร์เซ็นไทล์" ที่เกี่ยวกับการรายงานข่าวดังนั้นฉันสามารถดูได้ว่าทำไมคนคนหนึ่งถึงถูกละเว้น: โดยไม่มีอคติและ CI สมมาตร ไม่มีความแตกต่างระหว่างพวกเขามากนัก แน่นอนว่าฉันไม่ผิดนักประดิษฐ์ของ bootstrap สำหรับการเน้นวิธี CI เริ่มต้นของเขาเนื่องจากมันนำไปสู่ ​​BC และ BCa โดยตรงมากกว่า "เชิงประจักษ์ / พื้นฐาน"
EdM

5

ฉันกำลังทำตามแนวทางของคุณ: "มองหาคำตอบจากแหล่งข้อมูลที่น่าเชื่อถือและ / หรือเป็นทางการ"

bootstrap ถูกคิดค้นโดย Brad Efron ฉันคิดว่ามันยุติธรรมที่จะบอกว่าเขาเป็นนักสถิติที่มีชื่อเสียง มันเป็นความจริงที่ว่าเขาเป็นศาสตราจารย์ที่สแตนฟอร์ด ฉันคิดว่านั่นทำให้ความคิดเห็นของเขาน่าเชื่อถือและเป็นทางการ

ฉันเชื่อว่าการอนุมานสถิติอายุคอมพิวเตอร์โดย Efron และ Hastie เป็นหนังสือเล่มล่าสุดของเขาและควรสะท้อนมุมมองปัจจุบันของเขา จากหน้า 204 (11.7 บันทึกและรายละเอียด)

Bootstrap ช่วงความเชื่อมั่นไม่ถูกต้องหรือไม่ดีที่สุด แต่มีจุดมุ่งหมายเพื่อการบังคับใช้ที่กว้างขวางรวมกับความแม่นยำที่ใกล้เคียง

หากคุณอ่านบทที่ 11 "Bootstrap Confidence Intervals" เขาจะให้ 4 วิธีในการสร้างช่วงความมั่นใจ bootstrap วิธีที่สองของวิธีเหล่านี้คือ (11.2) วิธี Percentile วิธีที่สามและสี่เป็นวิธีแปรผันตามวิธีเปอร์เซ็นไทล์ที่พยายามแก้ไขสิ่งที่ Efron และ Hastie อธิบายว่าเป็นอคติในช่วงความเชื่อมั่นและพวกเขาให้คำอธิบายทางทฤษฎี

นอกจากนี้ฉันไม่สามารถตัดสินใจได้ว่าจะมีความแตกต่างใด ๆ ระหว่างสิ่งที่คน MIT เรียกว่า Bootstrap CI เชิงประจักษ์กับ CI เปอร์เซ็นไทล์ ฉันอาจมีผายลมสมอง แต่ฉันเห็นวิธีเชิงประจักษ์เป็นวิธีเปอร์เซ็นไทล์หลังจากลบจำนวนที่แน่นอน นั่นไม่ควรเปลี่ยนอะไรเลย ฉันอาจจะอ่านผิด แต่ฉันรู้สึกขอบคุณจริง ๆ ถ้ามีคนอธิบายได้ว่าฉันเข้าใจเนื้อหาของพวกเขาอย่างไร

ดูเหมือนว่าผู้มีอำนาจชั้นนำจะไม่มีปัญหากับ CI ของเปอร์เซ็นไทล์ ฉันยังคิดว่าความคิดเห็นของเขาตอบคำวิจารณ์ของ bootstrap CI ที่บางคนกล่าวถึง

MAJOR เพิ่มบน

ประการแรกหลังจากสละเวลาเพื่อแยกแยะบท MIT และความคิดเห็นสิ่งที่สำคัญที่สุดที่ควรทราบก็คือสิ่งที่ MIT เรียกว่า bootstrap เชิงประจักษ์และ bootstrap เปอร์ไทล์แตกต่างกัน - bootstrap เชิงประจักษ์และ bootstrap เปอร์ไทล์จะแตกต่างกันในสิ่งที่พวกเขาเรียกว่า bootstrap จะเป็นช่วงเวลาในขณะที่ bootstrap เปอร์เซนต์จะมีช่วงความมั่นใจ1}] ฉันจะยืนยันต่อไปว่าตาม Efron-Hastie bootstrap เปอร์เซ็นไทล์เป็นที่ยอมรับมากขึ้น กุญแจสู่สิ่งที่เรียกว่าเอ็มไอทีบูตเชิงประจักษ์คือการดูที่การกระจายของ\ แต่ทำไมทำไมไม่[x¯δ.1,x¯δ.9][x¯δ.9,x¯δ.1]
δ=x¯μx¯μμx¯{x} เพียงเท่านี้สมเหตุสมผล นอกจากนี้เดลต้าสำหรับชุดที่สองคือ bootstrap เปอร์เซ็นไทล์ที่สกปรก! Efron ใช้เปอร์เซ็นไทล์และฉันคิดว่าการกระจายตัวของค่าเฉลี่ยควรเป็นพื้นฐานที่สุด ฉันจะเพิ่มว่านอกเหนือจาก Efron และ Hastie และกระดาษของ Efron 1979 ที่กล่าวถึงในคำตอบอื่น Efron เขียนหนังสือบน bootstrap ในปี 1982 ในทั้ง 3 แหล่งมีการกล่าวถึง bootstrap เปอร์เซ็นไทล์ แต่ฉันไม่พบการพูดถึงสิ่งที่ คน MIT เรียก bootstrap เชิงประจักษ์ นอกจากนี้ฉันค่อนข้างแน่ใจว่าพวกเขาคำนวณ bootstrap เปอร์เซ็นไทล์อย่างไม่ถูกต้อง ด้านล่างเป็นสมุดบันทึก R ที่ฉันเขียน

ข้อผูกมัดในการอ้างอิง MIT อันดับแรกมารับข้อมูล MIT เข้าสู่ R. ฉันทำการตัดและวางของตัวอย่างบูตของพวกเขาและบันทึกลงใน boot.txt

ซ่อน orig.boot = c (30, 37, 36, 43, 42, 43, 43, 46, 41, 42) boot = read.table (file = "boot.txt") หมายถึง = as.numeric (lapply (บูต) , mean)) # lapply สร้างรายการไม่ใช่เวกเตอร์ ฉันใช้มันเสมอสำหรับเฟรมข้อมูล mu = mean (orig.boot) del = sort (หมายถึง - mu) # ความแตกต่าง mu หมายถึง del และเพิ่มเติม

ซ่อน mu - sort (del) [3] mu - sort (del) [18] ดังนั้นเราจึงได้คำตอบเดียวกับที่พวกเขาทำ โดยเฉพาะฉันมีเปอร์เซ็นไทล์ที่ 10 และ 90 เหมือนกัน ฉันต้องการชี้ให้เห็นว่าช่วงจาก 10 ถึงเปอร์เซ็นต์ไทล์ที่ 90 คือ 3 นี่เป็นเหมือนกับ MIT

ฉันหมายถึงอะไร

ซ่อนหมายถึงการจัดเรียง (หมายถึง) ฉันได้รับวิธีการที่แตกต่างกัน จุดสำคัญ - วันที่ 10 และ 90 ของฉันหมายถึง 38.9 และ 41.9 นี่คือสิ่งที่ฉันคาดหวัง พวกมันแตกต่างกันเพราะฉันกำลังพิจารณาระยะทางจาก 40.3 ดังนั้นฉันจึงกลับลำดับการลบ โปรดทราบว่า 40.3-38.9 = 1.4 (และ 40.3 - 1.6 = 38.7) ดังนั้นสิ่งที่พวกเขาเรียกว่า bootstrap เปอร์เซ็นไทล์ให้การแจกแจงที่ขึ้นอยู่กับค่าเฉลี่ยที่เราได้รับและไม่ใช่ความแตกต่าง

จุดสำคัญ Bootstrap เชิงประจักษ์และ Bootstrap เปอร์เซ็นไทล์จะแตกต่างกันในสิ่งที่พวกเขาเรียก Bootstrap เชิงประจักษ์จะเป็นช่วงเวลา [x ∗ ¯ − δδ 1, x ∗ ¯ − δ ,.1, x ∗ ¯ − δ.9] ในขณะที่เปอร์เซ็นไทล์บูตสแตรปจะมีช่วงความมั่นใจ [x ∗ ¯ − δ.9, x ∗ ¯ − δ.1] [x ∗ ¯ − δδ.1, ] โดยทั่วไปแล้วพวกเขาไม่ควรจะแตกต่างกัน ฉันมีความคิดตามที่ฉันต้องการ แต่ฉันไม่ใช่แหล่งที่ชัดเจนที่ OP ร้องขอ การทดลองทางความคิด - ทั้งสองควรมาบรรจบกันหากขนาดตัวอย่างเพิ่มขึ้น ขอให้สังเกตว่ามีขนาดตัวอย่างที่เป็นไปได้ 210210 ขนาด 10 กันเถอะอย่าไปหาถั่ว แต่จะทำอย่างไรถ้าเราใช้ตัวอย่าง 2,000 ตัวอย่างขนาดปกติถือว่าเพียงพอ

ซ่อน set.seed (1234) # boot.2k ที่ทำซ้ำได้ = เมทริกซ์ (NA, 10,2000) สำหรับ (i ใน c (1: 2000)) {boot.2k [, i] = ตัวอย่าง (orig.boot, 10, แทนที่ = T)} mu2k = sort (ใช้ (boot.2k, 2, ค่าเฉลี่ย)) ลองดูที่ mu2k

ซ่อนข้อมูลสรุป (mu2k) ค่าเฉลี่ย (mu2k) -mu2k [200] ค่าเฉลี่ย (mu2k) - mu2k [1801] และค่าจริง -

ซ่อน mu2k [200] mu2k [1801] ดังนั้นสิ่งที่ MIT เรียกว่า bootstrap เชิงประจักษ์ให้ช่วงความมั่นใจ 80% ของ [, 40.3 -1.87,40.3 +1.64] หรือ [38.43,41.94] และการกระจายเปอร์เซ็นต์ไทล์ไม่ดีของพวกมันให้ [38.5, 42] หลักสูตรนี้เหมาะสมเนื่องจากกฎหมายจำนวนมากจะกล่าวในกรณีนี้ว่าการกระจายควรรวมเข้ากับการแจกแจงแบบปกติ บังเอิญมีการกล่าวถึงใน Efron และ Hastie วิธีแรกที่พวกเขาให้สำหรับการคำนวณช่วงบูทสแตรปคือใช้ mu = / - 1.96 sd ในขณะที่พวกเขาชี้ให้เห็นสำหรับขนาดของกลุ่มตัวอย่างที่มีขนาดใหญ่พอจะทำงานได้ พวกเขาให้ตัวอย่างซึ่ง n = 2000 ไม่ใหญ่พอที่จะได้รับการแจกแจงปกติของข้อมูล

ข้อสรุปประการแรกฉันต้องการระบุหลักการที่ฉันใช้ในการตัดสินใจตั้งคำถาม “ มันเป็นปาร์ตี้ของฉันฉันสามารถร้องไห้ได้ถ้าฉันต้องการ” ในขณะที่ Petula Clark ประกาศใช้เดิมฉันคิดว่ามันใช้โครงสร้างการตั้งชื่อด้วย ด้วยความเคารพอย่างจริงใจต่อ MIT ฉันคิดว่า Bradley Efron สมควรได้รับการตั้งชื่อวิธีการบูตสแตรปตามที่เขาต้องการ เขาทำอะไร ? ฉันไม่สามารถพูดถึง Efron ใน 'empirical bootstrap' เพียงเปอร์เซนต์ ดังนั้นฉันจะไม่เห็นด้วยอย่างนอบน้อมกับ Rice, MIT และอื่น ๆ ฉันจะชี้ให้เห็นว่าตามกฎของคนจำนวนมากตามที่ใช้ในการบรรยายของ MIT การทดลองและเปอร์เซ็นไทล์ควรรวมกันเป็นจำนวนเดียวกัน สำหรับรสนิยมของฉัน bootstrap เปอร์เซ็นไทล์นั้นใช้งานง่ายมีเหตุผลและสิ่งที่นักประดิษฐ์ bootstrap มีอยู่ในใจ ฉันจะเพิ่มว่าฉันใช้เวลาในการทำเช่นนี้เพียงเพื่อการแก้ไขของฉันเองไม่ใช่สิ่งอื่นใด โดยเฉพาะอย่างยิ่ง, ฉันไม่ได้เขียน Efron ซึ่งน่าจะเป็นสิ่งที่ OP ควรทำ ฉันยินดีที่จะแก้ไขให้ถูกต้องที่สุด


3
"ฉันคิดว่ามันยุติธรรมที่จะบอกว่าเขาเป็นนักสถิติที่มีชื่อเสียง" - ใช่ฉันจะบอกว่ายุติธรรม!
Xavier Bourret Sicotte

ผมคิดว่าสิ่ง OP เรียกว่า "boostrap เชิงประจักษ์" คือสิ่งที่วิกิพีเดียเรียกว่า "บูตพื้นฐาน" ที่นี่en.wikipedia.org/wiki/... มันใช้เปอร์เซ็นไทล์เดียวกับ "เปอร์เซ็นไทล์บูตสแตรป" คุณพูดถูก แต่มันพลิกไปมา Efron และ Hastie รวมสิ่งนี้ไว้ใน 4 วิธีการหรือไม่? พวกเขาจะเรียกมันว่าอย่างไร?
อะมีบาพูดว่า Reinstate Monica

ฉันพยายามอธิบายสิ่งนี้ในคำถามตามสิ่งที่ฉันอ่านในบันทึกของ MIT แจ้งให้เราทราบหากมีสิ่งใดที่ไม่ชัดเจน (หรือหากคุณมีเวลาในการตรวจสอบบันทึกย่อด้วยตนเองให้ตรวจสอบความถูกต้องของโพสต์ของฉัน)
คลาริเน็ต

@ ซาเวียร์คนหนึ่งสามารถสร้างกรณีที่คำสั่ง Efron ของฉันคือการพูดเกินจริง
aginensky

1
ข้อความของคุณว่า "สิ่งที่พวกเขาเรียกว่า bootstrap เชิงประจักษ์จะเป็นช่วงเวลา ," โดยที่เป็นค่าเฉลี่ยของการประมาณ bootstrap ไม่ถูกต้องในแง่ของหน้า MIT ที่เชื่อมโยงโดย OP เชิงประจักษ์ / bootstrap ขั้นพื้นฐานตรวจสอบการกระจายความแตกต่างของการประมาณการ bootstrap จากการประมาณการตัวอย่างดั้งเดิมไม่ใช่การกระจายตัวของ bootstrap ประมาณการตัวเอง สิ่งนี้นำไปสู่ความแตกต่างที่ร้ายแรงใน CI หากมีอคติตามคำตอบของฉัน ดูหน้านี้สำหรับตัวอย่าง [x¯δ.1,x¯δ.9]x¯
EdM

2

ดังที่ระบุไว้แล้วในการตอบก่อนหน้านี้ "empirical bootstrap" เรียกว่า "bootstrap ขั้นพื้นฐาน" ในแหล่งอื่น ๆ (รวมถึง R function boot.ci ) ซึ่งเหมือนกันกับ "บูต bootstrap เปอร์เซ็นไทล์" ที่จุดประเมิน Venables and Ripley write ("Statstics ประยุกต์สมัยใหม่กับ S", 4 ed., Springer, 2002, p. 136):

ในปัญหาที่ไม่สมมาตรช่วงเวลาพื้นฐานและเปอร์เซ็นต์ไทล์จะแตกต่างกันมากและช่วงเวลาพื้นฐานดูสมเหตุสมผลกว่า

จากความอยากรู้ฉันได้ทำการจำลองแบบ MonteCarlo อย่างกว้างขวางด้วยการประมาณค่าแบบอสมมาตรสองตัวและพบว่า - สำหรับความประหลาดใจของฉันเอง - ตรงข้ามกันนั่นคือช่วงเวลาเปอร์เซ็นไทล์ดีกว่าช่วงเวลาพื้นฐานในแง่ของความน่าจะเป็น นี่คือผลลัพธ์ของฉันที่มีความน่าจะเป็นครอบคลุมสำหรับแต่ละขนาดตัวอย่างประมาณด้วยตัวอย่างที่แตกต่างกันหนึ่งล้านตัวอย่าง (นำมาจากรายงานทางเทคนิคนี้หน้า 26f):n

1) ค่าเฉลี่ยของการกระจายแบบอสมมาตรที่มีความหนาแน่น ในกรณีนี้ช่วงความเชื่อมั่นแบบคลาสสิกและจะได้รับการเปรียบเทียบf(x)=3x2 ± t 1 - α / 2 ความน่าจะเป็นความครอบคลุมของช่วงบูทสแตรปที่แตกต่างกันสำหรับค่าเฉลี่ยของการแจกแจงแบบอสมมาตร±t1α/2s2/n)±z1α/2s2/n)

2) ควรจะเป็นสูงสุดประมาณการสำหรับในการกระจายการชี้แจง ในกรณีนี้ทั้งสองช่วงความเชื่อมั่นทางเลือกที่จะได้รับสำหรับการเปรียบเทียบ:ครั้งการเข้าสู่ระบบรัฐโอกาสผกผันและคูณตัวประมาณค่าความแปรปรวน Jackknifeλ± z 1 - α / 2 ± z 1 - α / 2ความน่าจะเป็นความครอบคลุมสำหรับช่วง Bootstrap ที่แตกต่างกันสำหรับ ML ประมาณ±z1α/2±z1α/2

ในทั้งสองกรณีการใช้งาน bootstrap ของ BCa นั้นมีความน่าจะเป็นที่ครอบคลุมมากที่สุดในวิธีการ bootstrap และ bootstrap เปอร์เซ็นไทล์มีความน่าจะเป็นความครอบคลุมที่สูงกว่า bootstrap แบบพื้นฐาน / เชิงประจักษ์

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.