ทำไมข้อมูลควรถูกสุ่มใหม่ภายใต้สมมติฐานว่างในการทดสอบสมมติฐานบูตสแตรป?


11

การใช้วิธีการ bootstrap ที่ตรงไปตรงมาเพื่อทดสอบสมมติฐานคือการประมาณช่วงความมั่นใจของสถิติการทดสอบ โดยการคำนวณซ้ำ ๆ บนตัวอย่าง bootstrapped (ปล่อยให้สถิติตัวอย่างจาก bootstrap เรียกว่า ) เราปฏิเสธถ้าสมมติฐานพารามิเตอร์ (ซึ่งมักจะมีค่าเท่ากับ 0) โกหกนอกช่วงความเชื่อมั่นของtheta} θ ^ θ * H0θ0 ^ θ *θ^θ^θ* * * *^H0θ0θ* * * *^

ฉันอ่านแล้วว่าวิธีนี้ไม่มีพลังงานบ้าง ในบทความโดยHall P. และ Wilson SR "สองแนวทางสำหรับการทดสอบสมมติฐาน Bootstrap" (1992)มันถูกเขียนเป็นแนวทางแรกว่าเราควร resampleไม่ใช่\ และนี่คือส่วนที่ฉันไม่เข้าใจ^ θ * -θ0θ* * * *^-θ^θ* * * *^-θ0

นั่นไม่ใช่วัดแค่ความลำเอียงของตัวประมาณ ? สำหรับตัวประมาณค่าที่เป็นกลางช่วงความมั่นใจของนิพจน์นี้ควรเล็กกว่าแต่ฉันไม่เห็นสิ่งที่ต้องทำเกี่ยวกับการทดสอบ ? มีที่ไหนที่ฉันสามารถมองเห็นเราใส่ข้อมูลเกี่ยวกับ\^ θ * ^ θ * -θ0 θ =θ0θ0θ* * * *^-θ^θ* * * *^θ* * * *^-θ0θ^=θ0θ0


สำหรับบรรดาของคุณที่ไม่สามารถเข้าถึงบทความนี้เป็นคำพูดของวรรคที่เกี่ยวข้องซึ่งมาทันทีหลังจากวิทยานิพนธ์:

เพื่อชื่นชมว่าทำไมสิ่งนี้จึงสำคัญสังเกตว่าการทดสอบจะเกี่ยวข้องกับการปฏิเสธหากใน คือ "ใหญ่เกินไป" ถ้าเป็นทางยาวจากมูลค่าที่แท้จริงของ (เช่นถ้าเป็นข้อผิดพลาดอย่างไม่มีการลด) แล้วความแตกต่าง จะไม่ดูใหญ่เกินไปเมื่อเทียบกับการกระจาย bootstrap ที่ไม่ใช่พารามิเตอร์ของ. การเปรียบเทียบที่มีความหมายมากขึ้นคือการกระจายของ. ที่จริงแล้วถ้ามูลค่าที่แท้จริงของคือ| θ - θ 0 | θ 0 θ H 0 | θ - θ 0 | | θ - θ 0 | | ^ θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ θ * - θ | | θ 1 - θ 0 |H0|θ^-θ0|θ0θH0|θ^-θ0||θ^-θ0||θ* * * *^-θ^|θθ1ดังนั้นพลังของการทดสอบบูตสแตรปจะเพิ่มขึ้นเป็น 1 เมื่อการเพิ่มขึ้นของการทดสอบที่จัดไว้ให้อยู่บนพื้นฐานของ resampling แต่พลังจะลดลงถึงระดับนัยสำคัญมากที่สุด (เป็นเพิ่ม) ถ้าการทดสอบอยู่บนพื้นฐานของการ resampling |θ1-θ0||θ* * * *^-θ^||θ1-θ0||θ^-θ0|

คำตอบ:


7

นี่เป็นหลักการเปรียบเทียบบูตสแตรป (ที่รู้จัก) อยู่ภายใต้การจัดจำหน่ายจริงผลิตตัวอย่างที่อยู่ในมือกับ CDFซึ่งจะผลิตสถิติสำหรับบางคนทำงานcdot) ความคิดของคุณเกี่ยวกับการใช้ bootstrap คือการสร้างคำสั่งเกี่ยวกับการกระจายตัวตัวอย่างตามการกระจายที่รู้จักซึ่งคุณพยายามใช้โปรโตคอลการสุ่มตัวอย่างที่เหมือนกัน (ซึ่งเป็นไปได้เฉพาะกับข้อมูล iid เท่านั้น แม่นยำหนึ่งสามารถทำซ้ำกระบวนการสุ่มตัวอย่าง) และใช้ฟังก์ชันเดียวกัน ฉันแสดงมันในโพสต์อื่นx 1 , ... , x n F n θ = T ( F n ) T ( ) ~ F T ( ) θ - θ 0 θ * ~ F T ( ) T ( ~ F ) ~ F = F n T ( F n ) θFx1,...,xnFnθ^=T(Fn)T()F~T()ด้วย (สิ่งที่ฉันคิดว่าเป็น) แผนภาพเรียบร้อย ดังนั้นบูตอะนาล็อกของส่วนเบี่ยงเบน (สุ่ม + ระบบ) , จำนวนดอกเบี้ยส่วนกลางของคุณคือส่วนเบี่ยงเบนของ bootstrap ทำซ้ำจากสิ่งที่รู้กันว่าเป็นจริงสำหรับการแจกแจงกระบวนการสุ่มตัวอย่างที่คุณนำไปใช้และทำงานคือมาตรการของแนวโน้มเข้าสู่ส่วนกลางคือF) หากคุณใช้ bootstrap nonparametric มาตรฐานที่มีการแทนที่จากข้อมูลดั้งเดิมของคุณดังนั้นการวัดแนวโน้มกลางของคุณจะต้องเป็นตามข้อมูลต้นฉบับθ^-θ0θ^* * * *F~T()T(F~)F~=FnT(Fn)θ^

นอกจากการแปลแล้วยังมีปัญหาเกี่ยวกับ subtler ที่เกิดขึ้นกับการทดสอบ bootstrap ซึ่งบางครั้งก็ยากที่จะเอาชนะ การกระจายตัวของสถิติการทดสอบภายใต้ค่า Null อาจแตกต่างอย่างมากจากการกระจายของสถิติการทดสอบภายใต้ทางเลือก (เช่นในการทดสอบในขอบเขตของพื้นที่พารามิเตอร์ซึ่งล้มเหลวด้วย bootstrap ) การทดสอบง่ายๆที่คุณได้เรียนรู้ในชั้นเรียนระดับปริญญาตรีเช่น -test มีความคงที่อยู่ใต้กะ แต่ความคิดของ "Heck ฉันเพียงแค่เปลี่ยนทุกอย่าง" ล้มเหลวเมื่อคุณต้องย้ายไปอีกระดับของความซับซ้อนแนวคิดเชิงการทดสอบ คิดว่าเรื่องนี้: คุณกำลังทดสอบว่าและข้อสังเกตของคุณx จากนั้นเมื่อคุณสร้างχ 2 μ = 0 ˉ x = 0.78 χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) ˉ x 2 * / ( s 2 * / n ) n ˉ x 2 / s 2เสื้อχ2μ=0x¯=0.78χ2 testพร้อมอะนาล็อก bootstrapจากนั้นการทดสอบนี้มีไม่ใช่ศูนย์กลางในตัวของตั้งแต่เริ่มต้นแทนที่จะเป็นแบบทดสอบส่วนกลางตามที่เราคาดหวัง ในการทำให้ศูนย์กลางการทดสอบบู๊ตคุณต้องลบค่าประมาณดั้งเดิม(x¯-μ)2/(s2/n)x¯2/(s2/n)x¯* * * *2/(s* * * *2/n)nx¯2/s2

การไม่สามารถหลีกเลี่ยงได้ในบริบทหลายตัวแปรตั้งแต่ PearsonสำหรับตารางฉุกเฉินไปจนถึงBollen-Stine bootstrapของสถิติการทดสอบในแบบจำลองสมการโครงสร้าง แนวคิดของการขยับกระจายเป็นเรื่องยากมากที่จะกำหนดได้ดีในสถานการณ์เหล่านี้ ... แม้ว่าในกรณีของการทดสอบในการฝึกอบรมความแปรปรวนหลายตัวแปรนี้เป็น doable โดยหมุนที่เหมาะสมχ 2χ2χ2


ขอบคุณ. มีใครคิดว่าฉันยังไม่เข้าใจ: เราจะใส่ข้อมูลเกี่ยวกับไว้ใน bootstrap ได้ที่ไหน? โดยที่เป็นเท็จอาจถูกตัดออกอย่างมากจากการแจกแจงที่แท้จริง H 0 θ 0θ0H0θ0
Adam Ryczkowski

คุณคำนวณค่า p ภายใต้ null ดังนั้นคุณควรพิจารณากรณีและปัญหาเมื่อสอดคล้องกับ null การพิจารณาทางเลือกนั้นเป็นสิ่งที่ควรค่าแก่การทำภายใต้ทางเลือก แต่นั่นคือ ... ว้าว ... จะเป็นการใช้ขั้นสูงของวิธีการทดสอบ bootstrap θ0
StasK

3

ตกลงฉันเข้าใจแล้ว ขอบคุณ StasK สำหรับคำตอบที่ดี ฉันจะให้มันเป็นที่ยอมรับสำหรับคนอื่น ๆ ที่จะเรียนรู้ แต่ในกรณีของฉันโดยเฉพาะฉันพลาดข้อเท็จจริงง่ายๆ:

ขั้นตอนการบู๊ตสแตรปตามแนวทางของ Hall & Wilson สำหรับการทดสอบค่าเฉลี่ยตัวอย่างง่ายๆคือ (ในรหัสเทียมที่ได้แรงบันดาลใจจาก R):

1function(data,θ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ* * * *^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ* * * *^θ^ ) count++
8 }
9 count/1000
10 }

ส่วนที่ฉันพลาดคือคือ "ใช้แล้ว" ในบรรทัด(ที่เราตั้งค่าการอ้างอิง )θ02θ^

เป็นที่น่าสนใจที่จะต้องทราบว่าในบรรทัด2และ6เราสามารถเท่าเทียมกันได้อย่างง่ายดายใช้แทนp.value statisticในกรณีที่ว่าเราก็ควรเปลี่ยนเข้าในสาย7


ฉันลงคะแนนก่อนหน้านี้ แต่แล้วตระหนักว่านี่ไม่ถูกต้องจริง ตามที่ Hall & Wilson (ส่วนที่ 2 หน้า 278)เป็นตัวประมาณของไม่ใช่สถิติทดสอบตามที่คุณแสดง วิธีที่เข้ามาในการเล่นคือเราทำการกระจายการกระจายของแล้วดูว่าดู "สุดขั้ว" เมื่อเปรียบเทียบกับการกระจายที่สุ่มใหม่ θ^θθ0(θ^* * * *-θ^)(θ^-θ0)
half-pass

1
อาจมีประโยชน์: Michael Chernick ให้สัญชาตญาณรวบรัดเพื่อตอบคำถามที่เกี่ยวข้องของฉันที่นี่ stats.stackexchange.com/questions/289236/… )
half-pass
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.