การใช้ bootstrap เพื่อรับการกระจายตัวตัวอย่างของค่าร้อยละที่ 1


9

ฉันมีกลุ่มตัวอย่าง (ขนาด 250) จากประชากร ฉันไม่ทราบว่าการกระจายตัวของประชากร

คำถามหลัก:ฉันต้องการประมาณจุดของ 1 เซนต์ - เปอร์เซ็นไทล์ของประชากรแล้วฉันต้องการช่วงความมั่นใจ 95% รอบการประเมินจุดของฉัน

ประมาณการจุดของฉันจะเป็นตัวอย่าง 1 เซนต์ -percentile ผมหมายถึงมันxx

หลังจากนั้นฉันพยายามสร้างช่วงความมั่นใจรอบค่าประมาณจุด ฉันสงสัยว่ามันสมเหตุสมผลหรือไม่ที่จะใช้ bootstrap ที่นี่ ฉันไม่มีประสบการณ์มากกับ bootstrap ดังนั้นขออภัยถ้าฉันไม่สามารถใช้คำศัพท์ที่เหมาะสมเป็นต้น

นี่คือวิธีที่ฉันพยายามทำ ฉันดึงตัวอย่างสุ่ม 1,000 ตัวอย่างโดยแทนที่จากตัวอย่างดั้งเดิมของฉัน ฉันได้รับอันดับ 1 จากแต่ละคน ดังนั้นฉันมี 1,000 คะแนน - "1 เซนต์ - เปอร์เซ็นไทล์" ฉันดูการกระจายเชิงประจักษ์ของ 1,000 คะแนน ผมหมายถึงความหมายของมัน{} ผมหมายถึงว่า "อคติ" ดังต่อไปนี้: \ฉันใช้เวลา 2.5 วัน -percentile และ 97.5 THเปอร์เซ็นไทล์ของ 1000 จุดที่จะได้รับที่ต่ำกว่าและปลายที่สูงขึ้นของสิ่งที่ผมเรียกความเชื่อมั่น 95% รอบ 1 เซนต์ -percentile ของกลุ่มตัวอย่างเดิม ฉันหมายถึงจุดเหล่านี้และ{0.975}xmeanbias=xmeanxx0.025x0.975

ขั้นตอนสุดท้ายที่เหลืออยู่คือการปรับตัวเข้ากับช่วงความเชื่อมั่นนี้จะอยู่ที่ประมาณ 1 เซนต์ -percentile ของประชากรมากกว่ารอบ 1 เซนต์ -percentile ของตัวอย่างเดิม ดังนั้นฉันจึงใช้เป็นส่วนล่างและเป็นส่วนบน ของช่วงความเชื่อมั่น 95% รอบการประเมินจุดของประชากรที่ 1 - เซนต์ ช่วงเวลาสุดท้ายนี้คือสิ่งที่ฉันต้องการxbias(xmeanx0.025)xbias+(x0.975xmean)

สำคัญจุดในความคิดของฉันคือว่ามันทำให้รู้สึกถึงการใช้บูต 1 เซนต์ -percentile ซึ่งค่อนข้างใกล้กับหางของการกระจายที่ไม่รู้จักพื้นฐานของประชากร ฉันสงสัยว่าอาจเป็นปัญหา คิดเกี่ยวกับการใช้ bootstrap เพื่อสร้างช่วงความมั่นใจรอบต่ำสุด (หรือสูงสุด)

แต่วิธีการนี้อาจมีข้อบกพร่อง? โปรดแจ้งให้เราทราบ

แก้ไข:

มีความคิดเกี่ยวกับปัญหาเล็ก ๆ น้อย ๆ มากขึ้นผมเห็นว่าวิธีการแก้ปัญหาของฉันหมายถึงต่อไปนี้: การทดลองที่ 1 เซนต์เปอร์เซ็นต์ของกลุ่มตัวอย่างเดิมอาจจะเป็นที่ประมาณการลำเอียงของ 1 เซนต์เปอร์เซ็นต์ของประชากร และถ้าเป็นเช่นประมาณการจุดที่ควรจะมีอคติปรับ:{} มิฉะนั้นช่วงความเชื่อมั่นที่ปรับด้วยอคติจะไม่สามารถทำงานร่วมกันได้กับการประเมินจุดที่ไม่ได้รับการปรับแต่ง ฉันต้องปรับทั้งค่าประมาณจุดและช่วงความเชื่อมั่นหรือไม่มีค่าใด ๆxbias

ในทางกลับกันถ้าฉันไม่อนุญาตให้มีการประเมินว่ามีอคติฉันจะไม่ต้องทำการปรับตั้งค่า นั่นคือฉันจะใช้เป็นจุดประมาณและเป็นส่วนล่างและเป็นส่วนบนของ 95% ช่วงความเชื่อมั่น ฉันไม่แน่ใจว่าช่วงเวลานี้เหมาะสมหรือไม่xx(xmeanx0.025)x+(x0.975xmean)

ดังนั้นไม่ได้ทำให้รู้สึกใด ๆ ที่จะคิดว่ากลุ่มตัวอย่าง 1 เซนต์เปอร์เซ็นต์เป็นประมาณการลำเอียงของประชากร 1 เซนต์เปอร์เซ็นต์? และถ้าไม่แก้ปัญหาทางเลือกของฉันถูกต้อง?


นี่ไม่ได้ตอบคำถาม bootstrap โดยตรง แต่อาจเป็นประโยชน์กับคุณ: onlinecourses.science.psu.edu/stat414/node/231
shadowtalker

คำตอบ:


11

การอนุมาน Bootstrap สำหรับสุดขั้วของการกระจายนั้นโดยทั่วไปน่าสงสัย เมื่อทำการ bootstrapping n-out-of-n ขั้นต่ำสุดหรือสูงสุดในตัวอย่างของ sizeคุณมีโอกาสที่คุณจะทำซ้ำการสังเกตอย่างรุนแรงตัวอย่างของคุณและในทำนองเดียวกันประมาณโอกาสที่จะสร้างการสังเกตการณ์ขั้นที่สองอีกครั้งและอื่น ๆ คุณจะได้การกระจายแบบกำหนดรูปแบบซึ่งมีส่วนเกี่ยวข้องกับรูปร่างของการกระจายตัวที่หาง ยิ่งกว่านั้น bootstrap ไม่สามารถให้อะไรคุณต่ำกว่าค่าต่ำสุดตัวอย่างของคุณแม้ว่าการแจกแจงจะมีการสนับสนุนต่ำกว่าค่านี้ (เช่นกรณีที่มีการแจกแจงแบบต่อเนื่องส่วนใหญ่เช่นปกติ)n1(11/n)n1exp(1)=63.2%exp(1)exp(2)=23.3%

การแก้ปัญหามีความซับซ้อนและพึ่งพาการรวมกันของ asymptotics จากทฤษฎีค่าสุดขีดและการsubsamplingน้อยกว่าการสังเกต n (อันที่จริงวิธีที่น้อยกว่าอัตราควรมาบรรจบกันที่ศูนย์เป็น )n


คำตอบนั้นมีประโยชน์ แต่ฉันต้องการทราบว่าเปอร์เซ็นไทล์ที่ 1 ใกล้ถึงระดับต่ำสุดโดยคำนึงถึงพฤติกรรมของ bootstrap อย่างไร ฉันเดาว่าในตัวอย่างที่มีขนาดใหญ่มากเปอร์เซ็นไทล์ที่ 1 ถือได้ว่าเป็น "ไกล" จากขั้นต่ำและปัญหาที่ระบุข้างต้นสามารถถูกเพิกเฉยได้ในขณะที่ในตัวอย่างขนาดเล็กเปอร์เซ็นไทล์ที่ 1 จะมีค่าต่ำสุดเอง ดังนั้นเราจึงอยู่ที่ไหนสักแห่งในระหว่าง ฉันเดาว่าขนาดตัวอย่างของฉันจากการสังเกตการณ์ 250 ครั้งนั้นถือว่าเล็กมากในแง่นี้
Richard Hardy
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.