Bootstrapping ไม่ได้สันนิษฐานความรู้ใด ๆ เกี่ยวกับรูปแบบของการแจกแจงพาเรนต์ต้นแบบจากตัวอย่างที่เกิดขึ้น การประมาณค่าพารามิเตอร์ทางสถิติแบบคลาสสิกแบบดั้งเดิมนั้นขึ้นอยู่กับข้อสมมติปกติ Bootstrap เกี่ยวข้องกับการไม่ปกติและมีความแม่นยำในการปฏิบัติมากกว่าวิธีการแบบดั้งเดิม
Bootstrapping ใช้แทนการคำนวณแบบดิบของคอมพิวเตอร์เพื่อการวิเคราะห์เชิงทฤษฎีอย่างเข้มงวด มันเป็นค่าประมาณสำหรับการกระจายตัวตัวอย่างของคำข้อผิดพลาดของชุดข้อมูล Bootstrapping รวมถึง: การสุ่มตัวอย่างข้อมูลใหม่ตั้งค่าจำนวนครั้งที่ระบุคำนวณค่าเฉลี่ยจากแต่ละตัวอย่างและค้นหาข้อผิดพลาดมาตรฐานของค่าเฉลี่ย
รหัส“ R” ต่อไปนี้แสดงแนวคิด:
ตัวอย่างที่ใช้งานได้จริงนี้แสดงให้เห็นถึงประโยชน์ของการบูตสแตรปและการประเมินข้อผิดพลาดมาตรฐาน ข้อผิดพลาดมาตรฐานจำเป็นต้องใช้ในการคำนวณช่วงความมั่นใจ
ให้เราสมมติว่าคุณมีชุดข้อมูลที่เอียง "a":
a<-rexp(395, rate=0.1) # Create skewed data
การสร้างภาพของชุดข้อมูลที่เบ้
plot(a,type="l") # Scatter plot of the skewed data
boxplot(a,type="l") # Box plot of the skewed data
hist(a) # Histogram plot of the skewed data
ทำตามขั้นตอน bootstrapping:
n <- length(a) # the number of bootstrap samples should equal the original data set
xbarstar <- c() # Declare the empty set “xbarstar” variable which will be holding the mean of every bootstrap iteration
for (i in 1:1000) { # Perform 1000 bootstrap iteration
boot.samp <- sample(a, n, replace=TRUE) #”Sample” generates the same number of elements as the original data set
xbarstar[i] <- mean(boot.samp)} # “xbarstar” variable collects 1000 averages of the original data set
##
plot(xbarstar) # Scatter plot of the bootstrapped data
boxplot(xbarstar) # Box plot of the bootstrapped data
hist(xbarstar) # Histogram plot of the bootstrapped data
meanOfMeans <- mean(xbarstar)
standardError <- sd(xbarstar) # the standard error is the standard deviation of the mean of means
confidenceIntervalAboveTheMean <- meanOfMeans + 1.96 * standardError # for 2 standard deviation above the mean
confidenceIntervalBelowTheMean <- meanOfMeans - 1.96 * standardError # for 2 standard deviation above the mean
confidenceInterval <- confidenceIntervalAboveTheMean + confidenceIntervalBelowTheMean
confidenceInterval