อะไรคือความหมายของช่วงความมั่นใจที่นำมาจากตัวอย่างที่เก็บมาใหม่


38

ฉันได้ดูคำถามมากมายในเว็บไซต์นี้เกี่ยวกับช่วงการบูตและความมั่นใจ แต่ฉันก็ยังสับสนอยู่ สาเหตุส่วนหนึ่งของความสับสนของฉันอาจเป็นเพราะฉันไม่ได้มีความรู้ทางสถิติเพียงพอที่จะเข้าใจคำตอบมากมาย ฉันประมาณครึ่งทางผ่านหลักสูตรสถิติเบื้องต้นและระดับคณิตศาสตร์ของฉันเป็นเพียงกลางคันพีชคณิต II ดังนั้นทุกอย่างที่ผ่านมาในระดับนั้นจะทำให้ฉันสับสน หากหนึ่งในผู้ที่มีความรู้ในไซต์นี้สามารถอธิบายปัญหานี้ในระดับของฉันมันจะเป็นประโยชน์อย่างมาก

เราได้เรียนรู้ในชั้นเรียนว่าจะนำชิ้นส่วนใหม่โดยใช้วิธี bootstrap และใช้เพื่อสร้างช่วงความมั่นใจสำหรับสถิติบางอย่างที่เราต้องการวัด ตัวอย่างเช่นสมมติว่าเรานำตัวอย่างจากประชากรจำนวนมากและพบว่า 40% บอกว่าพวกเขาจะลงคะแนนให้กับผู้สมัครก. เราคิดว่าตัวอย่างนี้เป็นภาพสะท้อนที่ถูกต้องแม่นยำของประชากรดั้งเดิมซึ่งในกรณีนี้เราสามารถ resamples จาก เพื่อค้นพบบางสิ่งเกี่ยวกับประชากร ดังนั้นเราจึงทำการทดสอบซ้ำและค้นหา (ใช้ระดับความเชื่อมั่น 95%) ว่าช่วงความเชื่อมั่นที่ได้นั้นอยู่ในช่วงตั้งแต่ 35% ถึง 45%

คำถามของฉันคือช่วงความมั่นใจนี้จริงหมายถึงอะไร

ฉันอ่านต่อไปเรื่อย ๆ ว่ามีความแตกต่างระหว่างช่วงความเชื่อมั่น (Frequentistist) และ (Bayesian) ถ้าผมเข้าใจอย่างถูกต้องในช่วงเวลาที่น่าเชื่อถือจะบอกว่ามีโอกาส 95% ที่ว่าในสถานการณ์ของเราพารามิเตอร์ที่แท้จริงคือภายในช่วงเวลาที่กำหนด (35% -45%) ในขณะที่ช่วงความเชื่อมั่นจะบอกว่ามี 95% ที่อยู่ในนี้ ประเภทของสถานการณ์ (แต่ไม่จำเป็นในสถานการณ์ของเราโดยเฉพาะ) วิธีการที่เราใช้จะต้องรายงานอย่างถูกต้องว่าพารามิเตอร์ที่แท้จริงนั้นอยู่ในช่วงเวลาที่กำหนด

ถ้าคำจำกัดความนี้ถูกต้องคำถามของฉันคือ: "พารามิเตอร์ที่แท้จริง" ที่เรากำลังพูดถึงเมื่อใช้ช่วงความเชื่อมั่นที่สร้างขึ้นโดยใช้วิธีการ bootstrap คืออะไร? เราอ้างถึง (a) พารามิเตอร์จริงของประชากรดั้งเดิมหรือ (b) พารามิเตอร์จริงของตัวอย่างหรือไม่ ถ้า (a) เราจะบอกว่า 95% ของเวลาที่วิธีบูตสแตรปจะรายงานข้อความจริงเกี่ยวกับประชากรดั้งเดิมอย่างถูกต้อง แต่เราจะรู้ได้อย่างไร? วิธี bootstrap ทั้งหมดไม่วางอยู่บนสมมติฐานตัวอย่างดั้งเดิมนั้นเป็นภาพสะท้อนที่ถูกต้องของประชากรที่นำมาจากไหน? ถ้า (b) ฉันไม่เข้าใจความหมายของช่วงความมั่นใจเลย เราไม่ทราบพารามิเตอร์จริงของตัวอย่างหรือไม่ เป็นการวัดที่ตรงไปตรงมา!

ฉันพูดคุยเรื่องนี้กับอาจารย์ของฉันและเธอก็มีประโยชน์มาก แต่ฉันก็ยังสับสนอยู่

คำตอบ:


28

หากขั้นตอนการเริ่มต้นการบูตและการก่อตัวของช่วงความเชื่อมั่นได้ดำเนินการอย่างถูกต้องนั่นหมายถึงเช่นเดียวกับช่วงความมั่นใจอื่น ๆ จากมุมมองของ frequentist เป็น 95% CI หมายความว่าถ้าการศึกษาทั้งหมดซ้ำเหมือนกันไม่มีที่สิ้นสุด , 95% ของช่วงความเชื่อมั่นดังกล่าวที่เกิดขึ้นในลักษณะนี้จะรวมถึงมูลค่าที่แท้จริง แน่นอนในการศึกษาของคุณหรือในการศึกษาเดี่ยว ๆ ช่วงเวลาของความมั่นใจจะรวมถึงมูลค่าที่แท้จริงหรือไม่ แต่คุณจะไม่รู้ เพื่อทำความเข้าใจแนวคิดเหล่านี้เพิ่มเติมอาจช่วยให้คุณอ่านคำตอบของฉันที่นี่: ทำไมช่วงเวลาความเชื่อมั่น 95% (CI) จึงไม่ได้หมายความถึงโอกาส 95% ในการเก็บค่าเฉลี่ย

x¯μ. สำหรับการสาธิตโดยย่อของคณิตศาสตร์ให้พิจารณาการจำลองต่อไปนี้โดยใช้R:

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952

เราใช้สมมติฐานแบบใดเป็นพิเศษ
iarwain

2
ขอบคุณ ฉันคิดว่าฉันพบสิ่งที่ฉันกำลังค้นหาในคำตอบที่สองของเธรดนั้น: "โปรดจำไว้ว่าเราไม่ได้ใช้วิธีการของตัวอย่างบูตสแตรปเพื่อประมาณค่าเฉลี่ยประชากรเราใช้ค่าเฉลี่ยตัวอย่างสำหรับสิ่งนั้น คือ) แต่เราใช้ตัวอย่างบูทสแตรปเพื่อประเมินคุณสมบัติ (การแพร่กระจายอคติ) ของการสุ่มตัวอย่างและการใช้การสุ่มตัวอย่างจากประชากรรู้ (เราหวังว่าจะเป็นตัวแทนของประชากรที่น่าสนใจ) เพื่อเรียนรู้ผลกระทบของการสุ่มตัวอย่าง และวงกลมน้อยกว่ามาก " ...
iarwain

1
... กล่าวอีกนัยหนึ่ง CI ทั้งหมดบอกเราว่าในประชากรโดยประมาณคล้ายกับของเราเราคาดว่า 95% ของตัวอย่างที่นำมาจากประชากรนั้นจะสะท้อนถึงมูลค่าที่แท้จริง +/- ขอบของข้อผิดพลาด ดังนั้นสิ่งที่เรากำลังทำคือให้เบาะแสที่หยาบมาก - บางทีอาจเป็นเบาะแสที่ดีที่สุดที่เรามี - ประมาณว่าสถิติตัวอย่างของเราใกล้เคียงกับพารามิเตอร์ประชากรที่แท้จริงได้อย่างไร ถ้าเป็นเช่นนั้นดูเหมือนว่าเราไม่ควรใช้ตัวเลขที่แน่นอนใน CI อย่างจริงจังเกินไป - พวกเขาหมายถึงบางอย่างเช่น "สถิติตัวอย่างอาจจะแม่นยำประมาณคร่าว ๆ ในระดับนี้" ฉันเข้าใจถูกไหม?
iarwain

1
ถูกต้องแล้ว CI ให้ความรู้สึกถึงความแม่นยำของการประมาณค่าของเรา แต่เราไม่เคยรู้เลยว่า CI ที่แท้จริงของเรามีค่าที่แท้จริงหรือไม่ สมมติฐานหลักคือข้อมูลของเราเป็นตัวแทนของประชากรที่สนใจ โปรดทราบว่าสิ่งเหล่านี้ไม่ได้มีเฉพาะกับซีไอเอbootstrappedคุณมีการตีความและสมมติฐานเดียวกันใน CI ที่คำนวณโดยใช้ทฤษฎีแบบอะซิมโทติค
gung - Reinstate Monica

1
นี่คือคำอธิบายที่ยอดเยี่ยม ฉันจะเพิ่มเฉพาะว่า "คุณค่าที่แท้จริง" เป็นบางครั้งสิ่งประดิษฐ์ของการออกแบบการศึกษา ในการลงคะแนนเลือกตั้งผู้สมัครทางการเมืองตัวอย่างแบ่งเป็นชั้น ๆ ให้การประมาณที่แม่นยำและเชื่อถือได้มากกว่าการสุ่มตัวอย่าง ค่าใช้จ่ายเป็นความเสี่ยงของการสุ่มตัวอย่างกลุ่มที่ไม่ถูกต้องโดยการออกแบบ ในกรณีดังกล่าว 95% CI นั้นมีศูนย์กลางอยู่ที่ค่าที่ถูกต้องซึ่งเป็นสิ่งที่ทำได้โดยการทำซ้ำinfinitum โฆษณาการศึกษาแต่ค่านั้นไม่ใช่ความรู้สึกอื่นของพารามิเตอร์จริง: พารามิเตอร์ที่เราต้องการประเมิน นี่คือเหตุผลที่การออกแบบการศึกษาและการอนุมานมีความเชื่อมโยงภายใน
AdamO

0

สิ่งที่คุณกำลังพูดคือไม่จำเป็นต้องหาช่วงความมั่นใจจากการรีบูตตัวอย่าง หากคุณพอใจกับสถิติ (ค่าเฉลี่ยตัวอย่างหรือสัดส่วนตัวอย่าง) ที่ได้จาก resamples bootstrapped ไม่พบช่วงความมั่นใจใด ๆ ดังนั้นไม่มีคำถามของการตีความ แต่ถ้าคุณไม่พอใจกับสถิติที่ได้จากตัวอย่างที่เก็บใหม่หรือพอใจ แต่ยังต้องการค้นหาช่วงความมั่นใจการตีความสำหรับช่วงความมั่นใจนั้นจะเหมือนกับช่วงความมั่นใจอื่น ๆ มันเป็นเพราะเมื่อ resamples bootstrapped ของคุณเป็นตัวแทน (หรือสันนิษฐานว่าเป็นเช่นนั้น) ประชากรดั้งเดิม แล้วความต้องการของช่วงความมั่นใจอยู่ที่ไหน สถิติจาก resamples bootstrapped เป็นพารามิเตอร์ประชากรเดิมเอง แต่เมื่อคุณไม่พิจารณาสถิติเป็นพารามิเตอร์ประชากรดั้งเดิมดังนั้นคุณไม่จำเป็นต้องค้นหาช่วงความมั่นใจ ดังนั้นทุกอย่างเกี่ยวกับวิธีที่คุณพิจารณา สมมติว่าคุณคำนวณช่วงความเชื่อมั่น 95% จากตัวอย่างที่เก็บใหม่ได้ ตอนนี้การตีความคือ: "95% ของเวลาวิธีบูตสแตรปนี้ส่งผลให้เกิดช่วงความเชื่อมั่นที่ถูกต้องซึ่งประกอบด้วยพารามิเตอร์ประชากรจริง"

(นี่คือสิ่งที่ฉันคิดว่าแก้ไขฉันหากมีข้อผิดพลาดใด ๆ )


-1

เรากำลังอ้างถึงพารามิเตอร์จริงของประชากรดั้งเดิม เป็นไปได้ที่จะทำเช่นนี้โดยสมมติว่าข้อมูลถูกสุ่มจากประชากรดั้งเดิม - ในกรณีนั้นมีข้อโต้แย้งทางคณิตศาสตร์ที่แสดงให้เห็นว่ากระบวนการบูตสแตรปจะให้ช่วงความมั่นใจที่ถูกต้องอย่างน้อยที่สุดเมื่อขนาดของชุดข้อมูลมีขนาดใหญ่เพียงพอ .


ดังนั้นดูเหมือนว่าเพื่อที่จะเข้าใจว่าทำไมการทำงานฉันจะต้องรู้คณิตศาสตร์เพียงพอที่จะปฏิบัติตามหลักฐานทางคณิตศาสตร์ ถูกต้องไหม
iarwain

ฉันคิดอย่างนั้น (ฉันไม่คุ้นเคยกับหลักฐาน)
Gareth

แม้ว่าโดยสังเขปคุณจะเห็นได้ว่าเมื่อขนาดตัวอย่างใหญ่ขึ้นตัวอย่างก็เริ่มดูเหมือนประชากรมากขึ้น ตัวอย่างเช่นสมมติว่าฉันใช้ตัวอย่าง 1 ล้านตัวอย่างจากการแจกแจงแบบปกติที่มีค่าเฉลี่ยและความแปรปรวนที่กำหนด เรียกตัวอย่างนี้ X ตัวอย่างสุ่ม (ที่มีการแทนที่) ที่ดึงมาจาก X ดูเหมือนมากสุ่มตัวอย่างจากการแจกแจงต้นฉบับ ฉันคิดว่านี่เป็นแนวคิดพื้นฐานของการทำงาน
Gareth
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.