เราจะพูดอะไรเกี่ยวกับค่าเฉลี่ยประชากรจากขนาดตัวอย่าง 1


43

ฉันสงสัยในสิ่งที่เราสามารถพูดได้ถ้ามีอะไรเกี่ยวกับค่าเฉลี่ยประชากรเมื่อทั้งหมดที่ฉันมีคือการวัดหนึ่ง (ขนาดตัวอย่าง 1) เห็นได้ชัดว่าเราชอบที่จะมีการวัดมากขึ้น แต่เราไม่สามารถรับได้y 1μy1

มันดูเหมือนว่าฉันว่าตั้งแต่ค่าเฉลี่ยตัวอย่างเป็นนิด ๆ เท่ากับแล้วEอย่างไรก็ตามด้วยขนาดตัวอย่าง 1 ความแปรปรวนตัวอย่างไม่ได้ถูกกำหนดและทำให้เรามั่นใจในการใช้เนื่องจากตัวประมาณยังไม่ได้กำหนดเช่นกันถูกต้องหรือไม่ มีวิธีใดที่จะ จำกัด การประมาณการของเราหรือไม่? Y1E[ ˉ Y ]=E[Y1]=μ ˉ Y μμy¯y1E[y¯]=E[y1]=μy¯μμ


ใช่ช่วงความเชื่อมั่นของสามารถสร้างได้ภายใต้สมมติฐานที่แน่นอน หากไม่มีใครโพสต์ฉันจะติดตามมัน μ
soakley

5
ดูstats.stackexchange.com/questions/1807รุ่นของคำถามเดียวกันอีก (ค่าเฉลี่ยของกลุ่มตัวอย่างที่มีอยู่ แต่ไม่ได้ขนาดตัวอย่างของตนเพื่อให้ได้อย่างมีประสิทธิภาพโดยเฉลี่ยเป็นเดียวสังเกตจากการกระจายการสุ่มตัวอย่างที่ไม่รู้จัก) และstats.stackexchange .com / คำถาม / 20300สำหรับการสนทนาที่เกี่ยวข้อง
whuber

บทความล่าสุดที่กล่าวถึงการเพิ่มประสิทธิภาพของตัวประมาณค่าเหล่านี้ในกรณีปกติ: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
795305

คำตอบ:


8

นี่เป็นบทความใหม่ล่าสุดสำหรับคำถามนี้สำหรับคดี Poisson โดยใช้แนวทางการสอนที่ดี:

แอนเดอ ต่อGösta (2015) วิธีการในชั้นเรียนเพื่อสร้างช่วงความเชื่อมั่นโดยประมาณของค่าเฉลี่ยปัวซงโดยใช้การสังเกตเพียงครั้งเดียว อเมริกันสถิติ , 69 (3), 160-164 ดอย: 10.1080 / 00031305.2015.1056830


... น่าเสียดายที่อยู่ด้านหลังของ paywall
ทิม

@Tim: นั่นเป็นเช่นนั้น จากนั้นอีกครั้งการเป็นสมาชิก ASAนั้นไม่แพงมากนักและคุณสามารถเข้าถึงThe American Statisticsian , JASAและวารสารอื่น ๆ อีกสองสามเล่มในราคาที่สมเหตุสมผลมาก ฉันคิดว่าคุณคุ้มค่าเงินของคุณที่นี่ แน่นอน YMMV
S. Kolassa - Reinstate Monica

4
+1 แต่กรณีปัวซองนั้นแตกต่างอย่างสิ้นเชิงจากกรณีปกติเนื่องจากความแปรปรวนมีค่าเฉลี่ยเท่ากับ ผลลัพธ์ปัวซงค่อนข้างตรงไปตรงมาในขณะที่ผลสำหรับกรณีปกติทวนและลึกลับ x±9.68|x|
อะมีบาพูดว่า Reinstate Monica

@amoeba: ค่อนข้างถูกต้อง แต่ OP ไม่ได้ระบุข้อ จำกัด ใด ๆ ในการแจกแจง
S. Kolassa - Reinstate Monica

นี่เป็นบทสรุปที่ดีกว่าว่าจะเป็นการแสดงความคิดเห็น แต่เนื่องจากเป็นคำตอบที่ยอมรับคุณอาจไม่ต้องการแปลงเป็นความคิดเห็น จากนั้นคุณสามารถสรุปประเด็นหลักของบทความได้หรือไม่
Richard Hardy

42

หากประชากรที่เป็นที่รู้จักกันเป็นปกติช่วงความเชื่อมั่น 95% ขึ้นอยู่กับการสังเกตเดียวจะได้รับโดยx ± 9.68 | x |x

x±9.68|x|

นี่คือการกล่าวถึงในบทความ"ช่วงความเชื่อมั่นที่มีประสิทธิภาพสำหรับค่าเฉลี่ยกับตัวอย่างขนาดหนึ่งและสอง" โดย Wall, Boen และ Tweedie, American Statistics , พฤษภาคม 2001, Vol. 55, ฉบับที่ 2 ( pdf )


5
ฉันเกลียดที่จะฟังดูโง่ แต่ .... ไม่แน่นอน ขึ้นอยู่กับหน่วยและไม่ทำงานอย่างถูกต้องเลย (โดยฉันหมายถึงการคูณสเกลาร์ .... )
Alec Teal

8
@Alec เพียงเพราะขั้นตอนขึ้นอยู่กับหน่วยการวัด (นั่นคือมันไม่แปรผัน) ไม่ได้หมายความว่ามันไม่ถูกต้องโดยอัตโนมัติหรือไม่ดี อันนี้ถูกต้อง: อ่านบทความและทำคณิตศาสตร์ หลายคนจะยอมรับว่ามันเป็นเรื่องเล็ก ๆ น้อย ๆรบกวนแม้ว่า ที่น่าประหลาดใจยิ่งกว่านั้นคือคุณไม่ต้องสมมติว่าการกระจายนั้นเป็นแบบปกติ: ผลลัพธ์ที่คล้ายกันจะมีการกระจายแบบ unimodal ใด ๆ (แต่ 9.68 จะต้องเพิ่มขึ้นเป็นประมาณ 19 หรือมากกว่านั้น): ดูลิงก์ที่ฉันให้ไว้ในความคิดเห็นนี้ คำถาม.
whuber

4
วารสารฉบับต่อมามีจดหมายสามฉบับถึงบรรณาธิการหนึ่งในนั้นนำมาซึ่งประเด็นเกี่ยวกับหน่วยงานของ Alec Teal คำตอบจาก Wall กล่าวว่า: "ช่วงความมั่นใจไม่เท่ากัน (กล่าวคือความน่าจะเป็นของการครอบคลุมขึ้นอยู่กับอัตราส่วนของ ... )" หลังจากนั้นเธอ กล่าวว่า "ช่วงความมั่นใจไม่ได้ขึ้นอยู่กับปริมาณที่สำคัญ ... " มันเป็นวิธีการและผลลัพธ์ที่ผิดปกติอย่างไม่ต้องสงสัย! |μ|σ
soakley

5
เพียงเพื่อช่วยคุณทำงานนิดหน่อย: จดหมายถึงบรรณาธิการ & ตอบ @soakley โน้ตปรากฏในThe American Statisticsian , vol. หมายเลข 56 1 (2002)
S. Kolassa - Reinstate Monica

3
สิ่งนี้ดูเหมือนจะให้ช่วงความมั่นใจที่ครอบคลุมค่าเฉลี่ยด้วยความน่าจะเป็นประมาณเมื่อ aboutแต่มีความเป็นไปได้สูงกว่ามาก ถ้าดังนั้นความน่าจะเป็นคืออย่างชัดเจนเนื่องจากช่วงความเชื่อมั่นมีเสมอ 95%σ|μ|>0μ=0100%0
Henry

28

แน่นอนว่ามี ใช้กระบวนทัศน์แบบเบย์ โอกาสที่คุณมีอย่างน้อยบางส่วนความคิดของสิ่งอาจจะเป็น - เช่นว่าร่างกายไม่สามารถลบหรือว่ามันเห็นได้ชัดว่าไม่สามารถมีขนาดใหญ่กว่า 100 (บางทีคุณอาจจะมีการวัดความสูงของโรงเรียนมัธยมสมาชิกทีมฟุตบอลท้องถิ่นของคุณ เป็นฟุต) ใส่ก่อนหน้านั้นปรับปรุงด้วยการสังเกตคนเดียวของคุณและคุณมีหลังที่ยอดเยี่ยมμ


18
(+1) การสังเกตหนึ่งครั้งจะถูกครอบงำโดยก่อนหน้านี้ดังนั้นจึงดูเหมือนว่าสิ่งที่คุณได้รับจากด้านหลังจะไม่มากไปกว่าสิ่งที่คุณใส่ไว้ก่อนหน้า
whuber

จะเกิดอะไรขึ้นถ้าเรารวมคำก่อนหน้านี้เข้ากับความน่าจะเป็นที่ส่อให้เห็น? x±9.68|x|
Simon Kuang

@SimonKuang: หนึ่งปัญหาแนวคิดคือเราสามารถใช้ช่วงเวลาหลังจากที่เราได้สังเกตดังนั้นนี้ไม่สามารถใส่ก่อน x±9.68|x|x
S. Kolassa - Reinstate Monica

@StephanKolassa ไม่ช่วงเวลานี้ (และการกระจายที่เกี่ยวข้อง) ทำให้เกิดความน่าจะเป็น ก่อนหน้าของเราแยกจากกัน
Simon Kuang

@SimonKuang: ใช่คุณพูดถูกผิด น่าเสียดายที่ฉันไม่มีเวลาที่จะทำสิ่งนี้ในเวลานี้ แต่ถ้าคุณทำสิ่งนี้โปรดโพสต์สิ่งที่คุณค้นหา!
S. Kolassa - Reinstate Monica

14

แบบฝึกหัดจำลองสถานการณ์ขนาดเล็กเพื่อแสดงให้เห็นว่าคำตอบของ @soakley ทำงานได้หรือไม่:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

ออกจากหนึ่งล้านการทดลองสุ่มช่วงความเชื่อมั่นรวมถึงความจริงหมายถึงหนึ่งล้านครั้ง, ที่อยู่, เสมอ ว่าไม่ควรเกิดขึ้นในช่วงความเชื่อมั่นกรณีเป็น95%ช่วงความเชื่อมั่น

ดังนั้นสูตรดูเหมือนจะไม่ทำงาน ... หรือฉันทำผิดรหัส?

แก้ไข:ผลลัพธ์เชิงประจักษ์ที่เหมือนกันเมื่อใช้ ; อย่างไรก็ตามเป็นสำหรับ - ดังนั้นจึงค่อนข้างใกล้เคียงกับช่วงความมั่นใจ 95%(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
ที่จริงแล้วสำหรับไม่เท่ากับ 0 สิ่งนี้มีประโยชน์ (และ +1 สำหรับการให้รหัสในตอนแรก!) ฉันแค่หมายถึงว่ามันเป็นข้อสรุปมาก่อนว่า 0 จะถูกบันทึกไว้เสมอ μμ=0
Wolfgang

2
(@ Wolfolfgang) นี่ไม่ใช่วิธีการทดสอบช่วงความมั่นใจ คำจำกัดความไม่ต้องการให้ -level CI ครอบคลุมค่าเฉลี่ยของเวลาในทุกกรณี : มันต้องการเพียงว่า (a) มีความครอบคลุมน้อยที่สุดในทุกกรณีและ (b) ใกล้เคียงกับความครอบคลุมนั้น ในบางกรณี. ดังนั้นสำหรับวิธีการของคุณที่จะถูกต้องและน่าเชื่อถือคุณจะต้องค้นหาความเป็นไปได้จำนวนมาก ลองα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber

2
ฉันเข้าใจจุดที่คุณพยายามทำ แต่ฉันไม่เห็นด้วยอย่างยิ่งกับข้อความที่ว่า "นี่ไม่ใช่วิธีที่จะทดสอบช่วงความมั่นใจ" ในคำจำกัดความ / โครงสร้างของ CI พารามิเตอร์จะเป็นค่าคงที่คงที่ ในการจำลองของคุณเปลี่ยนแปลงอยู่ตลอดเวลา สำหรับคงที่หากวิธีการให้ 95% CI จริงแล้วมันควรครอบคลุมใน 95% ของกรณี มันไม่ได้ นอกจากนี้แม้จะมีสิ่งก่อสร้างของคุณก็ให้ความคุ้มครองที่ใกล้เคียงกับ 1 (แน่นอนตอนนี้เราใกล้เข้ามาอีกครั้งที่ที่ 0) μ μ μμμμsim(0.1)μ
Wolfgang

2
@ Wolfgang ตรวจสอบคำจำกัดความที่ใช้โดยกระดาษที่ยกมามันคือ:นั่นคือความน่าจะเป็นที่คือ ในช่วงเวลาอย่างน้อย 0.95 μP(Xζ|X|μX+ζ|X|)1αμ
ทิม

2
อีกครั้งคงที่ ดังนั้นก็สมบูรณ์ดีเพื่อจำลองกับ0 แน่นอนว่าการครอบคลุมต้องเป็น 1 วิธีการจัดทำ CI ที่มีความครอบคลุมอย่างน้อย 95% และตัวอย่างแสดงให้เห็น (ไม่ว่าจะโดยการจำลองหรือผ่านการให้เหตุผล) ว่าในบางเงื่อนไข ดังนั้นมันไม่ใช่ 95% CI มันยังคงเป็นวิธีที่ชาญฉลาดในการวาดการอนุมานบางอย่างจากข้อมูลเพียงเล็กน้อย μ = 0μμ=0
Wolfgang

0

ดู Edelman, D (1990) 'ช่วงความมั่นใจสำหรับจุดศูนย์กลางของการแจกแจงแบบ unimodal ที่ไม่รู้จักซึ่งขึ้นอยู่กับขนาดตัวอย่างหนึ่ง' The American Statisticsian, Vol 44, no 4 บทความครอบคลุมถึงกรณีปกติและ nonparametric


3
ยินดีต้อนรับสู่ Stats.SE คุณช่วยแก้ไขคำตอบของคุณให้กว้างขึ้นได้ไหมเพื่อรวมประเด็นหลักของหนังสือที่คุณอ้างถึง? มันจะมีประโยชน์มากขึ้นทั้งกับโปสเตอร์ต้นฉบับและสำหรับคนอื่น ๆ ที่ค้นหาในเว็บไซต์นี้ โดยวิธีการใช้โอกาสที่จะทัวร์ถ้าคุณยังไม่ได้ทำมัน ดูเพิ่มเติมเคล็ดลับเกี่ยวกับวิธีการคำตอบในการจัดรูปแบบความช่วยเหลือและการเขียนลงสมการโดยใช้น้ำยาง / MathJax
Ertxiem - คืนสถานะโมนิก้า

ยินดีต้อนรับสู่เว็บไซต์ของเรา David การมีส่วนร่วมของคุณในฐานะผู้เขียนบทความ (ซึ่งฉันเชื่อว่าได้รับการอ้างถึงในหลาย ๆ กระทู้ที่นี่) ได้รับการชื่นชมอย่างมากดังนั้นมุมมองหรือความคิดเห็นที่คุณสามารถให้ในคำตอบนี้จะได้รับการต้อนรับมากที่สุด
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.