การรวมช่วงความเชื่อมั่น / การประมาณค่าสองจุดเข้าด้วยกัน


17

สมมติว่าหนึ่งมีสองตัวอย่างอิสระจากประชากรเดียวกันและวิธีการที่แตกต่างกันถูกนำมาใช้ในสองตัวอย่างเพื่อให้ได้มาซึ่งการประเมินจุดและช่วงความเชื่อมั่น ในกรณีเล็ก ๆ น้อย ๆ คนที่มีเหตุผลจะรวมกลุ่มสองตัวอย่างและใช้วิธีการหนึ่งเพื่อทำการวิเคราะห์ แต่ลองสมมติว่าช่วงเวลาที่วิธีการที่แตกต่างกันต้องใช้เนื่องจากข้อ จำกัด ของตัวอย่างหนึ่งตัวอย่างเช่นข้อมูลที่หายไป การวิเคราะห์ทั้งสองแยกนี้จะสร้างการประมาณการที่เป็นอิสระและเท่าเทียมกันสำหรับแอตทริบิวต์ของประชากรที่น่าสนใจ ฉันคิดว่าควรจะมีวิธีที่จะรวมการประมาณสองอย่างนี้เข้าด้วยกันอย่างถูกต้องทั้งในแง่ของการประมาณค่าพอยต์และช่วงความเชื่อมั่น คำถามของฉันคือสิ่งที่ควรเป็นวิธีที่ดีที่สุดที่จะทำ? ฉันสามารถจินตนาการค่าเฉลี่ยถ่วงน้ำหนักของการจัดเรียงบางอย่างตามข้อมูล / ขนาดตัวอย่างในแต่ละตัวอย่าง แต่สิ่งที่เกี่ยวกับช่วงความเชื่อมั่นหรือไม่

คำตอบ:


9

คุณสามารถทำการประมาณรวมกันได้ดังนี้ จากนั้นคุณสามารถใช้การประมาณรวมกำไรเพื่อสร้างช่วงความมั่นใจรวม โดยเฉพาะให้:

x1¯N(μ,σ2n1)

x2¯N(μ,σ2n2)

การใช้ช่วงความมั่นใจสำหรับสองกรณีนี้คุณสามารถสร้างข้อผิดพลาดมาตรฐานอีกครั้งสำหรับการประมาณการและแทนที่ข้างต้นด้วย:

x1¯N(μ,SE1)

x2¯N(μ,SE2)

การประมาณรวมกำไรจะเป็น:

x¯=n1x1¯+n2x2¯n1+n2

ดังนั้น,

x¯N(μ,n12SE1+n22SE2(n1+n2)2)=N(μ,σ2n1+n2)


1
This approach would work if we assume that our CI are of the form β^±ZαSE. Unfortunately, sometimes asymmetric CI may be more sensible, for example the CI for a binomial proportion when it's close to 0. In that case pooling the SE like this may not help.
user1600

@user1600 Good point.

This answer could be applied to any two distributions, it is just that the product of normals is a normal, giving a nice solution. MCMC simulation could be used with pairs of distributions without a closed form solution, using a Bayesian approach with one sample being the prior and the other the likelihood.
David LeBauer

If going back to confidence intervals from the pooled SE, what would the degrees of freedom for the T distribution be? Would this change if combining more than 2 confidence intervals?
DocBuckets

3

Sounds a lot like meta-analysis to me. Your assumption that the samples are from the same population means you can use fixed-effect meta-analysis (rather than random-effects meta-analysis). The generic inverse-variance method takes a set of independent estimates and their variances as input, so doesn't require the full data and works even if different estimators have been used for different samples. The combined estimate is then a weighted average of the separate estimates, weighting each estimate by the inverse of its variance. The variance of the combined estimate is the inverse of the sum of the weights (the inverses of the variances).

คุณต้องการทำงานกับเครื่องชั่งที่การกระจายการสุ่มตัวอย่างของค่าประมาณอยู่ที่ประมาณปกติหรืออย่างน้อยระดับที่ช่วงความเชื่อมั่นจะอยู่ที่ประมาณสมมาตรดังนั้นมาตราส่วนที่แปลงการบันทึกเป็นปกติสำหรับการประมาณอัตราส่วน (อัตราส่วนความเสี่ยงอัตราส่วนอัตราต่อรองอัตรา อัตราส่วน ... ) ในกรณีอื่น ๆ การแปรปรวนการรักษาเสถียรภาพของความแปรปรวนจะเป็นประโยชน์เช่นการแปลงสแควร์รูทสำหรับข้อมูลปัวซอง, การแปลงอาร์คซินสแควร์รูทสำหรับข้อมูลทวินามเป็นต้น


1

นี่ไม่ต่างจากตัวอย่างที่แบ่งเป็นชั้น ๆ ดังนั้นการรวมกลุ่มตัวอย่างสำหรับการประมาณจุดและข้อผิดพลาดมาตรฐานดูเหมือนว่าเป็นวิธีการที่สมเหตุสมผล สองตัวอย่างจะถูกถ่วงน้ำหนักตามสัดส่วนตัวอย่าง


0

ดูกระดาษ: KM Scott, X. Lu, CM Cavanaugh, JS Liu, วิธีที่เหมาะสมที่สุดสำหรับการประเมินผลกระทบของไอโซโทปจลน์จากรูปแบบต่างๆของสมการการกลั่นแบบเรย์ลีห์, Geochimica et Cosmochimica Acta, เล่มที่ 68, ฉบับที่ 3, 1 กุมภาพันธ์ 2004 442, ISSN 0016-7037, http://dx.doi.org/10.1016/S0016-7037(03)00459-9 ( http://www.sciencedirect.com/science/article/pii/S0016703703004599 )

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.