เป็นไปได้ไหมที่จะหาค่าเบี่ยงเบนมาตรฐานแบบรวม?


32

สมมติว่าฉันมี 2 ชุด:

ชุด A : จำนวนรายการ , ,n=10μ=2.4σ=0.8

ชุด B : จำนวนรายการ , ,n=5μ=2σ=1.2

ฉันสามารถหาค่าเฉลี่ยรวม ( ) ได้อย่างง่ายดาย แต่ฉันควรจะหาค่าเบี่ยงเบนมาตรฐานแบบรวมได้อย่างไรμ


คำตอบ:


30

ดังนั้นหากคุณต้องการให้ตัวอย่างสองตัวอย่างนี้รวมกันเป็นหนึ่งเดียวคุณจะได้:

s1=1n1Σผม=1n1(xผม-Y¯1)2

s2=1n2Σผม=1n2(Yผม-Y¯2)2

โดยที่และเป็นค่าเฉลี่ยตัวอย่างและและเป็นค่าเบี่ยงเบนมาตรฐานตัวอย่าง ˉ y 2s1s2Y¯1Y¯2s1s2

ในการเพิ่มพวกเขาคุณมี:

s=1n1+n2Σผม=1n1+n2(Zผม-Y¯)2

ซึ่งไม่ตรงไปตรงมาเนื่องจากค่าเฉลี่ยใหม่แตกต่างจากและ :ˉ y 1 ˉ y 2Y¯Y¯1Y¯2

Y¯=1n1+n2Σผม=1n1+n2Zผม=n1Y¯1+n2Y¯2n1+n2

สูตรสุดท้ายคือ:

s=n1s12+n2s22+n1(Y¯1-Y¯)2+n2(Y¯2-Y¯)2n1+n2

สำหรับเวอร์ชันBessel-modifieded (" denominator") ที่ใช้กันทั่วไปของค่าเบี่ยงเบนมาตรฐานผลลัพธ์ของค่าเฉลี่ยนั้นเหมือน แต่ก่อนn-1

s=(n1-1)s12+(n2-1)s22+n1(Y¯1-Y¯)2+n2(Y¯2-Y¯)2n1+n2-1

คุณสามารถอ่านข้อมูลเพิ่มเติมได้ที่นี่: http://en.wikipedia.org/wiki/Standard_deviation


1
หาก OP ใช้ Bessel ที่แก้ไข (เดนนิเทเตอร์สำหรับความแปรปรวน) ของค่าเบี่ยงเบนมาตรฐานตัวอย่าง (เกือบทุกคนที่ถามที่นี่จะทำ) คำตอบนี้จะไม่ให้สิ่งที่พวกเขาต้องการ n-1
Glen_b -Reinstate Monica

ในกรณีนี้ส่วนนี้จะหลอกลวง (แก้ไขเพื่อลิงก์ไปยังเวอร์ชันวิกิพีเดียเก่าตั้งแต่ถูกลบออกจากเวอร์ชันใหม่)
Glen_b

@Glen_b จับได้ดี คุณสามารถแก้ไขสิ่งนี้เป็นคำตอบเพื่อให้มีประโยชน์มากกว่านี้ได้หรือไม่?
sashkello

ฉันไปที่วิกิพีเดียเพื่อค้นหาหลักฐาน แต่น่าเสียดายที่สูตรนี้ไม่มีอยู่อีกต่อไป สนใจที่จะทำอย่างละเอียด (หลักฐาน) หรือปรับปรุง Wikipedia? :)
Rauni Lillemets


8

เห็นได้ชัดว่าสิ่งนี้ขยายไปถึงกลุ่ม :K

s=Σk=1K(nk-1)sk2+nk(Y¯k-Y¯)2(Σk=1Knk)-1

7
นี่เป็นมาตรฐานโดยย่อ คุณช่วยพูดอีกเล็กน้อยเกี่ยวกับวิธีได้มาและทำไมนี่คือคำตอบที่ถูกต้อง?
Sycorax พูดว่า Reinstate Monica

1

ฉันมีปัญหาเดียวกัน: การมีค่าเบี่ยงเบนมาตรฐานค่าเฉลี่ยและขนาดของเซตย่อยหลาย ๆ ค่าที่มีจุดตัดเปล่าคำนวณค่าเบี่ยงเบนมาตรฐานของการรวมกลุ่มของเซตย่อยเหล่านั้น

ฉันชอบคำตอบของsashkelloและGlen_b ♦แต่ฉันต้องการหาข้อพิสูจน์ ฉันทำแบบนี้และฉันจะทิ้งไว้ที่นี่ในกรณีที่มีใครช่วย


ดังนั้นเป้าหมายคือเพื่อดูว่าจริง ๆ :

s=(n1s12+n2s22+n1(Y¯1-Y¯)2+n2(Y¯2-Y¯)2n1+n2)1/2

เป็นขั้นเป็นตอน:

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

ทีนี้เคล็ดลับก็คือการตระหนักว่าเราสามารถจัดลำดับเงินก้อนใหม่ได้: เนื่องจากแต่ละ คำที่ปรากฏครั้งเราสามารถ เขียนตัวเศษเป็น

2y¯j=1n1xjn1
n1
i=1n1(xi2+y¯22y¯xi),

และด้วยเหตุนี้การดำเนินการกับห่วงโซ่ความเท่าเทียมกัน:

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

สิ่งนี้ถูกกล่าวว่าอาจเป็นวิธีที่ง่ายกว่าในการทำสิ่งนี้

สามารถขยายสูตรเป็นชุดย่อยตามที่ระบุไว้ก่อนหน้า การพิสูจน์จะเป็นการอุปนัยจำนวนชุด กรณีฐานได้รับการพิสูจน์แล้วและสำหรับขั้นตอนการปฐมนิเทศคุณควรใช้โซ่ความเสมอภาคที่คล้ายกันกับหลังk


ฉันไม่เห็นความชัดเจนของคำถาม ชุดข้อมูลสองชุดสันนิษฐานว่ามาจากการแจกแจงแบบเดียวกันหรือไม่? OP มีการสังเกตการณ์จริงที่มีอยู่หรือเพียงแค่ประมาณการตัวอย่างค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานหรือไม่
Michael R. Chernick

ใช่พวกเขาถูกสันนิษฐานว่ามาจากการกระจายตัวแบบเดียวกัน การสังเกตไม่พร้อมใช้งานเพียงค่าเฉลี่ยและค่าเบี่ยงเบนมาตรฐานของชุดย่อย
iipr

ถ้าอย่างนั้นทำไมต้องใช้สูตรที่เกี่ยวข้องกับการสังเกตการณ์ของแต่ละคน?
Michael R. Chernick

บางทีคำตอบของฉันอาจไม่ชัดเจน ฉันเพียงแค่โพสต์หลักฐานทางคณิตศาสตร์ของสูตรข้างต้นที่อนุญาตให้คำนวณsจากส่วนเบี่ยงเบนมาตรฐานค่าเฉลี่ยและขนาดของสองชุดย่อย ในสูตรไม่มีการอ้างอิงถึงการสังเกตของแต่ละบุคคล ในการพิสูจน์มี แต่มันเป็นเพียงการพิสูจน์และจากมุมมองของฉันถูกต้อง
iipr
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.