นี่เป็นคำถามเก่า แต่คำตอบที่ยอมรับนั้นไม่ถูกต้องหรือสมบูรณ์ ผู้ใช้ต้องการคำนวณส่วนเบี่ยงเบนมาตรฐานสำหรับข้อมูล 12 เดือนซึ่งค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานจะถูกคำนวณไปแล้วในแต่ละเดือน สมมติว่าจำนวนตัวอย่างในแต่ละเดือนเท่ากันดังนั้นจึงเป็นไปได้ที่จะคำนวณค่าเฉลี่ยตัวอย่างและความแปรปรวนของปีจากข้อมูลของแต่ละเดือน เพื่อความง่ายสมมติว่าเรามีชุดข้อมูลสองชุด:
X={x1,....xN}
Y={y1,....,yN}
ที่มีค่าที่เป็นที่รู้จักของกลุ่มตัวอย่างเฉลี่ยและตัวอย่างแปรปรวน , , , \μxμyσ2xσ2y
ตอนนี้เราต้องการคำนวณค่าประมาณเดียวกันสำหรับ
Z={x1,....,xN,y1,...,yN}\}
พิจารณาว่า ,ถูกคำนวณดังนี้:μxσ2x
μx=∑Ni=1xiN
σ2x=∑Ni=1x2iN−μ2x
ในการประเมินค่าเฉลี่ยและความแปรปรวนของชุดทั้งหมดเราจำเป็นต้องคำนวณ:
μz=∑Ni=1xi+∑Ni=1yi2N=(μx+μy)/2
ซึ่งให้ไว้ในคำตอบที่ยอมรับ สำหรับความแปรปรวนอย่างไรก็ตามเรื่องราวแตกต่าง:
σ2z=∑Ni=1x2i+∑Ni=1y2i2N−μ2z
σ2z=12(∑Ni=1x2iN−μ2x+∑Ni=1y2iN−μ2y)+12(μ2x+μ2y)−(μx+μy2)2
σ2z=12(σ2x+σ2y)+(μx−μy2)2
ดังนั้นหากคุณมีความแปรปรวนของแต่ละชุดย่อยและคุณต้องการความแปรปรวนของชุดทั้งชุดคุณสามารถหาค่าความแปรปรวนของแต่ละชุดย่อยได้หากชุดนั้นมีค่าเฉลี่ยเท่ากัน มิฉะนั้นคุณต้องเพิ่มความแปรปรวนของค่าเฉลี่ยของแต่ละชุดย่อย
สมมติว่าในช่วงครึ่งแรกของปีเราผลิต 1,000 เมกะวัตต์ชั่วโมงต่อวันและในครึ่งวินาทีเราผลิต 2,000 เมกะวัตต์ชั่วโมงต่อวัน ดังนั้นค่าเฉลี่ยและความแปรปรวนของการผลิตพลังงานในครึ่งแรกและวินาทีครึ่งคือ 1,000 และ 2000 สำหรับค่าเฉลี่ยและความแปรปรวนคือ 0 สำหรับทั้งสองครึ่ง ขณะนี้มีสองสิ่งที่แตกต่างที่เราอาจสนใจ:
1- เราต้องการคำนวณความแปรปรวนของการผลิตพลังงานตลอดทั้งปี : โดยเฉลี่ยแล้วความแปรปรวนสองครั้งที่เรามาถึงศูนย์ซึ่งไม่ถูกต้องเนื่องจากพลังงานต่อวันตลอดทั้งปีไม่คงที่ ในกรณีนี้เราต้องเพิ่มความแปรปรวนของค่าเฉลี่ยทั้งหมดจากแต่ละชุดย่อย ในทางคณิตศาสตร์ในกรณีนี้ตัวแปรสุ่มที่น่าสนใจคือการผลิตพลังงานต่อวัน เรามีสถิติตัวอย่างมากกว่าชุดย่อยและเราต้องการคำนวณสถิติตัวอย่างเป็นเวลานาน
2- เราต้องการคำนวณความแปรปรวนของการผลิตพลังงานต่อปี:กล่าวอีกนัยหนึ่งเราสนใจที่จะเปลี่ยนแปลงการผลิตพลังงานจากปีหนึ่งไปอีกปีหนึ่ง ในกรณีนี้ค่าเฉลี่ยความแปรปรวนนำไปสู่คำตอบที่ถูกต้องซึ่งก็คือ 0 เนื่องจากในแต่ละปีเรามีการผลิตเฉลี่ย 1500 MHW อย่างแน่นอน ในทางคณิตศาสตร์ในกรณีนี้ตัวแปรสุ่มที่น่าสนใจคือค่าเฉลี่ยของการผลิตพลังงานต่อวันที่ค่าเฉลี่ยจะทำตลอดทั้งปี