คำถามนี้เกิดขึ้นได้มากในหลายรูปแบบ สิ่งที่พบได้ทั่วไปคือ
ฉันจะรวมสถิติตามช่วงเวลาที่คำนวณจากชุดย่อยที่แยกจากข้อมูลของฉันได้อย่างไร
แอปพลิเคชันที่ง่ายที่สุดเกี่ยวข้องกับข้อมูลที่ถูกแบ่งออกเป็นสองกลุ่ม คุณรู้ขนาดกลุ่มและความหมายของกลุ่ม ในแง่ของปริมาณสี่อย่างนี้เพียงอย่างเดียวค่าเฉลี่ยโดยรวมของข้อมูลคืออะไร?
แอปพลิเคชั่นอื่น ๆ จะสรุปจากความแปรปรวน, ความเบี่ยงเบนมาตรฐาน, เมทริกซ์ความแปรปรวนร่วม, ความเบ้และสถิติหลายตัวแปร และอาจเกี่ยวข้องกับกลุ่มข้อมูลย่อยหลายกลุ่ม โปรดสังเกตว่าปริมาณเหล่านี้จำนวนมากเป็นการรวมกันของช่วงเวลาที่ค่อนข้างซับซ้อนเช่นค่าเบี่ยงเบนมาตรฐานคือรากที่สองของการรวมกำลังสองของช่วงเวลาแรกและช่วงที่สอง (หมายถึงค่าเฉลี่ยและกำลังสอง)
กรณีดังกล่าวทั้งหมดจะได้รับการจัดการอย่างง่ายดายโดยลดช่วงเวลาที่แตกต่างกันเป็นผลรวมเนื่องจากผลรวมจะเห็นได้ชัดและรวมกันได้ง่าย: พวกเขาจะถูกเพิ่ม ในทางคณิตศาสตร์มันลงมาที่นี่: คุณมีชุดข้อมูลที่ถูกแยกออกเป็นกลุ่มขนาดที่แยกกัน:x_n) ขอเรียกTH กลุ่ม1}}) ตามคำนิยามที่THช่วงเวลาของชุดของข้อมูลใด ๆเป็นค่าเฉลี่ยของX=(x1,x2,…,xn)j1,j2,…,jg(x1,x2,…,xj1;xj1+1,…,xj1+j2;xj1+j2+1,…;…;…,xn)iX(i)=(xji+1,xji+2,…,xji+1)ky1,…,yjkพลังที่
μk(y)=(yk1+yk2+⋯+ykj)/j.
เห็นได้ชัดว่าเป็นผลรวมของพลังที่ดังนั้นเมื่ออ้างถึงการสลายตัวของข้อมูลก่อนหน้าของเราออกเป็นกลุ่มย่อยเราสามารถแบ่งผลรวมของกำลังเป็นกลุ่มผลรวมได้รับjμk(y)kgn
nμk(X)=(xk1+xk2+⋯+xkn)=(xk1+xk2+⋯+xkj1)+⋯+(xkj1+⋯+jg−1+1+xkj1+⋯+jg−1+2+⋯+xkn)=j1μk(X(1))+j2μk(X(2))+⋯+jgμk(X(g)).
การหารด้วยแสดงช่วงเวลาที่ของกลุ่มทั้งหมดในรูปของช่วงเวลาที่ของกลุ่มย่อยnkk
ในแอปพลิเคชั่นปัจจุบันรายการในเมทริกซ์ความแปรปรวนร่วมเป็นแน่นอนความแปรปรวนร่วมซึ่งมีความชัดเจนในแง่ของช่วงเวลาที่สองหลายตัวแปรและช่วงเวลาแรก ส่วนสำคัญของการคำนวณมาถึงสิ่งนี้:ในแต่ละขั้นตอนคุณจะต้องมุ่งเน้นไปที่สององค์ประกอบเฉพาะของข้อมูลหลายตัวแปรของคุณ ขอเรียกว่าและy ที่หมายเลขที่คุณกำลังดูอยู่ในแบบฟอร์มxy
((x1,y1),(x2,y2),…,(xn,yn)),
แตกออกเป็นกลุ่มสำหรับแต่ละกลุ่มที่คุณรู้ว่าผลรวมเฉลี่ยของผลิตภัณฑ์ของ : นี่คือช่วงเวลาหลายตัวแปร{(1,1)} ที่จะรวมค่ากลุ่มเหล่านี้คุณจะคูณพวกเขาโดยขนาดของกลุ่มเพิ่มขึ้นผลลัพธ์เหล่านั้นและแบ่งทั้งหมดโดยnx i y i ( 1 , 1 ) μ ( 1 , 1 ) ngxiyi(1,1)μ(1,1)n
ในการใช้วิธีการนี้คุณต้องคิดล่วงหน้า : เป็นไปไม่ได้ที่จะรวมพูดถึงความแปรปรวนร่วมถ้าคุณรู้เพียงขนาดความแปรปรวนร่วมและขนาดกลุ่มย่อย: คุณจำเป็นต้องรู้ถึงวิธีการของกลุ่มย่อยด้วย ในสูตรความแปรปรวนร่วมทั้งหมด) หรือบางสิ่งบางอย่างเกี่ยวกับพีชคณิตลดวิธีการ คุณอาจต้องระมัดระวังเกี่ยวกับค่าคงที่ที่ปรากฏในสูตร หัวหน้ากับดักสำหรับเลินเล่อจะสับสน "ตัวอย่างความแปรปรวนร่วม" (ซึ่งเกี่ยวข้องกับผลรวมของผลิตภัณฑ์หารด้วย ) กับ "ประชากรความแปรปรวนร่วม" (ซึ่งส่วนคือ ) สิ่งนี้ไม่ได้แนะนำอะไรใหม่ คุณต้องจำไว้ว่าให้คูณความแปรปรวนร่วมตัวอย่างด้วย (หรือความแปรปรวนร่วมกลุ่มด้วยn n - 1 j ฉัน - 1 n j in−1nn−1ji−1 ) เพื่อกู้คืนผลรวมแทนที่จะเป็น (หรือ )nji
โอ้ใช่: เกี่ยวกับคำถามปัจจุบัน สูตรที่ให้ไว้ในบทความของ Wikipedia นั้นมีให้ในรูปของความหมายของกลุ่ม (ช่วงเวลาแรก) และผลรวมของกลุ่มผลิตภัณฑ์ ดังที่ฉันได้อธิบายไว้ข้างต้นสิ่งเหล่านี้จะถูกรวมเข้าด้วยกันโดยการเพิ่มพวกเขาและจากนั้นปรับผลลัพธ์ด้วยการหารเพื่อรับโควาเรีย การหารสุดท้ายด้วยจะไม่ปรากฏขึ้นn