การรวมเมทริกซ์ความแปรปรวนร่วมสองแบบ


11

ฉันคำนวณความแปรปรวนร่วมของการแจกแจงแบบขนานและฉันต้องรวมผลลัพธ์ที่กระจายเข้าด้วยกันบน Gaussian เอกพจน์ ฉันจะรวมสองวิธีเข้าด้วยกันได้อย่างไร

การสอดแทรกเชิงเส้นตรงระหว่างสองอย่างนี้เกือบจะได้ผลถ้ามันมีการกระจายและขนาดใกล้เคียงกัน

Wikipediaมีฟอรัมอยู่ที่ด้านล่างสำหรับชุดค่าผสม แต่ดูเหมือนจะไม่ถูกต้อง การแจกแจงแบบกระจายสองตัวที่เหมือนกันควรมีความแปรปรวนร่วมเดียวกัน แต่สูตรที่ด้านล่างของหน้าเพิ่มความแปรปรวนร่วมสองเท่า

มีวิธีการรวมสองเมทริกซ์หรือไม่?


3
สูตร Wikipedia ตอบคำถามของคุณ Matt: คุณอาจไม่ได้สังเกตว่ามันเป็นสูตรบางส่วนหลังจากนั้นคุณต้องหารด้วยขนาดตัวอย่าง
whuber

1
ฉันคิดได้แล้วตอนนี้ด้วยความช่วยเหลือของคุณ - ถ้าคุณใส่คำตอบลงไปฉันจะทำเครื่องหมายว่าตอบแล้ว
Matt Kemp

คำตอบ:


12

คำถามนี้เกิดขึ้นได้มากในหลายรูปแบบ สิ่งที่พบได้ทั่วไปคือ

ฉันจะรวมสถิติตามช่วงเวลาที่คำนวณจากชุดย่อยที่แยกจากข้อมูลของฉันได้อย่างไร

แอปพลิเคชันที่ง่ายที่สุดเกี่ยวข้องกับข้อมูลที่ถูกแบ่งออกเป็นสองกลุ่ม คุณรู้ขนาดกลุ่มและความหมายของกลุ่ม ในแง่ของปริมาณสี่อย่างนี้เพียงอย่างเดียวค่าเฉลี่ยโดยรวมของข้อมูลคืออะไร?

แอปพลิเคชั่นอื่น ๆ จะสรุปจากความแปรปรวน, ความเบี่ยงเบนมาตรฐาน, เมทริกซ์ความแปรปรวนร่วม, ความเบ้และสถิติหลายตัวแปร และอาจเกี่ยวข้องกับกลุ่มข้อมูลย่อยหลายกลุ่ม โปรดสังเกตว่าปริมาณเหล่านี้จำนวนมากเป็นการรวมกันของช่วงเวลาที่ค่อนข้างซับซ้อนเช่นค่าเบี่ยงเบนมาตรฐานคือรากที่สองของการรวมกำลังสองของช่วงเวลาแรกและช่วงที่สอง (หมายถึงค่าเฉลี่ยและกำลังสอง)

กรณีดังกล่าวทั้งหมดจะได้รับการจัดการอย่างง่ายดายโดยลดช่วงเวลาที่แตกต่างกันเป็นผลรวมเนื่องจากผลรวมจะเห็นได้ชัดและรวมกันได้ง่าย: พวกเขาจะถูกเพิ่ม ในทางคณิตศาสตร์มันลงมาที่นี่: คุณมีชุดข้อมูลที่ถูกแยกออกเป็นกลุ่มขนาดที่แยกกัน:x_n) ขอเรียกTH กลุ่ม1}}) ตามคำนิยามที่THช่วงเวลาของชุดของข้อมูลใด ๆเป็นค่าเฉลี่ยของX=(x1,x2,,xn)j1,j2,,jg(x1,x2,,xj1;xj1+1,,xj1+j2;xj1+j2+1,;;,xn)iX(i)=(xji+1,xji+2,,xji+1)ky1,,yjkพลังที่

μk(y)=(y1k+y2k++yjk)/j.

เห็นได้ชัดว่าเป็นผลรวมของพลังที่ดังนั้นเมื่ออ้างถึงการสลายตัวของข้อมูลก่อนหน้าของเราออกเป็นกลุ่มย่อยเราสามารถแบ่งผลรวมของกำลังเป็นกลุ่มผลรวมได้รับjμk(y)kgn

nμk(X)=(x1k+x2k++xnk)=(x1k+x2k++xj1k)++(xj1++jg1+1k+xj1++jg1+2k++xnk)=j1μk(X(1))+j2μk(X(2))++jgμk(X(g)).

การหารด้วยแสดงช่วงเวลาที่ของกลุ่มทั้งหมดในรูปของช่วงเวลาที่ของกลุ่มย่อยnkk

ในแอปพลิเคชั่นปัจจุบันรายการในเมทริกซ์ความแปรปรวนร่วมเป็นแน่นอนความแปรปรวนร่วมซึ่งมีความชัดเจนในแง่ของช่วงเวลาที่สองหลายตัวแปรและช่วงเวลาแรก ส่วนสำคัญของการคำนวณมาถึงสิ่งนี้:ในแต่ละขั้นตอนคุณจะต้องมุ่งเน้นไปที่สององค์ประกอบเฉพาะของข้อมูลหลายตัวแปรของคุณ ขอเรียกว่าและy ที่หมายเลขที่คุณกำลังดูอยู่ในแบบฟอร์มxy

((x1,y1),(x2,y2),,(xn,yn)),

แตกออกเป็นกลุ่มสำหรับแต่ละกลุ่มที่คุณรู้ว่าผลรวมเฉลี่ยของผลิตภัณฑ์ของ : นี่คือช่วงเวลาหลายตัวแปร{(1,1)} ที่จะรวมค่ากลุ่มเหล่านี้คุณจะคูณพวกเขาโดยขนาดของกลุ่มเพิ่มขึ้นผลลัพธ์เหล่านั้นและแบ่งทั้งหมดโดยnx i y i ( 1 , 1 ) μ ( 1 , 1 ) ngxiyi(1,1)μ(1,1)n

ในการใช้วิธีการนี้คุณต้องคิดล่วงหน้า : เป็นไปไม่ได้ที่จะรวมพูดถึงความแปรปรวนร่วมถ้าคุณรู้เพียงขนาดความแปรปรวนร่วมและขนาดกลุ่มย่อย: คุณจำเป็นต้องรู้ถึงวิธีการของกลุ่มย่อยด้วย ในสูตรความแปรปรวนร่วมทั้งหมด) หรือบางสิ่งบางอย่างเกี่ยวกับพีชคณิตลดวิธีการ คุณอาจต้องระมัดระวังเกี่ยวกับค่าคงที่ที่ปรากฏในสูตร หัวหน้ากับดักสำหรับเลินเล่อจะสับสน "ตัวอย่างความแปรปรวนร่วม" (ซึ่งเกี่ยวข้องกับผลรวมของผลิตภัณฑ์หารด้วย ) กับ "ประชากรความแปรปรวนร่วม" (ซึ่งส่วนคือ ) สิ่งนี้ไม่ได้แนะนำอะไรใหม่ คุณต้องจำไว้ว่าให้คูณความแปรปรวนร่วมตัวอย่างด้วย (หรือความแปรปรวนร่วมกลุ่มด้วยn n - 1 j ฉัน - 1 n j in1nn1ji1 ) เพื่อกู้คืนผลรวมแทนที่จะเป็น (หรือ )nji


โอ้ใช่: เกี่ยวกับคำถามปัจจุบัน สูตรที่ให้ไว้ในบทความของ Wikipedia นั้นมีให้ในรูปของความหมายของกลุ่ม (ช่วงเวลาแรก) และผลรวมของกลุ่มผลิตภัณฑ์ ดังที่ฉันได้อธิบายไว้ข้างต้นสิ่งเหล่านี้จะถูกรวมเข้าด้วยกันโดยการเพิ่มพวกเขาและจากนั้นปรับผลลัพธ์ด้วยการหารเพื่อรับโควาเรีย การหารสุดท้ายด้วยจะไม่ปรากฏขึ้นn


ฉันสับสนเล็กน้อยเกี่ยวกับคำจำกัดความของช่วงเวลา k-th คุณคิดว่าศูนย์หมายถึงข้อมูลใช่ไหม?
reschu

@reschu คุณดูเหมือนจะเป็นความคิดของกลางช่วงเวลา เพื่อให้แน่ใจว่าโพสต์นี้จะเข้าใจอย่างถูกต้องฉันกำหนดสิ่งที่ฉันหมายถึงโดย "สักครู่" คำจำกัดความปรากฏขึ้นก่อนสูตรแรก kth
whuber

อาจไม่ดี! ฉันกำลังผสมช่วงเวลา 'ศูนย์กลาง' และ 'ดิบ' ขอบคุณสำหรับการชี้แจง!
reschu

ฉันคิดว่า "รู้วิธีการขนาดกลุ่มย่อย" ในวรรคสุดท้ายควรอ่าน "เพื่อทราบความหมายของกลุ่มย่อย" แทน? (ฉันลังเลที่จะแก้ไขด้วยตัวเองเนื่องจากฉันไม่ได้สนใจที่จะศึกษาคำตอบอย่างระมัดระวัง)
Juho Kokkala

@Juho คุณค่อนข้างถูกต้อง ขอบคุณที่สังเกตว่า!
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.