เมทริกซ์ความแปรปรวนร่วมตัวอย่างเป็นสมมาตรและแน่นอนแน่นอนเสมอใช่หรือไม่


33

เมื่อคำนวณเมทริกซ์ความแปรปรวนร่วมของตัวอย่างจะมีการรับประกันว่าจะได้เมทริกซ์สมมาตรและบวกแน่นอนหรือไม่

ปัจจุบันปัญหาของฉันมีตัวอย่างของเวกเตอร์สังเกต 4600 และ 24 มิติ


สำหรับการสุ่มตัวอย่างเมทริกซ์ความแปรปรวนร่วมฉันใช้สูตร: Qn=1ni=1n(xix¯)(xix¯)โดยที่nคือจำนวนตัวอย่างและx¯คือค่าเฉลี่ยตัวอย่าง
มอร์เทน

4
โดยปกติจะเรียกว่า 'การคำนวณเมทริกซ์ความแปรปรวนร่วมตัวอย่าง' หรือ 'การประมาณเมทริกซ์ความแปรปรวนร่วม' แทน 'การสุ่มตัวอย่างเมทริกซ์ความแปรปรวนร่วม'
Glen_b -Reinstate Monica

1
สถานการณ์ทั่วไปที่เมทริกซ์ความแปรปรวนร่วมไม่แน่นอนคือเมื่อ 24 "มิติ" บันทึกองค์ประกอบของส่วนผสมที่รวมเป็น 100%
whuber

คำตอบ:


41

สำหรับตัวอย่างเวกเตอร์xi=(xi1,,xik) , กับi=1,,n , ค่าเฉลี่ยเวกเตอร์ตัวอย่างคือ

x¯=1ni=1nxi,
และเมทริกซ์ตัวอย่างแปรปรวนคือ
Q=1ni=1n(xix¯)(xix¯).
สำหรับเวกเตอร์ที่ไม่ใช่ศูนย์yRkเรามี
YQY=Y(1nΣผม=1n(xผม-x¯)(xผม-x¯))Y
=1nΣผม=1nY(xผม-x¯)(xผม-x¯)Y
=1nΣผม=1n((xผม-x¯)Y)20.(* * * *)
ดังนั้นQจึงเป็นบวกกึ่งแน่นอนเสมอเสมอ

เงื่อนไขเพิ่มเติมสำหรับQจะเป็นบวกแน่นอนได้รับในข้อคิดเห็นของ whuber มันไปดังนี้

กำหนดZผม=(xผม-x¯)สำหรับi=1,,n n สำหรับค่าใด ๆ ที่ไม่ใช่ศูนย์yRk , ()เป็นศูนย์ถ้าและถ้าziy=0สำหรับแต่ละฉัน=1,...,n สมมติว่าชุด{z1,,zn}มีช่วงRkเท่านั้น จากนั้นมีจำนวนจริงα 1 , , α nนั่นy = α 1 z 1 + + α n z ni=1,,n{z1,,zn}Rkα1,,αny=α1z1++αnzn. แต่เรามีyy=α1z1y++αnzny=0โดยให้y=0ซึ่งเป็นความขัดแย้ง ดังนั้นถ้าziขยายRkแล้วQเป็นบวกแน่นอน เงื่อนไขนี้จะเทียบเท่ากับrank[z1zn]=kk


2
ฉันชอบวิธีการนี้ แต่จะแนะนำการดูแล: ไม่จำเป็นต้องเป็นบวกแน่นอน เงื่อนไข (จำเป็นและเพียงพอ) เพื่อให้เป็นเช่นนั้นอธิบายไว้ในความคิดเห็นของฉันต่อคำตอบของ Konstantin Q
whuber

1
ตั้งแต่อันดับน้อยกว่าหรือเท่ากับ kเงื่อนไขสามารถลดความซับซ้อนของอันดับได้เท่ากับ k [z1,z2,,zn]k
ข้อเสนอไม่สามารถปฏิเสธได้ใน

13

ถูกต้องเมทริกซ์ความแปรปรวนอยู่เสมอสมมาตรและบวก * กึ่ง * แน่นอน

แปรปรวนร่วมระหว่างสองตัวแปรคือการท้าทายเป็น ]σ(x,y)=E[(xE(x))(yE(y))]

สมการนี้จะไม่เปลี่ยนถ้าคุณสลับตำแหน่งของและy ที่ ดังนั้นเมทริกซ์จะต้องสมมาตรxy

มันจะต้องเป็นบวก * semi- * แน่นอนเพราะ:

คุณสามารถค้นหาการเปลี่ยนแปลงของตัวแปรของคุณได้ในแบบที่ความแปรปรวนร่วมเมทริกซ์เปลี่ยนเป็นเส้นทแยงมุม บนเส้นทแยงมุมคุณจะพบความแปรปรวนของตัวแปรที่แปลงแล้วซึ่งมีค่าเป็นศูนย์หรือบวกมันง่ายที่จะเห็นว่าสิ่งนี้ทำให้เมทริกซ์เชิงบวกที่เปลี่ยนรูปได้เป็นกึ่งบวก อย่างไรก็ตามเนื่องจากคำจำกัดความของความแน่นอนคือการเปลี่ยนแปลงไม่แปรเปลี่ยนดังนั้นจึงเป็นไปตามที่ความแปรปรวนร่วมเมทริกซ์นั้นเป็นค่ากึ่งบวกเชิงบวกในระบบพิกัดที่เลือก

เมื่อคุณประเมินเมทริกซ์ความแปรปรวนร่วมของคุณ (นั่นคือเมื่อคุณคำนวณความแปรปรวนร่วมตัวอย่างของคุณ) ด้วยสูตรที่คุณระบุไว้ข้างต้นมันจะ obv ยังคงสมมาตร นอกจากนี้ยังต้องเป็น semidefinite บวก (ฉันคิดว่า) เพราะสำหรับแต่ละตัวอย่างไฟล์ pdfที่ให้แต่ละจุดตัวอย่างน่าจะเท่ากันมีความแปรปรวนร่วมตัวอย่างเป็นความแปรปรวนร่วม (ใครก็ได้โปรดตรวจสอบเรื่องนี้) ดังนั้นทุกอย่างที่กล่าวไว้ข้างต้น


1
PS: ฉันเริ่มที่จะคิดว่านี่ไม่ใช่คำถามของคุณ ...
Konstantin Schubert

แต่ถ้าคุณต้องการทราบว่าอัลกอริทึมการสุ่มตัวอย่างของคุณรับประกันหรือไม่คุณจะต้องระบุวิธีการสุ่มตัวอย่างของคุณ
Konstantin Schubert

1
มอร์เทนสมมาตรนั้นเกิดจากสูตร ในการแสดงกึ่งชัดเจนคุณจะต้องสร้างที่สำหรับเวกเตอร์ยู แต่Q nคือ1 / nครั้งผลรวมของวีฉันโวลต์' ฉัน (ที่วีฉัน = x ฉัน - ˉ x )ดังนั้นn U Q n U 'เป็นผลรวมของยู( วีฉันโวลต์' ฉัน )uQnu0uQn1/nvivivi=xix¯)nuQnu = ( U v ฉัน ) ( U v ฉัน) 'ซึ่งเป็นกำลังสองความยาวของเวกเตอร์ยูvฉัน เพราะ n > 0และผลรวมของสี่เหลี่ยมไม่สามารถที่เคยเป็นลบ, U Q n U '0 ,QED นี่ก็แสดงให้เห็นว่าคุณQ n u = 0แม่นยำสำหรับเวกเตอร์เหล่านั้น uซึ่งมีมุมฉากกับ v i ทั้งหมด (u(vivi)u(uvi)(uvi)uvin>0uQnu0uQnu=0uviเช่น, สำหรับทุกคนฉัน ) เมื่อv iขยายดังนั้นu = 0และQ nแน่นอน uvi=0iviu=0Qn
whuber

1
@ มอร์เทนการเปลี่ยนแปลงแปรปรวนค่อนข้างชัดเจนถ้าคุณเข้าใจการคูณเมทริกซ์ในเชิงเรขาคณิต คิดว่าเวกเตอร์ของคุณเป็นลูกศร ตัวเลขที่อธิบายการเปลี่ยนแปลงเวกเตอร์ของคุณด้วยระบบพิกัด แต่ทิศทางและความยาวของเวกเตอร์ของคุณไม่ได้ ทีนี้การคูณด้วยเมทริกซ์หมายความว่าคุณเปลี่ยนความยาวและทิศทางของลูกศรนั้น แต่ผลกระทบก็เหมือนกันในเรขาคณิตในระบบพิกัด เช่นเดียวกับผลิตภัณฑ์เซนต์คิตส์และเนวิส: มันถูกกำหนดทางเรขาคณิตและ Geometriy นั้นไม่แปรเปลี่ยน ดังนั้นสมการของคุณจึงมีผลเหมือนกันในทุกระบบ
Konstantin Schubert

1
@Morten เมื่อคุณคิดในพิกัดอาร์กิวเมนต์จะเป็นดังนี้: เมื่อคือเมทริกซ์การแปลงของคุณดังนั้น: v = A vกับv เป็นพิกัดแปลงเวกเตอร์, M = A M A Tดังนั้นเมื่อคุณเปลี่ยนแต่ละ องค์ประกอบในสมการv T M v > 0คุณจะได้v T M v = ( A v ) T A M A T A >Av=AvvM=AMATvTMv>0ซึ่งเท่ากับ v T A T AvTMv=(Av)TAMATAv>0และเนื่องจาก A คือ orthogonal, A T Aเป็นเมทริกซ์หน่วยและเราได้รับ v T M v > 0อีกครั้งซึ่งหมายความว่าการแปลงและสมการที่ไม่แปรเปลี่ยนมีผลสเกลาเดียวกันดังนั้น พวกเขามีทั้งหรือทั้งสองไม่เป็นศูนย์มากขึ้น vTATAMATAv>0ATAvTMv>0
คอนสแตนตินชูเบิร์ต

0

เมทริกซ์ความแปรปรวน - โควาริอิ้งนั้นมีความสมมาตรอยู่เสมอเนื่องจากสามารถพิสูจน์ได้จากสมการที่เกิดขึ้นจริงเพื่อคำนวณแต่ละเทอมของเมทริกซ์ดังกล่าว

นอกจากนี้เมทริกซ์ Variance-Covariance ยังเป็นเมทริกซ์จตุรัสขนาด n เสมอโดยที่ n คือจำนวนตัวแปรในการทดสอบของคุณ

Eigenvectors ของเมทริกซ์สมมาตรเป็นมุมฉากเสมอ

ด้วย PCA คุณจะกำหนดค่าลักษณะเฉพาะของเมทริกซ์เพื่อดูว่าคุณสามารถลดจำนวนตัวแปรที่ใช้ในการทดสอบของคุณหรือไม่


1
ยินดีต้อนรับพล. โปรดทราบว่าชื่อผู้ใช้ตัวบ่งชี้ & ลิงก์ไปยังหน้าผู้ใช้ของคุณจะถูกเพิ่มในทุกโพสต์ที่คุณทำโดยอัตโนมัติดังนั้นไม่จำเป็นต้องลงชื่อโพสต์ของคุณ
Antoine Vernet

3
คำตอบนี้สามารถปรับปรุงได้โดยการแก้ไขปัญหาของความชัดเจนเชิงบวก
Silverfish

สิ่งนี้ไม่ได้ตอบคำถามจริงๆ: มันเป็นเพียงชุดของการยืนยันที่ไม่ได้รับการสนับสนุนที่อาจจะเกี่ยวข้องหรือไม่เกี่ยวข้อง คุณสามารถใส่กรอบใหม่ในลักษณะที่แสดงให้เห็นว่าคำถามนั้นตอบแล้วอธิบายเหตุผลได้อย่างไร
whuber

0

ฉันจะเพิ่มอาร์กิวเมนต์ที่ดีของ Zen ต่อไปนี้ซึ่งอธิบายว่าทำไมเรามักจะพูดว่าเมทริกซ์ความแปรปรวนร่วมเป็นบวกแน่นอนถ้าn1k k

ถ้าเป็นตัวอย่างที่สุ่มจากการกระจายความน่าจะเป็นอย่างต่อเนื่องแล้วx 1 , x 2 , . . , x nเกือบจะแน่นอน (ในแง่ของทฤษฎีความน่าจะเป็น) เป็นเส้นตรง ตอนนี้ซี1 , ซี2 , . . , z nไม่ได้เป็นเชิงเส้นอย่างอิสระเนื่องจากn i = 1 z ix1,x2,...,xnx1,x2,...,xnz1,z2,...,zni=1nzi=0แต่เป็นเพราะการเป็นอิสระเชิงเส้น, ซี1 , ซี2 , . . , Z nเป็นช่วงR n - 1 ถ้าn - 1 k , พวกมันจะขยายR kด้วยx1,x2,...,xnz1,z2,...,znRn1n1kRk

สรุปถ้าเป็นตัวอย่างแบบสุ่มของการแจกแจงความน่าจะเป็นแบบต่อเนื่องและn - 1 k , เมทริกซ์ความแปรปรวนร่วมเป็นบวกแน่นอนx1,x2,...,xnn1k


0

สำหรับผู้ที่มีพื้นหลังที่ไม่ใช่ทางคณิตศาสตร์อย่างฉันที่ไม่ได้จับสูตรทางคณิตศาสตร์อย่างรวดเร็วนี่เป็นตัวอย่างที่ได้จาก excel สำหรับคำตอบที่ได้รับการโหวตมากที่สุด เมทริกซ์ความแปรปรวนร่วมสามารถได้มาในรูปแบบอื่นเช่นกัน

ป้อนคำอธิบายรูปภาพที่นี่

ป้อนคำอธิบายรูปภาพที่นี่


คุณช่วยอธิบายว่าสเปรดชีตนี้แสดงให้เห็นถึงความแน่นอนเชิงบวกของเมทริกซ์ความแปรปรวนร่วมได้อย่างไร
whuber

มันไม่ใช่. ฉันมีช่วงเวลาที่ยากลำบากในการมองเห็นเมทริกซ์ความแปรปรวนร่วมในรูปแบบโน้ตของมันเอง ดังนั้นฉันจึงสร้างแผ่นงานนี้ขึ้นมาสำหรับตัวเองและคิดว่ามันจะช่วยคนได้
Parikshit Bhinde

โปรดแก้ไขเพื่อรวมคำตอบสำหรับคำถาม
whuber

เสร็จแล้ว :) ขอบคุณที่แนะนำ
Parikshit Bhinde

คำถามคือ "เป็นหนึ่งในนั้นรับประกันว่าจะได้รับเมทริกซ์สมมาตรและบวกแน่นอน?" ฉันไม่สามารถรับรู้องค์ประกอบใด ๆ ของโพสต์ของคุณที่กล่าวถึงเรื่องนี้เพราะ (1) ไม่เคยระบุเมทริกซ์ความแปรปรวนร่วมได้ (2) มันไม่ได้แสดงให้เห็นถึงความแตกต่างในเชิงบวกของอะไร
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.