เมทริกซ์ความแปรปรวนร่วมเป็นบวกแน่นอนหรือไม่?


48

ฉันเดาว่าคำตอบควรเป็นใช่ แต่ฉันยังรู้สึกว่าบางสิ่งไม่ถูกต้อง ควรมีผลลัพธ์ทั่วไปในวรรณคดีมีใครช่วยฉันบ้าง


2
เมทริกซ์ความแปรปรวนร่วมทุกค่าเป็นค่ากึ่งบวกแน่นอน นั่นหมายความว่าเมทริกซ์ความแปรปรวนร่วมทุกคนต้องมีค่าไอเก็นที่ไม่เป็นลบ หากไม่มีค่าของ eigen เท่ากับศูนย์เมทริกซ์ความแปรปรวนร่วมจะเป็นบวกแน่นอน
kaka


4
@Jingjings: ฉันเห็นในโปรไฟล์ของคุณว่าคุณไม่เคย upvoted หรือยอมรับคำตอบใด ๆ นี่เป็นเรื่องที่ค่อนข้างน่าทึ่งเนื่องจากคุณมีคำถามที่ดีมากมายพร้อมคำตอบที่ดีมากมาย ฉันคิดว่าคุณไม่ได้ตระหนักถึงวิธีการทำงาน แนวคิดคือคุณควรลบคำตอบใด ๆ ที่คุณคิดว่ามีประโยชน์และยอมรับคำตอบที่คุณคิดว่าแก้ปัญหาของคุณ ดูเหมือนว่าคุณสามารถตอบคำถามได้จำนวนมากและยอมรับคำตอบบางอย่าง
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


47

เลขที่

พิจารณาสามตัวแปร, , YและZ = X + Y เมทริกซ์ความแปรปรวนร่วมของพวกเขา, , ไม่ใช่บวกแน่นอนเนื่องจากมีเวกเตอร์ ( ) ซึ่งมีค่าไม่เป็นบวกXYZ=X+Yz = ( 1 , 1 , - 1 ) z M zMZ=(1,1,-1)'Z'MZ

เมทริกซ์ความแปรปรวนร่วมของประชากรเป็นแบบกึ่งบวกแน่นอน

(ดูทรัพย์สิน 2 ที่นี่ )

โดยทั่วไปควรนำไปใช้กับเมทริกซ์ความแปรปรวนร่วมของตัวอย่างที่สมบูรณ์ (ไม่มีค่าที่หายไป) เนื่องจากพวกมันสามารถถูกมองว่าเป็นรูปแบบของความแปรปรวนร่วมแบบไม่ต่อเนื่องของประชากร

อย่างไรก็ตามเนื่องจากความไม่แน่นอนของการคำนวณเชิงตัวเลขจุดลอยตัวแม้แต่กรณีที่แน่นอนเชิงบวกเชิงพีชคณิตอาจคำนวณได้เป็นครั้งคราวเพื่อไม่ให้เป็นกึ่งบวกแน่นอน ทางเลือกที่ดีของอัลกอริทึมสามารถช่วยได้

โดยทั่วไปตัวอย่างการแปรปรวนร่วมแปรปรวน - ขึ้นอยู่กับวิธีที่พวกเขาจัดการกับค่าที่หายไปในตัวแปรบางตัว - อาจจะใช่หรือไม่ใช่บวกกึ่งแน่นอนแม้ในทางทฤษฎี ตัวอย่างเช่นหากใช้การลบแบบคู่จำนวนมากจะไม่มีการรับประกันความแน่นอนกึ่งบวก นอกจากนี้ข้อผิดพลาดที่เป็นตัวเลขที่สะสมอาจทำให้เกิดเมทริกซ์ความแปรปรวนร่วมตัวอย่างที่ควรเป็นบวกกึ่งแน่นอนที่ไม่เห็นด้วยที่จะไม่เป็น

ชอบมาก

 x <- rnorm(30)
 y <- rnorm(30) - x/10 # it doesn't matter for this if x and y are correlated or not
 z <- x+y
 M <- cov(data.frame(x=x,y=y,z=z))
 z <- rbind(1,1,-1)
 t(z)%*%M%*%z
              [,1]
[1,] -1.110223e-16

สิ่งนี้เกิดขึ้นในตัวอย่างแรกที่ฉันลอง (ฉันน่าจะให้เมล็ด แต่มันไม่ค่อยหายากที่คุณควรลองหลายตัวอย่างก่อนที่จะได้)

ผลลัพธ์ออกมาเป็นลบแม้ว่ามันควรจะเป็นศูนย์พีชคณิต ชุดของตัวเลขที่แตกต่างกันอาจให้ผลเป็นบวกหรือเป็นศูนย์ "แน่นอน"

-

ตัวอย่างของการหายไปปานกลางที่นำไปสู่การสูญเสีย semidefiniteness บวกผ่านการลบแบบคู่:

z <- x + y + rnorm(30)/50  # same x and y as before.
xyz1 <- data.frame(x=x,y=y,z=z) # high correlation but definitely of full rank 

xyz1$x[sample(1:30,5)] <- NA   # make 5 x's missing  

xyz1$y[sample(1:30,5)] <- NA   # make 5 y's missing  

xyz1$z[sample(1:30,5)] <- NA   # make 5 z's missing  

cov(xyz1,use="pairwise")     # the individual pairwise covars are fine ...

           x          y        z
x  1.2107760 -0.2552947 1.255868
y -0.2552947  1.2728156 1.037446
z  1.2558683  1.0374456 2.367978

 chol(cov(xyz1,use="pairwise"))  # ... but leave the matrix not positive semi-definite

Error in chol.default(cov(xyz1, use = "pairwise")) : 
  the leading minor of order 3 is not positive definite

 chol(cov(xyz1,use="complete")) # but deleting even more rows leaves it PSD

          x          y          z
x 0.8760209 -0.2253484 0.64303448
y 0.0000000  1.1088741 1.11270078
z 0.0000000  0.0000000 0.01345364

1
+1: แต่เป็นความคิดเห็นส่วนใหญ่สำหรับคุณถ้อยคำ: ตามที่คุณแสดงดูเหมือนว่า PSD-ness จะไม่รับประกันในกรณีทั่วไป ดังที่แสดงในคำตอบของ sjm.majewski คุณต้องใช้กรณี "พยาธิวิทยา" (ไม่ใช่ตำแหน่งเต็ม) และคุณต้องจบลงด้วยปัญหานั้น (ฉันเห็นด้วยกับความคิดเห็นเชิงตัวเลขอย่างเต็มที่) คุณช่วยอธิบายปัญหาค่าที่หายไปอีกเล็กน้อยได้หรือไม่ซึ่งคุณไม่สามารถรับประกัน PSD ได้แม้ว่าคุณบัญชีที่มีข้อผิดพลาดเชิงตัวเลขหรือไม่? (ฉันคิดว่าคุณไม่ได้เกี่ยวข้องกับ sparsity ของการวัด ฯลฯ เมื่อพูดแบบนั้น)
usεr11852พูดว่า Reinstate Monic

2
แน่นอนว่ามันจะเกิดขึ้นเมื่อมันไม่ได้อยู่ในอันดับเต็ม (หรือใกล้เคียงกับมัน) ดูคำจำกัดความของ PSD (และ @ sjm.majewski พูดถึงความสัมพันธ์กับความแปรปรวน) และสิ่งนี้ชัดเจนมาก แต่เพื่อนิยามว่ามันเป็นพยาธิสภาพที่ดูแปลกเพราะสถานการณ์แบบไม่เต็มชั้นเกิดขึ้นตลอดเวลาในทางปฏิบัติ นี่ไม่ใช่ pedantry ง่าย ๆ - มันมีผลกับชุดข้อมูลจริงทุกวันและด้วยเหตุนี้จึงสร้างคำถามปกติที่นี่ ฉันจะพูดถึงการหายไปและการลบแบบคู่เนื่องจากด้านบนไม่มีที่ว่างสำหรับมัน
Glen_b

2
n<พีn<พี

27

Σผม,J=1nYผมYJCโอโวลต์(Xผม,XJ)=VaR(Σผม=1nYผมXผม)0
YผมXผม

Y1=1,Y2=1,Y3=-1X1=X,X2=Y,X3=Z=X+YΣผม=13YผมXผม=00



นี่ควรเป็นคำตอบที่ยอมรับได้ คำถามนี้ถามเกี่ยวกับ "เมทริกซ์ความแปรปรวนร่วม" ซึ่งโดยทั่วไปอ้างถึงเมทริกซ์ความแปรปรวนร่วมของประชากรของตัวแปรสุ่มไม่ใช่ตัวอย่าง
user3303

ฉันขอถามสูตรที่คุณใช้ในคำตอบได้ไหม
Aqqqq

หากคุณหมายถึงสูตรที่มีความแปรปรวนและความแปรปรวนร่วมคุณสามารถได้มาจากสูตรสำหรับสแควร์ของผลรวม (นั่นคือสแควร์ของผลรวมเท่ากับผลรวมของผลิตภัณฑ์สำหรับคู่ทั้งหมด)
sjm.majewski
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.