ทำไมเมทริกซ์สหสัมพันธ์จึงต้องมีค่ากึ่งบวกแน่นอนและมันหมายความว่าอะไรเป็นค่ากึ่งบวกแน่นอน?


34

ฉันได้ค้นคว้าความหมายของคุณสมบัติกึ่งบวกแน่นอนของสหสัมพันธ์หรือเมทริกซ์ความแปรปรวนร่วม

ฉันกำลังมองหาข้อมูลใด ๆ

  • นิยามของความแน่นอนกึ่งบวก
  • คุณสมบัติที่สำคัญของมันผลกระทบในทางปฏิบัติ;
  • ผลที่ตามมาของการมีปัจจัยลบผลกระทบต่อการวิเคราะห์หลายตัวแปรหรือผลการจำลอง ฯลฯ

5
คุณต้องการที่จะเข้าใจว่ากึ่งเด็ดขาดคืออะไรหรือคุณต้องการที่จะรู้ว่าทำไมเมทริกซ์สหสัมพันธ์จึงต้องมีกึ่งแน่นอนหรือคุณต้องการที่จะรู้ว่าผลลัพธ์นี้มีนัยสำคัญโดยนัยของคุณสมบัตินี้หรือไม่?
whuber

4
หากเมทริกซ์สหสัมพันธ์ที่ไม่แน่นอนกึ่งบวกคุณก็จะได้ความแปรปรวนที่เป็นลบ

ฉันแก้ไขคำถามของคุณเล็กน้อยโปรดตรวจสอบ นอกจากนี้โปรดทราบว่าเมทริกซ์ที่มีค่าลักษณะเชิงลบเป็นจำนวนคู่จะยังคงมีปัจจัยบวก
ttnphns

เมทริกซ์ความแปรปรวนร่วมนั้นไม่เท่ากับเมทริกซ์สหสัมพันธ์เสมอไป! ความแปรปรวนร่วมพิจารณาตัวแปรปกติในขณะที่เมทริกซ์สหสัมพันธ์นั้นไม่
Manoj Kumar

1
คำถามที่เกี่ยวข้อง: เมทริกซ์ความแปรปรวนร่วมเป็นบวกแน่นอนหรือไม่ พิจารณากรณีที่กว้างขึ้นของเมทริกซ์ความแปรปรวนร่วมซึ่งเมทริกซ์สหสัมพันธ์เป็นกรณีพิเศษ ยังคือทุกความสัมพันธ์ในเชิงบวกเมทริกซ์กึ่งแน่นอน? และเมทริกซ์สหสัมพันธ์ทุกตัวเป็นค่าบวกแน่นอนหรือไม่
Silverfish

คำตอบ:


38

ความแปรปรวนของน้ำหนักรวมของตัวแปรสุ่มต้องไม่เป็นค่าลบสำหรับตัวเลือกทั้งหมดของจำนวนจริงฉัน เนื่องจากความแปรปรวนสามารถแสดงเป็น var ( ΣฉันฉันX ฉัน) = ΣฉันΣเจฉันเจ COV ( X ฉัน , X J ) = ΣฉันΣเจฉันเจΣ ผม, เจ ,ΣผมaผมXผมaผม

var(ΣผมaผมXผม)=ΣผมΣJaผมaJCOV(Xผม,XJ)=ΣผมΣJaผมaJΣผม,J,
เรามีเมทริกซ์ความแปรปรวนร่วมต้องเป็น semidefinite บวก (ซึ่งบางครั้งเรียกว่า nonnegative definite) จำได้ว่าเมทริกซ์Cเรียกว่า semidefinite ที่เป็นบวกถ้าหาก i j a i a j C i , j0Σ=[Σผม,J]C
ΣผมΣJaผมaJCผม,J0aผม,aJR.

ขอบคุณฉันลบ downvote ของฉัน แต่ฉันไม่ได้ upvote เพราะไม่ได้ตอบเกี่ยวกับการใช้งานจริง บอกว่าฉันมีเมทริกซ์ที่ไม่แน่นอนบวก (เนื่องจากตัวอย่างการปรับเปลี่ยนโดย 'ผู้เชี่ยวชาญ') จะเกิดอะไรขึ้นหากฉันใช้เพื่อปรับเทียบและ / หรือจำลองข้อมูล โดยเฉพาะนี่เป็นปัญหาที่แท้จริงเมื่อพยายามศึกษาผลรวมจำนวนมากและมีค่าไอเก็นเชิงลบเพียงไม่กี่ตัวหรือไม่? อะไรจะเป็นอัลกอริธึมที่มีประสิทธิภาพในการแปลงเมทริกซ์สหสัมพันธ์แบบกึ่งบวกแน่นอนที่ไม่ใช่บวกให้เป็นบวกกึ่งบวกแน่นอน? สิ่งที่จะเป็นผลกระทบของอัลกอริทึมนี้?
lcrmorin

@Were_cat ขอบคุณสำหรับการกลับลงมาของโหวต
Dilip Sarwate

คุณช่วยอธิบายความเสมอภาคแรกในสมการแรกได้ไหม
Vivek Subramanian

1
@VivekSubramanian Variance เป็นกรณีพิเศษของฟังก์ชันความแปรปรวนร่วม: และฟังก์ชันความแปรปรวนร่วมเป็นbilinear (หมายถึงมันเป็นฟังก์ชันเชิงเส้นตรงกับแต่ละอาร์กิวเมนต์: covvar(X)=COV(X,X)
COV(ΣผมaผมXผม,Y)=ΣผมaผมCOV(Xผม,Y)COV(X,ΣผมJYJ,)=ΣJJCOV(X,YJ)
Dilip Sarwate

18

คำตอบนั้นง่ายมาก

เมทริกซ์ความสัมพันธ์ถูกกำหนดดังนี้:

ให้X=[x1,x2,...,xn]ม.×nม.n

X=[(x1-μ1อี)s1,(x2-μ2อี)s2,(x3-μ3อี)s3,...]μ1μ2s1อี

เมทริกซ์สหสัมพันธ์นั้น

C=X'X

AZZ'AZ<0

CW'CW<0 0

(W'CW)=(W'X'XW)=(XW)'(XW)=Z12+Z22...Z=XWW'CW

ยูV'V


2
นี่คือคำตอบที่ชัดเจนและมีประโยชน์ที่สุด ขอบคุณมาก!
Yohan Obadia

12

(ความเป็นไปได้ที่หลวมในการให้เหตุผลจะเป็นของฉันฉันไม่ใช่นักคณิตศาสตร์: นี่เป็นการพรรณนาไม่ใช่การพิสูจน์และมาจากการทดลองเชิงตัวเลขของฉันไม่ใช่จากหนังสือ)

  1. semidefinite บวก (PSD) เมทริกซ์ที่เรียกว่าเมทริกซ์ Gramian เป็นเมทริกซ์ที่ไม่มีค่าลักษณะเฉพาะเชิงลบ เมทริกซ์ที่มีค่าลักษณะเฉพาะเชิงลบนั้นไม่ใช่ semidefinite เชิงบวกหรือไม่ใช่แกรมเมีย ทั้งสองอย่างนี้สามารถกำหนดได้อย่างชัดเจน (ไม่มีค่า eigenvalues) หรือเอกพจน์ (อย่างน้อยหนึ่งค่า eigenvalue) [คำว่า "Gramian" ถูกนำมาใช้ในความหมายที่แตกต่างกันในทางคณิตศาสตร์ดังนั้นควรหลีกเลี่ยงบางที]
  2. ในสถิติเรามักจะใช้คำเหล่านี้กับเมทริกซ์ประเภท SSCP หรือที่เรียกว่าเมทริกซ์ผลิตภัณฑ์สเกลาร์ ความสัมพันธ์หรือความแปรปรวนร่วมการฝึกอบรมเป็นกรณีเฉพาะของเมทริกซ์ดังกล่าว
  3. nพีพีพีnnเมทริกซ์ความแปรปรวนร่วมระหว่างเคส เมื่อคุณคำนวณจากข้อมูลจริงเมทริกซ์จะเป็น Gramian เสมอ คุณอาจได้รับเมทริกซ์ที่ไม่ใช่แกรมเมีย (ไม่ใช่ psd) ถ้า (1) มันเป็นเมทริกซ์ความคล้ายคลึงกันที่วัดโดยตรง (เช่นไม่ได้คำนวณจากข้อมูล) หรือการวัดความคล้ายคลึงกันไม่ใช่ประเภท SSCP; (2) ค่าเมทริกซ์ถูกป้อนอย่างไม่ถูกต้อง (3) เมทริกซ์เป็นจริงใน Gramian แต่เป็น (หรือใกล้เคียงกับ) เอกพจน์ที่บางครั้งวิธีสเปกตรัมของการคำนวณค่าลักษณะเฉพาะทำให้เกิดค่าลบเล็ก ๆ แทนค่าจริงหรือบวกเล็กน้อย
  4. d122=ชั่วโมง12+ชั่วโมง22-2s12sชั่วโมงXYdxY2=σx2+σY2-2โอโวลต์xY
  5. ม.ม.
  6. ม.ม.ม.
  7. สาเหตุที่เป็นไปได้หรือรุ่นของการกำหนดค่าที่ไม่ใช่แกรมเมีย (ไม่ใช่ยูคลิด) คืออะไร คำตอบจะตามมาด้วยการไตร่ตรอง [จุดที่ 4]
    • ม.ม.d
    • ชั่วโมงddชั่วโมงชั่วโมง
    • dชั่วโมงชั่วโมง1+ชั่วโมง2d12|ชั่วโมง1-ชั่วโมง2|
  8. |โอโวลต์ผมJ|>σผมσJ

Fig1

Fig1

รูปที่ 2

รูปที่ 2

Fig3

Fig3


2
จุดที่ 6 ต้องการการสาธิต: คุณแสดงให้เห็นว่าเมทริกซ์ของระยะทางแบบยุคลิดแบบสแควร์คือ pd แต่คุณยืนยันโดยไม่มีข้อพิสูจน์ว่าแต่ละเมทริกซ์ pd นั้นสอดคล้องกับการกำหนดค่าแบบยุคลิดของจุด นอกจากนี้คุณยังไม่ได้เชื่อมโยงคำจำกัดความของ pd ("ไม่มีค่าลักษณะเชิงลบ") กับการกำหนดลักษณะที่ตามมาของคุณ แนวคิดหลักมาถึงจุดสิ้นสุด (จุดที่ 8): เมทริกซ์ pd สามารถใช้เพื่อกำหนดระยะทาง เหตุผลนี่คือที่ที่คุณควรเริ่มการวิเคราะห์
whuber

@whuber: ขอบคุณสำหรับการประเมินที่สำคัญ ฉันกลัวเมื่อมันพิสูจน์ให้เห็นถึงบางสิ่งบางอย่างทางคณิตศาสตร์ฉันจม ฉันได้รายงานส่วนหนึ่งของประสบการณ์ภาคปฏิบัติ (ฉันพูดแบบนั้น); คำตอบไม่ได้เป็นลำดับการวิเคราะห์ คุณไม่ต้องการเพิ่มคำตอบของคุณเองที่สามารถแก้ไข / ปรับปรุงของฉันได้หรือไม่? มันอาจกลายเป็นความช่วยเหลือที่มีค่า หรือคุณมีอิสระในการทำงานกับข้อความของฉันเพื่อปรับปรุงหากคุณพบว่ามันไม่ได้ไร้ประโยชน์อย่างจริงจัง
ttnphns

ป.ล. จุดที่ 8 ของฉันบอกเป็นนัยว่าตั้งแต่จุดศูนย์กลางจุดยึดสองจุดเป็นการกำหนดค่าจุดไปยังเซนทรอยด์ของมันการดำเนินการนี้ไม่ได้เป็นการแนะนำที่ไม่เกี่ยวกับปริภูมิ (มันก่อให้เกิดภาวะเอกฐานเฉพาะ จากนั้นเราสามารถตรวจสอบว่าการกำหนดค่าเริ่มต้นคือยูคลิด มันไม่ถูกต้องเหรอ?
ttnphns
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.