ทำไมเมทริกซ์ความแปรปรวนร่วมตัวอย่างเอกพจน์เมื่อขนาดตัวอย่างน้อยกว่าจำนวนของตัวแปร


30

สมมติว่าฉันมีการแจกแจงแบบเกาส์มิติหลายมิติ และฉันใช้เวลาสังเกต (แต่ละของพวกเขาเวกเตอร์) จากการจำหน่ายนี้และคำนวณตัวอย่างแปรปรวนเมทริกซ์Sในบทความนี้ผู้เขียนระบุว่าเมทริกซ์ความแปรปรวนร่วมตัวอย่างที่คำนวณด้วยนั้นเป็นเอกพจน์n p S p > npnpSp>n

  • มันจริงหรือเป็นอย่างไร
  • คำอธิบายใด ๆ

4
โปรดทราบว่านี่เป็นความจริงที่เป็นอิสระจากการแจกแจงพื้นฐาน: ไม่จำเป็นต้องเป็นเกาส์เซียน
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


22

ข้อเท็จจริงบางประการเกี่ยวกับการจัดอันดับเมทริกซ์โดยไม่มีการพิสูจน์ (แต่การพิสูจน์ของทั้งหมดหรือเกือบทั้งหมดควรได้รับในตำราพีชคณิตเชิงเส้นมาตรฐานหรือในบางกรณีตั้งเป็นแบบฝึกหัดหลังจากให้ข้อมูลเพียงพอที่จะทำ)

ถ้าAและBเป็นสองเมทริกซ์ที่สอดคล้องกันดังนั้น:

(i) อันดับคอลัมน์A = แถวลำดับA

(ii) rank(A)=rank(AT)=rank(ATA)=rank(AAT)

(iii) rank(AB)min(rank(A),rank(B))

(iv) rank(A+B)rank(A)+rank(B)

(v) ถ้าเป็นเมทริกซ์จตุรัสของอันดับเต็มดังนั้นอันดับ( A B ) = อันดับ( A )Brank(AB)=rank(A)

พิจารณาเมทริกซ์ของข้อมูลตัวอย่าง, Y จากข้างต้นยศของปีที่มากที่สุดนาที( n , P )n×pyymin(n,p)

นอกจากนี้จากข้างต้นจะเห็นได้ว่าอันดับของจะไม่ใหญ่กว่าอันดับของy (โดยพิจารณาจากการคำนวณของSในรูปแบบเมทริกซ์ซึ่งอาจจะทำให้เข้าใจได้ง่าย)SyS

ถ้าแล้วยศ( Y ) < Pซึ่งในกรณีที่ตำแหน่ง( S ) < Pn<prank(y)<prank(S)<p


คำตอบที่ดี! ไม่ชัดเจนอย่างสมบูรณ์ แต่วิธีการที่ y และ S เกี่ยวข้องกับ A และ B?
Matifou

S คำนวณจาก y; ("x" ในโพสต์ต้นฉบับ) คุณสามารถใช้ข้อเท็จจริงเกี่ยวกับ y และกิจวัตรที่ทำกับมัน (ผ่านกฎข้างต้น) เพื่อให้ได้รับความนิยมในระดับ S บทบาทที่เล่นโดย A และ B เปลี่ยนจากขั้นตอนเป็นขั้นตอน
Glen_b -Reinstate Monica

14

คำตอบสั้น ๆ กับคำถามของคุณคือการที่ยศ 1 ดังนั้นถ้าp > nดังนั้นSจึงเป็นเอกพจน์(S)n1p>nS

สำหรับคำตอบที่ละเอียดยิ่งขึ้นให้จำไว้ว่าเมทริกซ์ความแปรปรวนร่วมแบบไม่เอนเอียงสามารถเขียนได้เช่นกัน

S=1n1i=1n(xix¯)(xix¯)T.

อย่างมีประสิทธิภาพเรากำลังสรุปรวมเมทริกซ์แต่ละคนมีอันดับที่ 1 สมมติว่าการสังเกตเป็นอิสระเป็นเส้นตรงในบางกรณีการสังเกตแต่ละครั้งx iมีส่วนช่วย 1 ถึงอันดับ( S )และ 1 ถูกลบออกจากอันดับ (ถ้าp > n ) เพราะเราแต่ละศูนย์การสังเกตโดยˉ x แต่ถ้าพหุในปัจจุบันคือการสังเกตแล้วยศ( S )อาจจะลดลงซึ่งอธิบายว่าทำไมยศอาจจะน้อยกว่าn - 1nxi(S)p>nx¯(S)n1

มีงานจำนวนมากได้ทำการศึกษาปัญหานี้ ยกตัวอย่างเช่นเพื่อนร่วมงานของฉันและฉันเขียนกระดาษในหัวข้อเดียวกันนี้ที่เรามีความสนใจในการกำหนดวิธีการดำเนินการถ้าเป็นเอกพจน์เมื่อนำไปใช้วิเคราะห์จำแนกเชิงเส้นในหน้า» nการตั้งค่าSpn


4
คุณช่วยกรุณาอธิบายรายละเอียดเกี่ยวกับเหตุผลที่ลบ 1 เพราะเราแต่ละศูนย์การสังเกตโดยx¯ ?
อะโวคาโด


คำตอบที่ดี! บางทีก็สามารถเพิ่มคำอธิบาย / link สำหรับความจริงที่คำสั่งที่เรามีข้อสรุปการฝึกอบรม𝑛แต่ละคนมียศ 1 ? ขอบคุณ!
Matifou

10

เมื่อคุณมองสถานการณ์อย่างถูกวิธีข้อสรุปนั้นชัดเจนและหยั่งรู้ได้ทันที

โพสต์นี้มีการสาธิตสองครั้ง ครั้งแรกด้านล่างทันทีเป็นคำพูด มันเทียบเท่ากับการวาดภาพที่เรียบง่ายซึ่งปรากฏที่ส่วนท้ายสุด ในระหว่างนั้นคือคำอธิบายความหมายของคำและรูปวาด


เมทริกซ์ความแปรปรวนสำหรับPสังเกต -variate เป็นP × Pเมทริกซ์คำนวณโดยซ้ายคูณเมทริกซ์X n P (ข้อมูล recentered) โดย transpose ของX ' P n ผลิตภัณฑ์ของการฝึกอบรมนี้จะส่งผ่านท่อเวกเตอร์ของพื้นที่เวกเตอร์ที่มีขนาดเป็นPและn ดังนั้นเมทริกซ์ความแปรปรวนที่ใฐานะที่เป็นเชิงเส้นการเปลี่ยนแปลงจะส่งR nเข้าไปในสเปซที่มีมิติที่มากที่สุดนาที( P , n )n pp×pXnpXpnpnRnmin(p,n)มันเป็นทันทีว่าอันดับของเมทริกซ์ความแปรปรวนนั้นยิ่งใหญ่กว่าไม่มีกว่า ) min(p,n) ดังนั้นถ้าดังนั้นอันดับคือnมากที่สุดซึ่ง - ซึ่งน้อยกว่าp -หมายถึงเมทริกซ์ความแปรปรวนร่วมเป็นเอกพจน์p>nnp

คำศัพท์ทั้งหมดนี้มีการอธิบายอย่างสมบูรณ์ในส่วนที่เหลือของโพสต์นี้

(ในฐานะที่เป็นอะมีบากรุณาชี้ให้เห็นในความคิดเห็นนี้ถูกลบและแสดงให้เห็นในคำตอบของคำถามที่เกี่ยวข้อง , ภาพของจริงโกหกใน codimension หนึ่งสเปซของR n (ประกอบด้วยเวกเตอร์ที่มีส่วนประกอบรวมศูนย์) เพราะ คอลัมน์ทั้งหมดถูกนำมาใช้ใหม่ที่ศูนย์ดังนั้นอันดับของเมทริกซ์ความแปรปรวนร่วมตัวอย่าง1XRnต้องไม่เกินn-1)1n1XXn1


พีชคณิตเชิงเส้นเป็นข้อมูลเกี่ยวกับการติดตามมิติของปริภูมิเวกเตอร์ คุณเพียงแค่ต้องชื่นชมแนวคิดพื้นฐานบางประการที่จะมีสัญชาตญาณอย่างลึกซึ้งสำหรับการยืนยันเกี่ยวกับอันดับและเอกพจน์:

  1. การคูณเมทริกซ์หมายถึงการแปลงเชิงเส้นของเวกเตอร์ เมทริกซ์Mหมายถึงการแปลงเชิงเส้นจากnมิติพื้นที่V nไปยังม.พื้นที่มิติVเมตร โดยเฉพาะมันส่งใด ๆx V nเพื่อM x = Y Vเมตร นี่คือการแปลงเชิงเส้นตามทันทีจากคำจำกัดความของการแปลงเชิงเส้นและคุณสมบัติทางคณิตศาสตร์พื้นฐานของการคูณเมทริกซ์m×nMnVnmVmxVnMx=yVm

  2. การแปลงเชิงเส้นไม่สามารถเพิ่มขนาดได้ ซึ่งหมายความว่าภาพของปริภูมิเวกเตอร์ทั้งภายใต้การเปลี่ยนแปลงM (ซึ่งเป็นพื้นที่ย่อยเวกเตอร์ของV เมตร ) สามารถมีมิติมากขึ้นกว่าไม่มีn นี่เป็นทฤษฎีบท (ง่าย) ที่ตามมาจากคำจำกัดความของมิติVnMVmn

  3. มิติของพื้นที่ย่อยเวกเตอร์ใด ๆ ต้องไม่เกินพื้นที่ว่างที่อยู่ นี่เป็นทฤษฎีบท แต่ก็ชัดเจนและง่ายต่อการพิสูจน์อีกครั้ง

  4. อันดับของการแปลงเชิงเส้นเป็นมิติของภาพของตน ยศของเมทริกซ์คืออันดับของการแปลงเชิงเส้นที่แสดง นี่คือคำจำกัดความ

  5. A singular matrix Mmn has rank strictly less than n (the dimension of its domain). In other words, its image has a smaller dimension. This is a definition.

To develop intuition, it helps to see the dimensions. I will therefore write the dimensions of all vectors and matrices immediately after them, as in Mmn and xn. Thus the generic formula

ym=Mmnxn

is intended to mean that the m×n matrix M, when applied to the n-vector x, produces an m-vector y.

Products of matrices can be thought of as a "pipeline" of linear transformations. Generically, suppose ya is an a-dimensional vector resulting from the successive applications of the linear transformations Mmn,Llm,,Bbc, and Aab to the n-vector xn coming from the space Vn. This takes the vector xn successively through a set of vector spaces of dimensions m,l,,c,b, and finally a.

Look for the bottleneck: because dimensions cannot increase (point 2) and subspaces cannot have dimensions larger than the spaces in which they lie (point 3), it follows that the dimension of the image of Vn cannot exceed the smallest dimension min(a,b,c,,l,m,n) encountered in the pipeline.


This diagram of the pipeline, then, fully proves the result when it is applied to the product XX:

![enter image description here

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.