การโหลด (ซึ่งไม่ควรสับสนกับ eigenvector) มีคุณสมบัติดังต่อไปนี้:
- ผลรวมกำลังสองของพวกเขาภายในแต่ละองค์ประกอบคือค่าลักษณะเฉพาะ (ความแปรปรวนของส่วนประกอบ)
- โหลดเป็นค่าสัมประสิทธิ์ในการรวมกันเชิงเส้นทำนายตัวแปรโดยส่วนประกอบ (มาตรฐาน)
A
A (loadings)
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
Eigenvalues:
1.0000000000 1.0000000000
ในกรณีนี้ค่าลักษณะเฉพาะทั้งสองเท่ากัน มันเป็นกรณีที่เกิดขึ้นได้ยากในโลกแห่งความเป็นจริงมันบอกว่า PC1 และ PC2 นั้นมี "ความแข็งแกร่ง" ที่อธิบายอย่างเท่าเทียมกัน
Nx2
คX^= C A'AX^
A4x4
B = ( A- 1)'B = A ⋅ d i a g ( e i g e n v a l u e s )- 1= ( A+)'diag(eigenvalues)
คือเมทริกซ์ทแยงมุมสี่เหลี่ยมจัตุรัสที่มีค่าลักษณะเฉพาะบนเส้นทแยงมุมและ+
ตัวยกหมายถึง pseudoinverse ในกรณีของคุณ:
diag(eigenvalues):
1 0
0 1
B (coefficients to predict components by original variables):
PC1 PC2
X1 .5000000000 .5000000000
X2 .5000000000 .5000000000
X3 .5000000000 -.5000000000
X4 .5000000000 -.5000000000
XNx4
C = X Bค
PC1 = 0.5 * X1 + 0.5 * X2 + 0.5 * X3 + 0.5 * X4 ~ (X1 + X2 + X3 + X4) / 4
"องค์ประกอบแรกเป็นสัดส่วนกับคะแนนเฉลี่ย"
PC2 = 0.5 * X1 + 0.5 * X2 - 0.5 * X3 - 0.5 * X4 = (0.5 * X1 + 0.5 * X2) - (0.5 * X3 + 0.5 * X4)
"องค์ประกอบที่สองวัดความแตกต่างระหว่างคะแนนคู่แรกกับคะแนนคู่ที่สอง"
B = A
บันทึกB=A⋅diag(eigenvalues)−1B=R−1ARเป็นเมทริกซ์ความแปรปรวนร่วม (หรือสหสัมพันธ์) ของตัวแปร สูตรหลังมาโดยตรงจากทฤษฎีการถดถอยเชิงเส้น สองสูตรนี้เทียบเท่ากันภายในบริบท PCA เท่านั้น ในการวิเคราะห์ปัจจัยพวกเขาไม่ได้และเพื่อคำนวณคะแนนปัจจัย (ซึ่งมักจะเป็นค่าประมาณใน FA) หนึ่งควรพึ่งพาสูตรที่สอง
คำตอบที่เกี่ยวข้องของฉัน:
รายละเอียดเพิ่มเติมเกี่ยวกับภาระ VS eigenvectors
คะแนนองค์ประกอบหลักและคะแนนปัจจัยคำนวณอย่างไร