ในกรณีของ PCA "แปรปรวน" หมายถึงความแปรปรวนปลายทางหรือความแปรปรวนหลายตัวแปรหรือความแปรปรวนโดยรวมหรือความแปรปรวนทั้งหมด ด้านล่างคือเมทริกซ์ความแปรปรวนร่วมของตัวแปร 3 ตัว ความแปรปรวนของพวกมันอยู่ในแนวทแยงมุมและผลรวมของ 3 ค่า (3.448) คือความแปรปรวนโดยรวม
1.343730519 -.160152268 .186470243
-.160152268 .619205620 -.126684273
.186470243 -.126684273 1.485549631
ตอนนี้ PCA จะแทนที่ตัวแปรเดิมด้วยตัวแปรใหม่ที่เรียกว่าองค์ประกอบหลักซึ่งเป็นมุมฉาก (เช่นพวกเขามีศูนย์แปรปรวนร่วม) และมีความแปรปรวน (เรียกว่าค่าลักษณะเฉพาะ) ในลำดับที่ลดลง ดังนั้นเมทริกซ์ความแปรปรวนร่วมระหว่างองค์ประกอบหลักที่สกัดจากข้อมูลข้างต้นคือ:
1.651354285 .000000000 .000000000
.000000000 1.220288343 .000000000
.000000000 .000000000 .576843142
โปรดทราบว่าผลรวมเส้นทแยงมุมยังคงเป็น 3.448 ซึ่งบอกว่าส่วนประกอบทั้ง 3 นั้นมีความแปรปรวนหลายตัวแปรทั้งหมด องค์ประกอบหลักที่ 1 บัญชีหรือ "อธิบาย" 1.651 / 3.448 = 47.9% ของความแปรปรวนโดยรวม อันที่สองอธิบาย 1.220 / 3.448 = 35.4% ของมัน อันที่สามอธิบาย. 577 / 3.448 = 16.7% ของมัน
ดังนั้นพวกเขาหมายความว่าอย่างไรเมื่อพวกเขาพูดว่า " PCA เพิ่มความแปรปรวน " หรือ " PCA อธิบายความแปรปรวนสูงสุด " นั่นไม่ใช่แน่นอนว่ามันพบความแปรปรวนที่ใหญ่ที่สุดในสามค่า1.343730519 .619205620 1.485549631
ไม่ใช่ PCA พบในพื้นที่ข้อมูลที่มิติ (ทิศทาง) กับความแปรปรวนที่ใหญ่ที่สุดออกมาจากภาพรวม1.343730519+.619205620+1.485549631 = 3.448
ความแปรปรวน ความแปรปรวนที่ใหญ่ที่สุดนั้น1.651354285
คือ จากนั้นก็จะพบมิติของความแปรปรวนที่ใหญ่เป็นอันดับสองมุมฉากกับอันที่หนึ่งออกมาจาก3.448-1.651354285
ความแปรปรวนโดยรวมที่เหลืออยู่ มิติที่สองนั้นจะ1.220288343
แปรปรวน และอื่น ๆ ส่วนที่เหลือสุดท้ายคือ.576843142
ความแปรปรวน ดู "Pt3" ที่นี่และคำตอบที่ดีที่นี่ อธิบายวิธีการลงมือทำอย่างละเอียดยิ่งขึ้น
ในทางคณิตศาสตร์ PCA ดำเนินการผ่านฟังก์ชั่นพีชคณิตเชิงเส้นที่เรียกว่า eigen-decomposition หรือ svd-decomposition ฟังก์ชั่นเหล่านี้จะกลับคุณค่าลักษณะเฉพาะทั้งหมด1.651354285 1.220288343 .576843142
(และ eigenvectors ที่สอดคล้องกัน) ในครั้งเดียว ( ดู , ดู )