ใน PCA เมื่อจำนวนมิติมากกว่า (หรือเท่ากับ) จำนวนตัวอย่างทำไมคุณถึงมีeigenvector ที่ไม่ใช่ศูนย์มากที่สุดในคำอื่น ๆ ยศแปรปรวนเมทริกซ์ในหมู่ที่มิติคือN-1N N - 1 d ≥ N N - 1
ตัวอย่าง: ตัวอย่างของคุณเป็นภาพเวกเตอร์ซึ่งมีขนาดแต่คุณมีเพียงภาพN = 10
ใน PCA เมื่อจำนวนมิติมากกว่า (หรือเท่ากับ) จำนวนตัวอย่างทำไมคุณถึงมีeigenvector ที่ไม่ใช่ศูนย์มากที่สุดในคำอื่น ๆ ยศแปรปรวนเมทริกซ์ในหมู่ที่มิติคือN-1N N - 1 d ≥ N N - 1
ตัวอย่าง: ตัวอย่างของคุณเป็นภาพเวกเตอร์ซึ่งมีขนาดแต่คุณมีเพียงภาพN = 10
คำตอบ:
พิจารณาสิ่งที่ PCA ทำ พูดง่ายๆก็คือ PCA (โดยทั่วไปแล้วจะทำงาน) สร้างระบบพิกัดใหม่โดย:
(สำหรับรายละเอียดเพิ่มเติมให้ดูหัวข้อ CV ที่ยอดเยี่ยมนี้: ทำความเข้าใจกับการวิเคราะห์องค์ประกอบหลัก, ค่าเฉพาะและค่าลักษณะเฉพาะ ) อย่างไรก็ตามมันไม่เพียงแค่หมุนแกนของคุณแบบเก่า ๆ ใหม่ของคุณ(องค์ประกอบหลักตัวแรก) มุ่งเน้นไปที่ทิศทางข้อมูลของคุณในรูปแบบที่หลากหลาย องค์ประกอบหลักที่สองคือการมุ่งเน้นในทิศทางของจำนวนมากที่สุดต่อไปของการเปลี่ยนแปลงที่เป็นมุมฉากกับองค์ประกอบหลักแรก ส่วนประกอบหลักที่เหลือจะเกิดขึ้นเช่นเดียวกัน
กับในใจให้ตรวจสอบตัวอย่าง @ อะมีบาของ นี่คือเมทริกซ์ข้อมูลที่มีสองจุดในพื้นที่สามมิติ:
ลองดูจุดเหล่านี้ใน ( pseudo) scatterplot สามมิติ:
ดังนั้นทำตามขั้นตอนข้างต้น (1) ที่มาของระบบพิกัดใหม่จะตั้งอยู่ที่1.5) (2) แกนมีค่าเท่ากันแล้ว (3) องค์ประกอบหลักตัวแรกจะเป็นแนวทแยงมุมจากถึงซึ่งเป็นทิศทางของการเปลี่ยนแปลงที่ยิ่งใหญ่ที่สุดสำหรับข้อมูลเหล่านี้ ตอนนี้องค์ประกอบหลักที่สองจะต้องเป็นมุมฉากเป็นอันดับแรกและควรจะไปในทิศทางของการเปลี่ยนแปลงที่ยิ่งใหญ่ที่สุดที่เหลืออยู่ แต่ทิศทางนั้นคืออะไร? มันมาจากถึงหรือจากถึงหรืออย่างอื่น? ไม่มีการเปลี่ยนแปลงที่เหลืออยู่ดังนั้นจึงไม่สามารถมีองค์ประกอบหลักได้อีก( 0 , 0 , 0 ) ( 3 , 3 , 3 ) ( 0 , 0 , 3 ) ( 3 , 3 , 0 ) ( 0 , 3 , 0 ) ( 3 , 0 , 3 ).
ด้วยข้อมูลเราสามารถใส่ได้ (สูงสุด)ส่วนประกอบหลัก N - 1 = 1