ฉันพยายามเข้าใจผลลัพธ์ของการวิเคราะห์องค์ประกอบหลักที่ดำเนินการดังนี้
> head(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
> res = prcomp(iris[1:4], scale=T)
> res
Standard deviations:
[1] 1.7083611 0.9560494 0.3830886 0.1439265
Rotation:
PC1 PC2 PC3 PC4
Sepal.Length 0.5210659 -0.37741762 0.7195664 0.2612863
Sepal.Width -0.2693474 -0.92329566 -0.2443818 -0.1235096
Petal.Length 0.5804131 -0.02449161 -0.1421264 -0.8014492
Petal.Width 0.5648565 -0.06694199 -0.6342727 0.5235971
>
> summary(res)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7084 0.9560 0.38309 0.14393
Proportion of Variance 0.7296 0.2285 0.03669 0.00518
Cumulative Proportion 0.7296 0.9581 0.99482 1.00000
>
ฉันมักจะสรุปจากผลลัพธ์ด้านบน:
สัดส่วนของความแปรปรวนระบุจำนวนความแปรปรวนทั้งหมดที่มีในความแปรปรวนขององค์ประกอบหลักที่เฉพาะเจาะจง ดังนั้นความแปรปรวนของ PC1 จึงอธิบายความแปรปรวนของข้อมูลได้ 73%
ค่าการหมุนที่แสดงเป็นเช่นเดียวกับ 'การโหลด' ที่กล่าวถึงในคำอธิบายบางอย่าง
เมื่อพิจารณาการหมุนของ PC1 เราสามารถสรุปได้ว่า Sepal.Length, Petal.Length และ Petal กว้างเกี่ยวข้องโดยตรงและพวกเขาทั้งหมดมีความสัมพันธ์ตรงกันข้ามกับ Sepal.Width (ซึ่งมีค่าลบในการหมุน PC1)
อาจมีปัจจัยในพืช (ระบบการทำงานของสารเคมี / กายภาพบางอย่าง) ซึ่งอาจส่งผลกระทบต่อตัวแปรทั้งหมดเหล่านี้ (Sepal.Length, Petal.Length และ Petal ความกว้างในทิศทางเดียวและ Sepal กว้างในทิศทางตรงกันข้าม)
หากฉันต้องการแสดงการหมุนทั้งหมดในกราฟเดียวฉันสามารถแสดงการสนับสนุนสัมพัทธ์ของพวกเขากับการเปลี่ยนแปลงทั้งหมดโดยการคูณแต่ละการหมุนตามสัดส่วนของความแปรปรวนขององค์ประกอบหลักนั้น ตัวอย่างเช่นสำหรับ PC1 การหมุนของ 0.52, -0.26, 0.58 และ 0.56 ทั้งหมดจะถูกคูณด้วย 0.73 (ความแปรปรวนแบบสัดส่วนสำหรับ PC1 ที่แสดงในเอาต์พุตสรุป (res)
ฉันถูกต้องเกี่ยวกับข้อสรุปข้างต้น?
แก้ไขเกี่ยวกับคำถามที่ 5: ฉันต้องการแสดงการหมุนทั้งหมดในบาร์โค้ดแบบง่ายดังต่อไปนี้:
เนื่องจาก PC2, PC3 และ PC4 มีส่วนร่วมในการเปลี่ยนแปลงน้อยลงเรื่อย ๆ มันจะทำให้รู้สึกถึงการปรับ (ลด) การโหลดของตัวแปรที่มีหรือไม่