มีหลายวิธีในการสร้าง PCA biplot และไม่มีคำตอบสำหรับคำถามของคุณ นี่คือภาพรวมสั้น ๆ
เราคิดว่าเมทริกซ์ข้อมูลมีจุดข้อมูลnจุดในแถวและอยู่กึ่งกลาง (เช่นคอลัมน์หมายความว่าเป็นศูนย์ทั้งหมด) สำหรับตอนนี้เราไม่คิดว่ามันเป็นมาตรฐานเช่นเราพิจารณา PCA ในเมทริกซ์ความแปรปรวนร่วม (ไม่ใช่เมทริกซ์สหสัมพันธ์) PCA จำนวนเงินที่มีมูลค่าการสลายตัวเอกพจน์X = U S V ⊤ ,คุณสามารถดูคำตอบของฉันที่นี่เพื่อดูรายละเอียด: ความสัมพันธ์ระหว่าง SVD และ PCA วิธีการใช้ SVD เพื่อทำ PCAXn
X=USV⊤,
ใน PCA biplot ส่วนประกอบหลักสองตัวแรกจะถูกพล็อตเป็นพล็อตการกระจายนั่นคือคอลัมน์แรกของจะถูกพล็อตกับคอลัมน์ที่สอง แต่การปรับสภาพอาจแตกต่างกัน เช่นหนึ่งสามารถใช้:U
- คอลัมน์ของ : สิ่งเหล่านี้เป็นองค์ประกอบหลักที่ถูกปรับอัตราส่วนเป็นผลรวมของหน่วยของกำลังสองU
- คอลัมน์ของ: สิ่งเหล่านี้เป็นส่วนประกอบหลักมาตรฐาน (ความแปรปรวนของหน่วย);n−1−−−−−√U
- คอลัมน์ของ : สิ่งเหล่านี้เป็นองค์ประกอบหลัก "ดิบ" (การคาดการณ์ในทิศทางหลัก)US
นอกจากนี้ตัวแปรดั้งเดิมจะถูกพล็อตเป็นลูกศร คือพิกัดของฉัน -th ลูกศรปลายทางจะได้รับโดยฉันค่า -th ในคอลัมน์แรกและครั้งที่สองของV แต่อีกครั้งหนึ่งสามารถเลือกการทำให้เป็นมาตรฐานที่แตกต่างกันเช่น:(x,y)iiV
- คอลัมน์ของ : ฉันไม่รู้ว่าการตีความที่นี่เป็นอย่างไรVS
- คอลัมน์ของ : สิ่งเหล่านี้เป็นภาระVS/n−1−−−−−√
- คอลัมน์ของ : เหล่านี้เป็นแกนหลักV
นี่คือลักษณะทั้งหมดของชุดข้อมูล Fisher Iris:
9XUSαβVS(1−α)/β9 คือ "biplots ที่เหมาะสม": คือการรวมกันของแผนย่อยใด ๆ จากด้านบนกับด้านล่างโดยตรง
[ไม่ว่าจะใช้ชุดค่าผสมใดก็ตามอาจจำเป็นต้องปรับขนาดลูกศรด้วยปัจจัยคงที่ตามอำเภอใจบางประการเพื่อให้ทั้งลูกศรและจุดข้อมูลปรากฏขึ้นในระดับเดียวกัน]
VS/n−1−−−−−√Un−1−−−−−√
[ตัวเลือกเฉพาะ] นี้มีแนวโน้มที่จะให้ความช่วยเหลือด้านกราฟิกที่มีประโยชน์มากที่สุดในการตีความเมทริกซ์หลายตัวแปรของการสังเกตซึ่งแน่นอนว่าสิ่งเหล่านี้สามารถประมาณได้อย่างเพียงพอที่อันดับสอง
USV
US
biplot
UVSbiplot
0.8biplot
n/(n−1)1ดูการสอบสวนโดยละเอียดนี้โดย @AntoniParellada:
PCA บนเมทริกซ์สหสัมพันธ์
X1
1R=1
อ่านเพิ่มเติม: