สิ่งที่ฉันคิดว่าเกิดขึ้นที่นี่คือตัวแปรทั้งหมดมีความสัมพันธ์เชิงบวกกับแต่ละอื่น ๆ ในกรณีนี้พีซีเครื่องที่ 1 ค่อนข้างบ่อยจะใกล้เคียงกับค่าเฉลี่ยของตัวแปรทั้งหมด หากตัวแปรทั้งหมดมีความสัมพันธ์เชิงบวกกับตรงเดียวกันค่าสัมประสิทธิ์สหสัมพันธ์ , จากนั้น PC ที่ 1 คือว่าสัดส่วนกับค่าเฉลี่ยของตัวแปรทั้งหมดที่ผมอธิบายที่นี่: Can เฉลี่ยตัวแปรทั้งหมดจะเห็นเป็นรูปแบบดิบของ PCA?ค
ในกรณีง่าย ๆ นี้ใคร ๆ ก็สามารถได้รับความสัมพันธ์ที่คุณถามเกี่ยวกับคณิตศาสตร์ พิจารณาเมทริกซ์สหสัมพันธ์ของขนาดที่มีลักษณะดังนี้:eigenvector แรกมีค่าเท่ากับซึ่งสอดคล้องกับค่าเฉลี่ย [ปรับสัดส่วน] ของตัวแปรทั้งหมด ค่าเฉพาะของมันคือค ผลรวมของค่าลักษณะเฉพาะของทุกคนถ้าได้รับการเรียนการสอนโดยรวมขององค์ประกอบในแนวทแยงทั้งหมดคือ nดังนั้นสัดส่วนของความแปรปรวนที่อธิบายโดยพีซีเครื่องแรกมีค่าเท่ากับn × n
⎛⎝⎜⎜⎜1คคคค1คคคค1คคคค1⎞⎠⎟⎟⎟.
( 1 , 1 , 1 , 1))⊤/n--√λ1= 1 + ( n - 1 ) cΣλผม= nR2=1n+n - 1nค≈ ค
ดังนั้นในกรณีที่ง่ายที่สุดนี้สัดส่วนของความแปรปรวนที่อธิบายโดยพีซีเครื่องแรกนั้นมีความสัมพันธ์ 100% กับความสัมพันธ์เฉลี่ยและสำหรับมีขนาดใหญ่มีค่าประมาณเท่ากับ ซึ่งเป็นสิ่งที่เราเห็นในแผนของคุณอย่างแม่นยำn
ฉันคาดหวังว่าสำหรับเมทริกซ์ขนาดใหญ่ผลลัพธ์นี้จะอยู่ที่ประมาณแม้ว่าความสัมพันธ์จะไม่เหมือนกันทั้งหมด
ปรับปรุง โดยใช้รูปที่โพสต์ในคำถามหนึ่งยังสามารถลองประเมินโดยสังเกตเห็นว่า2-C) ถ้าเราใช้เวลาและแล้วเราได้รับnOP กล่าวว่าข้อมูลนี้เป็น "ดัชนีหุ้น DAX" googling มันเราจะเห็นว่ามันเห็นได้ชัดว่าประกอบด้วยตัวแปร ไม่ใช่คู่ที่ไม่ดีnn = ( 1 - c ) / (R2- c )c = 0.5R2- c = 0.02n = 2530