สับสนเกี่ยวกับคำอธิบายภาพของ eigenvectors: ชุดข้อมูลที่ต่างกันสามารถมี eigenvector เหมือนกันได้อย่างไร


10

ตำราสถิติจำนวนมากให้ภาพตัวอย่างที่เข้าใจง่ายว่า eigenvectors ของเมทริกซ์ความแปรปรวนร่วมคืออะไร:

ป้อนคำอธิบายรูปภาพที่นี่

เวกเตอร์uและzเป็นค่า eigenvectors (ดี, eigenaxes) มันสมเหตุสมผลแล้ว แต่สิ่งหนึ่งที่ทำให้ฉันสับสนก็คือเราแยก eigenvectors จากเมทริกซ์สหสัมพันธ์ไม่ใช่ข้อมูลดิบ นอกจากนี้ชุดข้อมูลดิบที่แตกต่างกันมากอาจมีเมทริกซ์สหสัมพันธ์เหมือนกัน ตัวอย่างเช่นทั้งคู่มีเมทริกซ์สหสัมพันธ์ของ:

[10.970.971]

eigenvectors

ดังนั้นพวกเขาจึงมี eigenvectors ชี้ไปในทิศทางเดียวกัน:

[.71.71.71.71]

แต่ถ้าคุณต้องใช้การตีความภาพแบบเดียวกันกับที่ทิศทางของข้อมูลผู้ใช้ในข้อมูลดิบคุณจะได้เวกเตอร์ชี้ไปในทิศทางที่ต่างกัน

ใครช่วยบอกฉันทีว่าฉันทำผิดไปได้ไหม

การแก้ไขที่สอง : หากฉันกล้าหาญมากด้วยคำตอบที่ดีเยี่ยมด้านล่างฉันสามารถเข้าใจความสับสนและแสดงให้เห็นได้

  1. คำอธิบายด้วยภาพสอดคล้องกับความจริงที่ว่า eigenvector สกัดจากเมทริกซ์ความแปรปรวนร่วมนั้นแตกต่างกัน

    Covariances และ Eigenvectors (สีแดง):

    [1111][.7.72.72.7]

    Covariances and Eigenvectors (Blue):

    [.25.5.51][.43.9.9.43]
  2. เมทริกซ์สหสัมพันธ์แสดงการฝึกแปรปรวนร่วมของตัวแปรมาตรฐาน การตรวจสอบด้วยตาแหน่งของตัวแปรมาตรฐานแสดงให้เห็นว่าเหตุใด eigenvector ที่เหมือนกันจึงถูกดึงในตัวอย่างของฉัน:

ป้อนคำอธิบายรูปภาพที่นี่


3
หากคุณต้องการประเมินความสัมพันธ์จากนั้นคุณต้องวาดโครงร่างของคุณด้วยสเกลที่ส่วนเบี่ยงเบนมาตรฐานของส่วนประกอบเท่ากัน นั่นไม่ใช่กรณีในภาพใด ๆ ของคุณ (ยกเว้นจุดสีแดงในภาพที่สอง) ซึ่งอาจเป็นสาเหตุหนึ่งที่ทำให้คุณสับสน
whuber

3
ฉันขอขอบคุณที่คุณได้แสดงคำถามของคุณ ที่ช่วยให้ผู้คนเข้าใจและเพิ่มมูลค่าของเธรดสำหรับการอ้างอิงในอนาคต อย่างไรก็ตามโปรดระวังด้วยว่าผู้ชายประมาณ 10% นั้นเป็นคนตาบอดสีแดง - เขียว ด้วย 2 สีสีแดงและสีน้ำเงินอาจปลอดภัยกว่า
gung - Reinstate Monica

ขอบคุณมากฉันได้แก้ไขสีตามที่คุณแนะนำ
Sue Doh Nimh

2
ไม่มีปัญหา @SueDohNimh ขอบคุณที่ทำให้เข้าใจได้สำหรับทุกคน ในบันทึกอื่นฉันจะเก็บ[PCA]แท็กไว้ หากคุณต้องการโฟกัสคำถามอีกครั้งหรือถามคำถาม (ลิงก์ที่เกี่ยวข้อง) ใหม่ & ลิงก์ไปยังคำถามนี้ดูเหมือนว่าใช้ได้ แต่ฉันคิดว่าคำถามนี้คือ PCA-ish เพียงพอที่จะทำแท็ก
gung - Reinstate Monica

เยี่ยมมาก @SueDohNimh คุณสามารถเพิ่มสิ่งนั้นเป็นคำตอบสำหรับคำถามของคุณเองแทนที่จะแก้ไขได้ถ้าคุณต้องการ
gung - Reinstate Monica

คำตอบ:


9

คุณไม่ต้องทำ PCA กับเมทริกซ์สหสัมพันธ์ คุณสามารถสลายเมทริกซ์ความแปรปรวนร่วมได้เช่นกัน โปรดทราบว่าโดยทั่วไปแล้วสิ่งเหล่านี้จะให้โซลูชันที่แตกต่างกัน (สำหรับข้อมูลเพิ่มเติมเกี่ยวกับเรื่องนี้โปรดดู: PCA เกี่ยวกับความสัมพันธ์หรือความแปรปรวนร่วม? )

ในรูปที่สองของคุณความสัมพันธ์เหมือนกัน แต่กลุ่มดูแตกต่างกัน พวกเขาดูแตกต่างเพราะพวกเขามีพันธมิตรที่แตกต่างกัน อย่างไรก็ตามความแปรปรวนก็แตกต่างกัน (เช่นกลุ่มสีแดงแปรผันตามช่วงกว้างของ X1) และความสัมพันธ์คือความแปรปรวนร่วมหารด้วยค่าเบี่ยงเบนมาตรฐาน ( ) เป็นผลให้ความสัมพันธ์สามารถเหมือนกัน Covxy/SDxSDy

อีกครั้งถ้าคุณทำ PCA กับกลุ่มเหล่านี้โดยใช้เมทริกซ์ความแปรปรวนร่วมคุณจะได้รับผลลัพธ์ที่แตกต่างจากถ้าคุณใช้เมทริกซ์สหสัมพันธ์


2
+1 คุณอาจจะยังสังเกตเห็นว่ามีสองตัวแปรสัมพันธ์เมทริกซ์มักจะมีเหมือนกันสอง eigenvectors,และ , เรื่องสิ่งที่มีค่าความสัมพันธ์ไม่มี (1,1)(1,1)
whuber

1
+1 ถึงสิ่งที่ @whuber เขียน แต่โปรดทราบว่าค่าลักษณะที่เกี่ยวข้องนั้นขึ้นอยู่กับค่าสหสัมพันธ์
อะมีบา

นี่เป็นความจริง แต่ eigenvectors ของเมทริกซ์ของ Cov สามารถแตกต่างกันไปตามสหสัมพันธ์
gung - Reinstate Monica

1
สวัสดีทุกคนขอบคุณมาก ฉันทราบว่า eigenvectors ที่แตกต่างกันเกิดขึ้นจากการใช้เมทริกซ์ความแปรปรวนร่วมแทน นี่เป็นอีกประเด็นที่น่าเป็นห่วงเพราะฉันทำให้ฉันกังวลว่าด้วยการใช้เมทริกซ์สหสัมพันธ์แทนฉันก็ลดการใช้ข้อมูลลงและทำให้ความแม่นยำลดลง มันจะสมเหตุสมผลหรือไม่ที่จะสรุปตามการตอบสนองของคุณว่าการตีความภาพที่ให้นั้นใช้ได้กับ eigenvectors ของเมทริกซ์ความแปรปรวนร่วมของข้อมูลดิบมากกว่าเมทริกซ์การแก้ไขไหม?
Sue Doh Nimh

1
ไม่ได้จริงๆ @SueDohNimh คุณสามารถใช้การตีความภาพเพียงแค่สร้างมาตรฐานให้กับตัวแปรของคุณก่อนหากคุณต้องการใช้เมทริกซ์สหสัมพันธ์
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.