วิธีการตีความ biplot PCA นี้มาจากการสำรวจสิ่งที่ผู้คนมีความสนใจในพื้นที่?


10

ความเป็นมา:ฉันถามผู้เข้าร่วมหลายร้อยคนในแบบสำรวจของฉันว่าพวกเขาสนใจในพื้นที่ที่เลือกไว้มากเพียงใด (โดยห้าจุด Likert มี 1 ตัวบ่งชี้ว่า "ไม่สนใจ" และ 5 ระบุว่า "สนใจ")

จากนั้นฉันก็ลอง PCA ภาพด้านล่างเป็นการฉายภาพลงในองค์ประกอบหลักสองประการแรก สีที่ใช้สำหรับเพศและลูกศร PCA เป็นตัวแปรดั้งเดิม (เช่นความสนใจ)

ฉันสังเกตว่า:

  • จุด (ผู้ตอบแบบสอบถาม) ค่อนข้างแยกจากกันโดยองค์ประกอบที่สอง
  • ไม่มีลูกศรชี้ไปทางซ้าย
  • ลูกศรบางตัวสั้นกว่าลูกศรอื่นมาก
  • ตัวแปรมีแนวโน้มที่จะสร้างกลุ่ม แต่ไม่ใช่การสังเกต
  • ดูเหมือนว่าลูกศรชี้ลง (สำหรับผู้ชาย) ส่วนใหญ่เป็นความสนใจของผู้ชายและลูกศรชี้ขึ้นส่วนใหญ่เป็นความสนใจของผู้หญิง
  • ลูกศรบางตัวชี้ไม่ขึ้นหรือลง

คำถาม:วิธีการตีความความสัมพันธ์ระหว่างจุดอย่างถูกต้อง (ผู้ตอบแบบสอบถาม), สี (เพศ) และลูกศร (ตัวแปร) ได้อย่างไร? ข้อสรุปอื่น ๆ เกี่ยวกับผู้ตอบและความสนใจของพวกเขาสามารถขุดได้จากแผนนี้

ข้อมูลที่สามารถพบได้ที่นี่

การวิเคราะห์ PCA


คุณคิดว่าพีซีเครื่องแรกเป็นอย่างไร ระดับความสนใจโดยรวมของผู้ถูกร้อง?
Placidia

ภาพนี้เป็นbiplot PCA ของ แนะนำให้คุณค้นหาคำเพื่ออ่านวิธีตีความมัน กล่าวโดยย่อก็คือทั้งคะแนนของพีซีและการโหลดตัวแปรที่แสดง (เพียงเพื่อความกระชับ) ในภาพเดียวกัน ดูรูปภาพที่อธิบายของฉันด้วย เป็นที่ชัดเจนในรูปภาพของคุณ PC2 นั้นส่วนใหญ่เป็นมิติความแตกต่างทางเพศที่กำหนดไว้อย่างแรงที่สุดโดย 2 ตัวแปร: สนใจ + อีกอันที่ฉันมองไม่เห็น
ttnphns

@MiroslavSabo: ฉันชอบพล็อตของคุณเพราะมันแสดงให้เห็นว่าผู้ชายและผู้หญิงไม่ได้รวมกันเป็นสองกลุ่ม (ที่เกี่ยวกับความสนใจของพวกเขา) แต่จริง ๆ แล้วสร้างสเปกตรัม ฉันคิดว่าคุณกำลังเตรียมรายงานการวิจัย; มีการเผยแพร่หรือไม่ มันจะยังคงเป็นอย่างไร
อะมีบา

1
@amoeba ข้อมูลจากโพสต์ (รวมถึงรายการอื่น ๆ ในแบบสอบถาม) ได้รับการเผยแพร่สู่สาธารณะแล้ว
Miroslav Sabo

1
@DarwinPC ข้อมูลจากการโพสต์ (พร้อมกับรายการอื่น ๆ ในแบบสอบถาม) เป็นแบบสาธารณะแล้ว
Miroslav Sabo

คำตอบ:


7

จุดคือผู้ตอบแบบสอบถามและสีเป็นเพศ อย่างนี้คุณก็รู้ แกนหลักของพล็อตของคุณนั้นแทนคะแนนพีซีอันดับหนึ่งและสอง บางคนในควอดเดอร์มือซ้ายได้คะแนนต่ำทั้งคู่ PC2 ดูเหมือนจะตั้งค่าสถานะความสนใจ "ชาย" และ "หญิง" ฉันไม่รู้ว่า PC1 หมายถึงอะไร แต่อาจแสดงถึงคะแนนความสนใจโดยรวม - ผู้ที่มีความสนใจจำนวนมากให้คะแนนสูง หรืออาจหมายถึงคนที่มีความสนใจหลงใหล (คะแนน 5)

พาหะคือระบบพิกัดที่คาดการณ์ไว้สำหรับตัวแปรดั้งเดิม ดังนั้นหากคุณคาดการณ์จุดหนึ่งในแนวตั้งสมมติว่าเวกเตอร์การอ่าน - คุณควรได้คะแนนการอ่านของบุคคลนั้น ตำแหน่งสัมพัทธ์เป็นสิ่งสำคัญที่นี่

ใช้เวกเตอร์ "ชาย" เช่น "กีฬาอะดรีนาลีน" ทีนี้ลองจินตนาการว่าคุณฉายจุดสีชมพูลงมาจากจุดสูงสุดในควอดเรนท์ขวา การประสานงานของบุคคลนั้นเกี่ยวกับ "กีฬาอะดรีนาลีน" จะเป็นลบ

เหตุใดลูกศรจึงอยู่ในช่วงครึ่งขวาของกราฟ เมื่อพิจารณาถึงรูปทรงเรขาคณิตบุคคลที่อยู่ลึกเข้าไปในด้านซ้ายของกราฟจะยิ่งมีการคาดคะเนน้อยลง สิ่งนี้ชี้ให้เห็นว่า PC1 เป็นการวัดระดับความสนใจโดยรวม

ฉันไม่แน่ใจว่าคุณสามารถเรียนรู้สิ่งอื่นได้จากที่นี่ คุณอาจต้องการดู PC3 และ PC4 ถ้า PC1 และ PC2 เพียงบอกคุณว่าบางคนมีความสนใจมากกว่าคนอื่นและผู้ชายนั้นแตกต่างจากผู้หญิง

พล็อตของคุณดูเหมือนจะสมมาตรรอบแกน PC1 และสมมาตรตามเพศ ผู้ชายหลายคนมีความสนใจผู้หญิงในขณะที่ผู้หญิงมีความสนใจชาย ... ฉันแค่มองไปที่จุดต่างๆ อาจเป็นเรื่องที่น่าสนใจที่จะดูพื้นที่ที่แผนที่ไม่สมมาตร: PC1 ขนาดใหญ่ลบ PC2 ปานกลาง - ภาคนั้นมีการดำเนินการมากมาย ทำไม?


คุณอาจจะให้ความคิดของคุณกับ biplot ของฉันได้ไหม? ฉันมีปัญหาในการตีความ ขอบคุณ. stats.stackexchange.com/questions/276421/…
Seanosapien
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.