แสดงภาพล้านฉบับ PCA


31

เป็นไปได้หรือไม่ที่จะเห็นภาพผลลัพธ์ของการวิเคราะห์องค์ประกอบหลักในรูปแบบที่ให้ข้อมูลเชิงลึกมากกว่าแค่ตารางสรุป? เป็นไปได้ไหมที่จะทำเมื่อจำนวนการสังเกตมีขนาดใหญ่พูด ~ 1e4 และเป็นไปได้หรือไม่ที่จะทำใน R [สภาพแวดล้อมอื่น ๆ ยินดีต้อนรับ]?


2
คำถามสองสามข้อ: คุณมีองค์ประกอบกี่ตัว นอกจากขนาดตัวอย่างแล้วมีอะไรที่ทำให้การแสดงผลของ PCA นี้จำเป็นต้องแตกต่างจากการแสดงของตัวแปรต่อเนื่องอื่น ๆ ที่อาจมีการจัดการหรือไม่ คุณพยายามเปรียบเทียบคะแนนของกลุ่มต่าง ๆ กันหรือไม่และถ้าเป็นจำนวนเท่าไหร่ โดยทั่วไปคุณคาดหวังว่าจะได้อะไรจากจอแสดงผลของคุณ
rolando2

คำตอบ:


53

biplotเป็นเครื่องมือที่มีประโยชน์สำหรับการแสดงผลของการ PCA จะช่วยให้คุณเห็นภาพคะแนนองค์ประกอบหลักและทิศทางพร้อมกัน ด้วยการสังเกต 10,000 ครั้งคุณอาจพบปัญหากับการวางแผนมากเกินไป การผสมอัลฟ่าสามารถช่วยได้

นี่คือพีซี biplot ของข้อมูลไวน์จากที่เก็บ UCI ML :

พีซี Biplot ของข้อมูลไวน์จาก UCI ML Repository

คะแนนสอดคล้องกับคะแนน PC1 และ PC2 ของการสำรวจแต่ละครั้ง ลูกศรแสดงถึงความสัมพันธ์ของตัวแปรกับ PC1 และ PC2 วงกลมสีขาวบ่งชี้ขอบเขตสูงสุดของลูกศร จุดไข่ปลานั้นเป็นจุดไข่ปลาข้อมูล 68% สำหรับข้อมูลทั้งสามสายพันธุ์ของไวน์

ฉันได้ทำรหัสสำหรับการสร้างพล็อตนี้สามารถใช้ได้ที่นี่


5
การเพิ่มไดนาไมต์จริงๆ
rolando2

1

p×2VVVT

V

4

พล็อต Wachter สามารถช่วยให้คุณเห็นภาพค่าลักษณะเฉพาะของ PCA ของคุณ มันเป็นพล็อต QQ ของค่าลักษณะเฉพาะเทียบกับการแจกแจง Marchenko-Pastur ฉันมีตัวอย่างที่นี่: พล็อต Wachter แสดงค่าลักษณะเฉพาะที่โดดเด่นมีค่าลักษณะเฉพาะที่โดดเด่นซึ่งอยู่นอกการกระจาย Marchenko-Pastur ประโยชน์ของพล็อตประเภทนี้ขึ้นอยู่กับใบสมัครของคุณ


7
การรู้เพิ่มเติมที่นี่จะเป็นประโยชน์ (อาจเป็นคำอธิบายเพิ่มเติม & / หรือลิงก์ที่มีประโยชน์) การกระจาย Marchenko-Pastur คืออะไร? มันเกี่ยวข้องกับ PCA อย่างไร หมายความว่าอย่างไรสำหรับผลลัพธ์ของคุณหากมีหรือไม่ (ฯลฯ )
gung - Reinstate Monica

0

คุณสามารถใช้แพ็คเกจจิตได้เช่นกัน

นี้มีวิธีการ plot.factor ซึ่งจะพล็อตส่วนประกอบที่แตกต่างกันกับรูปแบบของเมทริกซ์กระจาย

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.