ฉันรู้ว่าวัตถุประสงค์ของ PCA คือการลดมิติข้อมูล
นี่มักเป็นสิ่งที่ผู้คนคิด แต่ที่จริงแล้ว PCA เป็นเพียงการนำเสนอข้อมูลของคุณบนพื้นฐานมุมฉาก พื้นฐานนี้ยังคงมีมิติข้อมูลเหมือนกับข้อมูลต้นฉบับของคุณ ยังไม่มีอะไรหายไป ... ส่วนการลดขนาดนั้นขึ้นอยู่กับคุณอย่างสมบูรณ์ สิ่งที่ PCA มั่นใจได้คือขนาดสูงสุดของโปรเจ็กต์ใหม่ของคุณคือขนาดดีที่สุดที่อาจเป็นข้อมูลของคุณ สิ่งที่ดีที่สุดหมายถึงอะไร นั่นคือสิ่งที่อธิบายความแปรปรวนเข้ามาk k
เห็นได้ชัดว่าไม่ใช่ในกรณีนี้
ฉันจะไม่แน่ใจเกี่ยวกับสิ่งนั้น! จากพล็อตที่สองของคุณดูเหมือนว่าข้อมูลจำนวนมากจากข้อมูลของคุณจะถูกฉายลงบนเส้นแนวนอน นั่นคือ 1 มิติแทนที่จะเป็นพล็อตดั้งเดิมซึ่งมี 2 มิติ! เห็นได้ชัดว่าคุณสูญเสียข้อมูลบางส่วนเพราะคุณลบแกน Y แต่การสูญเสียข้อมูลนี้เป็นที่ยอมรับของคุณหรือไม่เป็นสายของคุณ
ตันมีคำถามที่เกี่ยวข้องกับสิ่งที่ PCA อยู่ในสถานที่ดังนั้นผมจึงขอแนะนำให้คุณตรวจสอบพวกเขาออกที่นี่ , ที่นี่ , ที่นี่หรือที่นี่ หากคุณมีคำถามอื่นหลังจากนั้นโปรดโพสต์พวกเขาและฉันยินดีที่จะช่วย
ตามคำถามจริงของคุณ:
เรื่องราวที่คุณสามารถบอกเกี่ยวกับอุณหภูมิกับไอศกรีมในพล็อต PCA คืออะไร
เนื่องจากแกนพิกัดใหม่นั้นเป็นการรวมกันเชิงเส้นของพิกัดดั้งเดิมดังนั้น ... โดยพื้นฐานแล้วไม่มีอะไรเลย! PCA จะให้คำตอบเช่น (ตัวเลขประกอบ):
PC1PC2=2.5×ice cream−3.6×temperature=−1.5×ice cream+0.6×temperature
มีประโยชน์กับคุณไหม? อาจจะ. แต่ฉันเดาไม่ได้ :)
แก้ไข
ฉันจะเพิ่มทรัพยากรนี้ซึ่งฉันคิดว่ามีประโยชน์เพราะแผนภูมิแบบโต้ตอบนั้นยอดเยี่ยม
แก้ไขอีกครั้ง
ในการอธิบายความหมายของดีที่สุด :k
PCA พยายามหามิติที่ให้ผลต่างความแปรปรวนสูงสุดเมื่อข้อมูลถูกนำไปฉาย สมมติว่าข้อมูลของคุณมีขนาดพีซีแรกจะอธิบายความแปรปรวนในข้อมูลของคุณได้มากกว่ามิติข้อมูลอื่น ๆ นั่นคือสิ่งที่ผมหมายถึงดีที่สุด kไม่ว่าจะมีประโยชน์กับคุณหรือไม่ก็เป็นอีกเรื่องหนึ่งn>kkk k