เหตุใด PCA จึงไวต่อผู้ผิด


26

มีโพสต์มากมายใน SE นี้ที่กล่าวถึงวิธีการที่แข็งแกร่งในการวิเคราะห์องค์ประกอบหลัก (PCA) แต่ฉันไม่สามารถหาคำอธิบายที่ดีเพียงข้อเดียวว่าทำไม PCA จึงไวต่อผู้ผิดกฎหมายในตอนแรก


5
เนื่องจากการสนับสนุนบรรทัดฐาน L2 นั้นสูงมากสำหรับผู้ผิดกฎหมาย จากนั้นเมื่อลดมาตรฐาน L2 ให้น้อยที่สุด (ซึ่งเป็นสิ่งที่ PCA พยายามทำ) คะแนนเหล่านั้นจะดึงยากขึ้นเพื่อให้พอดีกับจุดที่ใกล้กลางมากขึ้น
คณิตศาสตร์ที่

คำตอบนี้บอกทุกสิ่งที่คุณต้องการ แค่อ่านค่าผิดปกติและอ่านอย่างตั้งใจ
S. Kolassa - Reinstate Monica

คำตอบ:


35

เหตุผลหนึ่งคือ PCA สามารถถูกคิดว่าเป็นการสลายตัวของข้อมูลที่ลดระดับผลรวมของบรรทัดฐานของส่วนที่เหลือของการย่อยสลาย คือถ้าเป็นข้อมูลของคุณ (เวกเตอร์ของ Dimensions) และเป็นพื้นฐาน PCA (เวกเตอร์ของมิติ) จากนั้นการสลายตัวจะลดลงอย่างเข้มงวด นี่Aคือเมทริกซ์ของสัมประสิทธิ์การสลาย PCA และ\ lVert \ cdot \ rVert_Fเป็นบรรทัดฐาน Frobenius ของเมทริกซ์L2YmnXkn

YXAF2=j=1mYjXAj.2
AF

เนื่องจาก PCA ย่อขนาดบรรทัดฐานL2ให้น้อยที่สุด(เช่นกำลังสองกำลังสอง) มันจึงมีปัญหาแบบเดียวกันคือกำลังสองน้อยที่สุดหรือปรับให้เหมาะสมกับ Gaussian โดยการอ่อนไหวต่อค่าผิดปกติ เนื่องจากการยกกำลังสองของการเบี่ยงเบนจากค่าผิดปกติพวกเขาจะมีอำนาจเหนือบรรทัดฐานทั้งหมดและดังนั้นจึงจะผลักดันส่วนประกอบ PCA

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.