มีโพสต์มากมายใน SE นี้ที่กล่าวถึงวิธีการที่แข็งแกร่งในการวิเคราะห์องค์ประกอบหลัก (PCA) แต่ฉันไม่สามารถหาคำอธิบายที่ดีเพียงข้อเดียวว่าทำไม PCA จึงไวต่อผู้ผิดกฎหมายในตอนแรก
มีโพสต์มากมายใน SE นี้ที่กล่าวถึงวิธีการที่แข็งแกร่งในการวิเคราะห์องค์ประกอบหลัก (PCA) แต่ฉันไม่สามารถหาคำอธิบายที่ดีเพียงข้อเดียวว่าทำไม PCA จึงไวต่อผู้ผิดกฎหมายในตอนแรก
คำตอบ:
เหตุผลหนึ่งคือ PCA สามารถถูกคิดว่าเป็นการสลายตัวของข้อมูลที่ลดระดับผลรวมของบรรทัดฐานของส่วนที่เหลือของการย่อยสลาย คือถ้าเป็นข้อมูลของคุณ (เวกเตอร์ของ Dimensions) และเป็นพื้นฐาน PCA (เวกเตอร์ของมิติ) จากนั้นการสลายตัวจะลดลงอย่างเข้มงวด
นี่Aคือเมทริกซ์ของสัมประสิทธิ์การสลาย PCA และ\ lVert \ cdot \ rVert_Fเป็นบรรทัดฐาน Frobenius ของเมทริกซ์
เนื่องจาก PCA ย่อขนาดบรรทัดฐานให้น้อยที่สุด(เช่นกำลังสองกำลังสอง) มันจึงมีปัญหาแบบเดียวกันคือกำลังสองน้อยที่สุดหรือปรับให้เหมาะสมกับ Gaussian โดยการอ่อนไหวต่อค่าผิดปกติ เนื่องจากการยกกำลังสองของการเบี่ยงเบนจากค่าผิดปกติพวกเขาจะมีอำนาจเหนือบรรทัดฐานทั้งหมดและดังนั้นจึงจะผลักดันส่วนประกอบ PCA