ประการแรกฉันคิดว่าการลบความสัมพันธ์และการฟอกสีฟันเป็นสองขั้นตอนที่แยกจากกัน
ในการแยกความสัมพันธ์ของข้อมูลเราจำเป็นต้องแปลงข้อมูลเพื่อให้ข้อมูลที่ถูกแปลงจะมีเมทริกซ์ความแปรปรวนร่วมแนวทแยง การเปลี่ยนแปลงนี้สามารถพบได้โดยการแก้ปัญหาค่าลักษณะเฉพาะ เราค้นหาค่าลักษณะเฉพาะและค่าลักษณะเฉพาะที่เกี่ยวข้องของความแปรปรวนร่วมโดยการแก้Σ = X X'
Σ Φ = Φ Λ
โดยที่เป็นเมทริกซ์แนวทแยงที่มีค่าลักษณะเฉพาะเป็นองค์ประกอบเส้นทแยงมุมΛ
เมทริกซ์จึง diagonalizes เมทริกซ์ความแปรปรวนของX} คอลัมน์ของเป็นลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วมΦXΦ
นอกจากนี้เรายังสามารถเขียนความแปรปรวนแบบทแยงมุมเป็น:
Φ'Σ ไว = Λ(1)
ดังนั้นในการลดความสัมพันธ์เวกเตอร์หนึ่งตัวเราจะทำ:xผม
x* * * *ผม= Φ'xผม(2)
องค์ประกอบเส้นทแยงมุม (ค่าลักษณะเฉพาะ) ในอาจจะเหมือนหรือต่างกัน ถ้าเราทำให้มันเหมือนกันทั้งหมดนี่เรียกว่าการฟอกสีข้อมูล เนื่องจากค่าลักษณะเฉพาะแต่ละค่าจะกำหนดความยาวของค่าลักษณะเฉพาะที่เกี่ยวข้องความแปรปรวนร่วมจะสอดคล้องกับวงรีเมื่อข้อมูลไม่ได้เป็นสีขาวและเป็นทรงกลม การฟอกสีฟันดำเนินการดังนี้:Λ
Λ- 1 / 2Λ Λ- 1 / 2= ฉัน
เท่ากับการแทนที่ในเราเขียน:( 1 )
Λ- 1 / 2Φ'Σ ไวΛ- 1 / 2= ฉัน
ดังนั้นเมื่อต้องการใช้การแปลงไวท์เทนนิ่งนี้เป็นเราเพียงแค่คูณมันด้วยเครื่องชั่งนี้การได้รับจุดข้อมูลสีขาวx † i :x* * * *ผมx†ผม
x†ผม= Λ- 1 / 2x* * * *ผม= Λ- 1 / 2Φ'xผม(3)
ตอนนี้ความแปรปรวนของไม่ได้เป็นเพียงเส้นทแยงมุม แต่ยังเครื่องแบบ (สีขาว) เนื่องจากความแปรปรวนของx † ฉัน , E ( x † ฉัน x † ฉัน ' ) =ฉันx†ผมx†ผมE ( x†ผมx†ผม') = I
Σ
และในที่สุดก็มี "gotcha" ทั่วไปที่ผู้คนควรระวัง คุณต้องระมัดระวังว่าคุณคำนวณปัจจัยการปรับสเกลบนข้อมูลการฝึกอบรมจากนั้นคุณใช้สมการ (2) และ (3) เพื่อนำปัจจัยการปรับขนาดเดียวกันไปใช้กับข้อมูลการทดสอบมิฉะนั้นคุณมีความเสี่ยงที่จะมีน้ำหนักเกิน ข้อมูลจากชุดทดสอบในกระบวนการฝึกอบรม)
ที่มา: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf