จะทำให้ข้อมูลขาวขึ้นโดยใช้การวิเคราะห์องค์ประกอบหลักได้อย่างไร


18

ฉันต้องการแปลงข้อมูลของฉันXเพื่อให้ความแปรปรวนเป็นหนึ่งและความแปรปรวนร่วมจะเป็นศูนย์ (เช่นฉันต้องการทำให้ข้อมูลขาวขึ้น) นอกจากนี้ค่าเฉลี่ยควรเป็นศูนย์

ฉันรู้ว่าฉันจะไปถึงที่นั่นด้วยการทำมาตรฐาน Z และการแปลง PCA แต่ฉันควรทำตามลำดับใด

ฉันควรเพิ่มว่าประกอบด้วยการเปลี่ยนแปลงไวท์เทนนิ่งควรจะมีรูปแบบ{ข}xWx+b

มีวิธีการคล้ายกับ PCA ซึ่งทำการเปลี่ยนแปลงทั้งสองอย่างนี้และให้สูตรของแบบฟอร์มด้านบนหรือไม่


(ความคิดเห็นแรกของฉันขึ้นอยู่กับการอ่านคำถามของคุณผิด) PCA ช่วยให้คุณไม่มีศูนย์ร่วม; คุณสามารถสร้างมาตรฐานพีซีหลังจากนั้นถ้าคุณต้องการ ฟังดูแปลก ๆ ที่ต้องทำ แต่คุณสามารถทำได้
Nick Cox

@NickCox บางทีมันอาจจะแปลกเพราะข้อมูลที่แปลงแล้วเป็นทรงกลมซึ่งดูเหมือนจะไม่เป็นประโยชน์ อย่างไรก็ตามมันคือการเปลี่ยนแปลงที่ฉันต้องรู้ไม่ใช่ผลลัพธ์สุดท้าย ถึงกระนั้นฉันก็ไม่รู้ว่าการเปลี่ยนแปลงจะเป็นอย่างไร ฉันยังคงอ่าน PCA อยู่
Angelorf

คำตอบ:


31

ครั้งแรกที่คุณจะได้รับเป็นศูนย์เฉลี่ยโดยการหักค่าเฉลี่ย{x}μ=1Nx

ประการที่สองคุณจะได้รับ covariances เป็นศูนย์โดยทำ PCA หากเป็นเมทริกซ์ความแปรปรวนของข้อมูลของคุณแล้ว PCA จำนวนเงินที่จะดำเนินการ eigendecompositionที่คือ เมทริกซ์การหมุนแบบมุมฉากประกอบด้วย eigenvector ของและเป็นเมทริกซ์ทแยงมุมที่มีค่าลักษณะเฉพาะบนเส้นทแยงมุม Matrixให้การหมุนที่จำเป็นในการยกเลิกการเชื่อมโยงข้อมูล (เช่นจับคู่คุณลักษณะดั้งเดิมกับส่วนประกอบหลัก)ΣΣ=UΛUUΣΛU

ประการที่สามหลังจากการหมุนแต่ละองค์ประกอบจะมีความแปรปรวนที่กำหนดโดยค่าลักษณะเฉพาะที่สอดคล้องกัน ดังนั้นเพื่อให้ความแปรปรวนเท่ากับคุณจะต้องหารด้วยรากที่สองของ\1Λ

ร่วมกันทั้งหมด, การเปลี่ยนแปลงผิวขาวใสเป็นMU) คุณสามารถเปิดวงเล็บเพื่อรับแบบฟอร์มที่คุณต้องการxΛ1/2U(xμ)


ปรับปรุง ดูรายละเอียดเพิ่มเติมได้ในหัวข้อต่อไปนี้: ความแตกต่างระหว่าง ZCA กับ PCA คืออะไร?


2
ฉันคิดว่าคุณต้องหารด้วยสแควร์รูทของค่าลักษณะเฉพาะเนื่องจากเป็นเรื่องของการปรับด้วย SD ไม่ใช่ความแปรปรวน
Nick Cox

@NickCox: ใช่แน่นอนคุณพูดถูก ฉันแก้ไขคำตอบของฉัน ขอขอบคุณ!
อะมีบาพูดว่า Reinstate Monica

1
ฉันตรวจสอบสูตรเชิงประจักษ์ ขอบคุณทีช่วยฉัน!
Angelorf
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.