FA, PCA และ ICA ต่างก็ 'เกี่ยวข้อง' ทั้งหมดเท่าที่พวกเขาทั้งสามแสวงหาเวกเตอร์พื้นฐานที่ข้อมูลถูกคาดการณ์ไว้เช่นที่คุณเพิ่มเกณฑ์การแทรกสูงสุดที่นี่ คิดว่าเวกเตอร์พื้นฐานเป็นเพียงการรวมชุดเชิงเส้นเข้าด้วยกัน
ยกตัวอย่างเช่นช่วยบอกข้อมูลของเมทริกซ์เป็น xเมทริกซ์, ที่อยู่, คุณมีสองตัวแปรสุ่มและข้อสังเกตของพวกเขาในแต่ละ แล้วช่วยบอกคุณพบเวกเตอร์พื้นฐานของ{bmatrix} เมื่อคุณแยกสัญญาณ (ตัวแรก) (เรียกมันว่า vector ) มันจะทำดังนี้:Z2NNw=[0.1−4]y
y=wTZ
นี่หมายถึง "คูณ 0.1 ด้วยแถวแรกของข้อมูลของคุณและลบ 4 เท่าของแถวที่สองของข้อมูล" จากนั้นนี่จะให้ซึ่งแน่นอนว่าเป็นเวกเตอร์ขนาด xที่มีคุณสมบัติที่คุณเพิ่มการแทรกเกณฑ์ที่นี่ให้มากที่สุดy1N
ดังนั้นเกณฑ์เหล่านั้นคืออะไร?
เกณฑ์การสั่งซื้อครั้งที่สอง:
ใน PCA คุณกำลังค้นหาเวกเตอร์พื้นฐานที่ 'อธิบาย' ความแปรปรวนของข้อมูลได้ดีที่สุด เวกเตอร์พื้นฐานอันดับแรก (คืออันดับสูงสุด) จะเป็นอันที่เหมาะกับความแปรปรวนทั้งหมดจากข้อมูลของคุณ คนที่สองก็มีเกณฑ์นี้ แต่จะต้องตั้งฉากกับคนแรกและต่อ ๆ ไปเรื่อย ๆ (กลายเป็นเวกเตอร์พื้นฐานเหล่านั้นสำหรับ PCA ไม่ใช่เรื่องอื่นนอกจาก eigenvectors เมทริกซ์ความแปรปรวนร่วมของข้อมูลของคุณ)
ใน FA นั้นมีความแตกต่างระหว่างมันกับ PCA เนื่องจาก FA นั้นเป็นแบบกำเนิดในขณะที่ PCA ไม่ใช่ ฉันเห็นว่า FA ถูกอธิบายว่า 'PCA พร้อมเสียง' โดยที่ 'เสียง' เรียกว่า 'ปัจจัยเฉพาะ' สิ่งเดียวกันทั้งหมดสรุปโดยรวมคือ PCA และ FA ขึ้นอยู่กับสถิติอันดับสอง (ความแปรปรวนร่วม) และไม่มีอะไรข้างต้น
เกณฑ์การสั่งซื้อที่สูงขึ้น:
ใน ICA คุณจะพบเวกเตอร์พื้นฐานอีกครั้ง แต่คราวนี้คุณต้องการเวกเตอร์พื้นฐานที่ให้ผลลัพธ์เช่นว่าเวกเตอร์ที่ได้นี้เป็นหนึ่งในองค์ประกอบอิสระของข้อมูลต้นฉบับ คุณสามารถทำได้โดยการเพิ่มค่าสัมบูรณ์ของ kurtosis ปกติ - สถิติลำดับที่ 4 นั่นคือคุณฉายข้อมูลของคุณบนเวคเตอร์พื้นฐานและวัดความโด่งของผลลัพธ์ คุณเปลี่ยนเวคเตอร์พื้นฐานของคุณเพียงเล็กน้อย (โดยปกติจะผ่านการไล่ระดับสีแบบลาดชัน) และจากนั้นวัดความโด่งอีกครั้งในที่สุดคุณจะเกิดขึ้นกับเวกเตอร์พื้นฐานที่ให้ผลลัพธ์ที่มีความเป็นไปได้สูงสุดและนี่คืออิสระของคุณ ส่วนประกอบ
แผนภาพด้านบนด้านบนสามารถช่วยให้คุณเห็นภาพได้ คุณสามารถเห็นได้อย่างชัดเจนว่าเวกเตอร์ ICA นั้นสอดคล้องกับแกนของข้อมูลอย่างไร (เป็นอิสระจากกัน) ในขณะที่เวกเตอร์ PCA พยายามค้นหาเส้นทางที่ความแปรปรวนขยายใหญ่สุด (ค่อนข้างเหมือนผลลัพธ์)
ถ้าในแผนภาพด้านบนเวกเตอร์ PCA ดูเหมือนว่าพวกมันเกือบจะตรงกับเวกเตอร์ ICA นั่นเป็นเรื่องบังเอิญ นี่เป็นอีกตัวอย่างหนึ่งของข้อมูลที่แตกต่างกันและการผสมเมทริกซ์ที่แตกต่างกันมาก ;-)