คำถามนี้ส่วนใหญ่เกี่ยวกับคำจำกัดความของ PCA / FA ดังนั้นความคิดเห็นอาจแตกต่างกัน ความเห็นของฉันคือ PCA + varimax ไม่ควรเรียกว่า PCA หรือ FA ค่อนข้างจะถูกเรียกอย่างชัดเจนว่าเช่น "varimax-rotated PCA"
ฉันควรเพิ่มว่านี่เป็นหัวข้อที่ค่อนข้างสับสน ในคำตอบนี้ฉันต้องการอธิบายว่าการหมุนคืออะไร สิ่งนี้จะต้องใช้คณิตศาสตร์ ผู้อ่านทั่วไปสามารถข้ามไปยังภาพประกอบได้โดยตรง จากนั้นเราสามารถพูดคุยได้ว่าการหมุน PCA + ควรหรือไม่ควรเรียกว่า "PCA"
หนึ่งการอ้างอิงคือหนังสือของ Jolliffe "การวิเคราะห์องค์ประกอบหลัก" ส่วนที่ 11.1 "การหมุนส่วนประกอบหลัก" แต่ฉันคิดว่ามันชัดเจนกว่า
ให้เป็นเมทริกซ์ข้อมูลคูณซึ่งเราถือว่าอยู่กึ่งกลาง จำนวน PCA ( ดูคำตอบของฉันที่นี่ ) เพื่อสลายตัวเอกพจน์มูลค่า:X มีมุมมองที่เทียบเท่า แต่สองมุมมองเกี่ยวกับการย่อยสลายนี้: มุมมอง "การฉายภาพ" ในรูปแบบ PCA และมุมมอง "ตัวแปรแฝง" แบบ FA เพิ่มเติม n × p X = U S V ⊤Xn×pX=USV⊤
จากมุมมองแบบ PCA เราพบกลุ่มของมุมฉาก (เหล่านี้คือ eigenvectors ของเมทริกซ์ความแปรปรวนร่วมหรือที่เรียกว่า "ทิศทางหลัก" หรือ "แกน") และ "ส่วนประกอบหลัก" ( เรียกอีกอย่างว่าองค์ประกอบหลัก "คะแนน") เป็นการคาดการณ์ข้อมูลในทิศทางเหล่านี้ ส่วนประกอบหลักไม่มีการเชื่อมโยงส่วนแรกมีความแปรปรวนมากที่สุด ฯลฯ เราสามารถเขียน:U S X = U S ⋅ V ⊤ = คะแนน⋅ เส้นทางหลักVUS
X=US⋅V⊤=Scores⋅Principal directions.
จากมุมมองของ FA-style เราพบความแปรปรวนของหน่วยที่ไม่เกี่ยวข้องซึ่งมี "ปัจจัยแฝง" ซึ่งทำให้เกิดตัวแปรที่สังเกตได้ผ่าน "การโหลด" แน่นอนเป็นส่วนประกอบหลักที่ได้มาตรฐาน (uncorrelated และมีความแปรปรวนของหน่วย) และถ้าเรากำหนดภาระเป็นหลังจากนั้น (โปรดทราบว่า ) มุมมองทั้งสองจะเทียบเท่ากัน โปรดสังเกตว่าการโหลดเป็นค่าเฉพาะของแต่ละค่าลักษณะเฉพาะ (เป็นค่าลักษณะเฉพาะของเมทริกซ์ความแปรปรวนร่วม)L=VS/ √U˜=n−1−−−−−√U X= √L=VS/n−1−−−−−√S ⊤=SS/ √
X=n−1−−−−−√U⋅(VS/n−1−−−−−√)⊤=U˜⋅L⊤=Standardized scores⋅Loadings.
S⊤=SS/n−1−−−−−√
(ฉันควรเพิ่มในวงเล็บที่PCA FA≠ ; FA มีจุดประสงค์อย่างชัดเจนในการค้นหาปัจจัยแฝงที่ถูกแมปเชิงเส้นตรงกับตัวแปรที่สังเกตผ่านการโหลดมันมีความยืดหยุ่นมากกว่า PCA และให้ผลการโหลดที่แตกต่างกัน "มุมมองลักษณะ FA บน PCA" และไม่ใช่ FA แม้ว่าบางคนคิดว่าเป็นหนึ่งในวิธีการ FA)
ทีนี้การหมุนจะทำอะไร? เช่นการหมุนมุมฉากเช่น varimax อันดับแรกพิจารณาเฉพาะองค์ประกอบเช่น:จากนั้นมันก็จะเป็นรูปสี่เหลี่ยมมุมฉากเมทริกซ์และปลั๊กเข้าสู่การสลายตัวนี้:ที่ โหลดที่หมุนได้รับโดยk<p
X≈UkSkV⊤k=U˜kL⊤k.
k×kTTT⊤=IX≈UkSkV⊤k=UkTT⊤SkV⊤k=U˜rotL⊤rot,
˜ U r o t = ˜ U k T T L r o tLrot=LkTและหมุนคะแนนมาตรฐานจะได้รับจากT (จุดประสงค์ของสิ่งนี้คือการหาเช่นนั้นใกล้จะกระจัดกระจายที่สุดเท่าที่จะทำได้เพื่ออำนวยความสะดวกในการตีความ)
U˜rot=U˜kTTLrot
โปรดทราบว่าสิ่งที่หมุนคือ: (1) คะแนนมาตรฐาน, (2) การโหลด แต่ไม่ใช่คะแนนดิบและไม่ใช่ทิศทางหลัก! ดังนั้นการหมุนจึงเกิดขึ้นในพื้นที่แฝงไม่ใช่ในพื้นที่ดั้งเดิม นี่เป็นสิ่งสำคัญอย่างยิ่ง
จากมุมมองสไตล์ FA ไม่มีอะไรเกิดขึ้นมากมาย (A) ปัจจัยแฝงยังคงไม่เกี่ยวข้องและเป็นมาตรฐาน (B) พวกเขายังคงถูกแมปกับตัวแปรที่สังเกตผ่านการโหลด (หมุน) (C) ปริมาณของความแปรปรวนจับโดยแต่ละองค์ประกอบ / ปัจจัยที่จะได้รับจากผลรวมของค่ากำลังสองของแรงคอลัมน์ที่สอดคล้องกันใน{} (D) ทางเรขาคณิตการโหลดยังคงครอบคลุมพื้นที่ย่อย -dimensional เดียวกันใน (พื้นที่ย่อยที่ถูกขยายโดย PCA แรกeigenvectors) (E) การประมาณและข้อผิดพลาดในการสร้างใหม่ไม่ได้เปลี่ยนแปลงเลย (F) เมทริกซ์ความแปรปรวนร่วมยังคงใกล้เคียงกัน: k R P k XLrotkRpkX
Σ≈LkL⊤k=LrotL⊤rot.
แต่มุมมองแบบ PCA นั้นถูกยุบลงจริง โหลดที่หมุนไม่สอดคล้องกับทิศทาง / แกนฉากในอีกต่อไปนั่นคือคอลัมน์ของไม่ใช่มุมฉาก! ยิ่งไปกว่านั้นถ้าคุณ [orthogonally] ฉายข้อมูลไปยังทิศทางที่กำหนดโดยการโหลดแบบหมุนคุณจะได้รับการประมาณการแบบสหสัมพันธ์ (!) และจะไม่สามารถกู้คืนคะแนนได้ [แทนการคำนวณคะแนนมาตรฐานหลังจากการหมุนใครจะต้องคูณเมทริกซ์ข้อมูลด้วยการหลอก - อินเวอร์สของโหลด} อีกวิธีหนึ่งสามารถหมุนคะแนนมาตรฐานดั้งเดิมด้วยเมทริกซ์การหมุน:RpLrotU˜rot=X(L+rot)⊤U˜rot=U˜T ] นอกจากนี้ส่วนประกอบที่หมุนแล้วจะไม่จับภาพความแปรปรวนจำนวนสูงสุดอย่างต่อเนื่อง แม้ว่าส่วนประกอบที่หมุนได้ทั้งหมดจะจับความแปรปรวนได้มากเท่ากับองค์ประกอบหลักดั้งเดิมทั้งหมด)kk
นี่คือภาพประกอบ ข้อมูลนั้นเป็นวงรี 2 มิติที่ทอดยาวไปตามแนวทแยงมุมหลัก ทิศทางหลักแรกคือเส้นทแยงมุมหลักส่วนทิศทางที่สองคือมุมฉาก เวกเตอร์การโหลด PCA (eigenvectors ปรับขนาดโดยค่าลักษณะเฉพาะ) จะแสดงเป็นสีแดง - ชี้ในทั้งสองทิศทางและยืดด้วยปัจจัยคงที่สำหรับการมองเห็น จากนั้นฉันใช้การหมุนมุมฉากโดยกับการโหลด ผลลัพธ์การโหลดเวกเตอร์แสดงเป็นสีม่วงแดง โปรดสังเกตว่าพวกเขาไม่ใช่ orthogonal (!)30∘
สัญชาตญาณแบบ FA ที่นี่มีดังต่อไปนี้ลองจินตนาการถึง "พื้นที่แฝง" ซึ่งมีจุดที่เติมวงกลมเล็ก ๆ การกระจายจุดเหล่านี้จะขยายไปตามการโหลด PCA (สีแดง) เพื่อกลายเป็นวงรีข้อมูลที่เราเห็นในรูปนี้ อย่างไรก็ตามการกระจายเดียวกันของจุดที่สามารถหมุนแล้วเหยียดไปตามแรงหมุน PCA (สีม่วง) จะกลายเป็นวงรีข้อมูลเดียวกัน
[ต้องการจริงเห็นว่าการหมุนมุมฉากของแรงคือการหมุนหนึ่งต้องดูที่ biplot PCA; มีเวกเตอร์ / รังสีที่สอดคล้องกับตัวแปรเดิมก็จะหมุน.]
ให้เราสรุป หลังจากการหมุนมุมฉาก (เช่น varimax) แกน "หมุน - ตัวหลัก" ไม่ได้เป็นมุมฉากและการประมาณมุมฉากกับพวกมันไม่สมเหตุสมผล ดังนั้นเราควรวางมุมมอง / แกนฉายทั้งหมดนี้ มันจะแปลกที่จะเรียกมันว่า PCA (ซึ่งเป็นเรื่องเกี่ยวกับการคาดการณ์ที่มีความแปรปรวนสูงสุด ฯลฯ )
จากมุมมองสไตล์ FA เราเพียงแค่หมุนปัจจัยแฝง (ที่เป็นมาตรฐานและไม่เกี่ยวข้อง) ซึ่งเป็นการดำเนินการที่ถูกต้อง ไม่มี "การคาดการณ์" ใน FA; แต่ปัจจัยแฝงจะสร้างตัวแปรที่สังเกตได้ผ่านการโหลด ตรรกะนี้ยังคงอยู่ อย่างไรก็ตามเราเริ่มต้นด้วยองค์ประกอบหลักซึ่งไม่ได้เป็นปัจจัยจริง (เนื่องจาก PCA ไม่เหมือนกับ FA) ดังนั้นมันก็แปลกที่จะเรียกมันว่า FA เช่นกัน
แทนที่จะอภิปรายว่าควร "เรียกว่า" ควรเรียกว่า PCA หรือ FA ฉันควรจะพิถีพิถันในการระบุขั้นตอนการใช้งานที่แน่นอน: "PCA ตามด้วยการหมุน varimax"
Postscriptum มันเป็นไปได้ที่จะพิจารณาขั้นตอนการหมุนทางเลือกที่จะถูกแทรกระหว่างและV สิ่งนี้จะหมุนเวียนคะแนนดิบและ eigenvectors (แทนคะแนนมาตรฐานและการโหลด) ปัญหาที่ใหญ่ที่สุดของวิธีนี้คือหลังจากการ "หมุน" คะแนนจะไม่ถูกยกเลิกการเชื่อมโยงอีกต่อไปซึ่งเป็นอันตรายถึงชีวิตสำหรับ PCA เราสามารถทำได้ แต่ไม่ใช่วิธีการหมุนที่มักจะถูกเข้าใจและนำไปใช้TT⊤USV⊤