อะไรคือองค์ประกอบหลัก“ ที่หมุน” และ“ ไม่ได้รับการป้องกัน” เนื่องจาก PCA จะหมุนแกนพิกัดเสมอ


13

เท่าที่ฉันเข้าใจส่วนประกอบหลักจะได้รับโดยการหมุนแกนพิกัดเพื่อจัดเรียงพวกเขากับทิศทางของความแปรปรวนสูงสุด

อย่างไรก็ตามฉันยังคงอ่านเกี่ยวกับ "ส่วนประกอบหลักที่ไม่ได้ทำการหมุน" และซอฟต์แวร์สถิติของฉัน (SAS) ให้ส่วนประกอบหลักที่หมุนรอบตัวได้แบบแปรปรวนตลอดจนส่วนประกอบที่ไม่ได้หมุน ที่นี่ฉันสับสน: เมื่อเราคำนวณส่วนประกอบหลักแกนจะหมุนไปแล้ว เหตุใดจึงต้องมีการหมุนอีกครั้ง และ "องค์ประกอบหลักที่ยังไม่ได้ประมวลผล" หมายความว่าอย่างไร


1
คำถามเกี่ยวกับการทำงานของซอฟต์แวร์นอกหัวข้อที่นี่ แต่คุณอาจมีคำถามทางสถิติที่ฝังอยู่ที่นี่ คุณอาจต้องการแก้ไขคำถามของคุณเพื่อชี้แจงปัญหาทางสถิติพื้นฐาน คุณอาจพบว่าเมื่อคุณเข้าใจแนวคิดทางสถิติที่เกี่ยวข้ององค์ประกอบเฉพาะของซอฟต์แวร์นั้นชัดเจนในตัวเองหรืออย่างน้อยก็ง่ายที่จะได้รับจากเอกสาร
gung - Reinstate Monica

1
@gung - คำถามของฉันไม่ได้เกี่ยวกับซอฟต์แวร์ อาจเป็นเพราะฉันวางผิด สิ่งที่ฉันอยากรู้ก็คือตามความเข้าใจของฉันเราได้รับส่วนประกอบหลักเฉพาะเมื่อเราหมุนแกนในแนวความแปรปรวนสูงสุด แล้วอะไรคือองค์ประกอบหลักที่ยังไม่ได้ทำการศึกษาคำที่ฉันพบในหน้าต่างๆที่อธิบายเกี่ยวกับ PCA กรุณาแจ้งให้เราทราบหากคำถามของฉันยังไม่ชัดเจน
Srewashi Lahiri

แน่นอนมันมีลักษณะเหมือนมันเป็นเรื่องของเอสเอ หากไม่ใช่ฉันจะแก้ไข Q ของคุณเพื่อลบการอ้างอิงไปยัง SAS & อธิบายคำถามของคุณอีกครั้งในข้อกำหนดที่เป็นกลางโดยซอฟต์แวร์ คุณอาจสนใจอ่านหัวข้อนี้
gung - Reinstate Monica

ฉันพูดถึง SAS เพราะฉันทำการวิเคราะห์ในซอฟต์แวร์นั้น แม้ว่าคุณจะลดคำ แต่คุณสามารถให้คำอธิบายกับคำถามที่แก้ไขของฉันได้ นอกจากนี้ฉันก็ผ่านด้าย กรุณาแก้ไขให้ฉันถ้าฉันผิด เมื่อเราคำนวณส่วนประกอบหลักหมายความว่าแกนหมุนไปแล้ว ดังนั้นไม่จำเป็นต้องใช้สัญลักษณ์วาริแม็กซ์อีก เป็นอย่างนั้นเหรอ? ฉันสับสนจริงๆเกี่ยวกับส่วนนี้ ขอบคุณมากล่วงหน้า
Srewashi Lahiri

2
Srewashi ฉันมีอิสระที่จะเขียนคำถามของคุณอย่างมีนัยสำคัญโดยยึดตามคำชี้แจงของคุณในความคิดเห็น ฉันคิดว่ามันเป็นคำถามที่ดี +1 โปรดตรวจสอบว่าการแก้ไขของฉันสะท้อนถึงความตั้งใจของคุณ! คุณสามารถแก้ไขเพิ่มเติมได้ตลอดเวลา Cc ถึง @gung
อะมีบาพูดว่า Reinstate Monica

คำตอบ:


15

นี่จะเป็นคำตอบที่ไม่ใช่เทคนิค

คุณพูดถูก: PCA เป็นแกนหมุนของแกนพิกัดซึ่งเลือกได้ว่าแกนที่ประสบความสำเร็จแต่ละตัวจะจับความแปรปรวนมากที่สุด

ในบางสาขา (เช่นจิตวิทยา) ผู้คนชอบใช้ PCA เพื่อตีความแกนที่เกิดขึ้น นั่นคือพวกเขาต้องการที่จะบอกว่าแกนหลัก # 1 (ซึ่งเป็นการรวมกันเชิงเส้นของตัวแปรดั้งเดิม) มีความหมายเฉพาะ ในการเดาความหมายนี้พวกเขาจะดูน้ำหนักในชุดค่าผสมเชิงเส้น อย่างไรก็ตามน้ำหนักเหล่านี้มักจะยุ่งและไม่มีความหมายที่ชัดเจนสามารถมองเห็นได้

ในกรณีเหล่านี้บางครั้งผู้คนเลือกที่จะแก้ปัญหาด้วยวานิลลา PCA พวกเขาใช้แกนหลักจำนวนหนึ่ง (ซึ่งถือว่า "สำคัญ" โดยเกณฑ์บางอย่าง) และเพิ่มการหมุนพวกเขาพยายามที่จะบรรลุ "โครงสร้างที่เรียบง่าย" ซึ่งก็คือการรวมเชิงเส้นที่จะตีความได้ง่ายขึ้น มีอัลกอริทึมเฉพาะที่มองหาโครงสร้างที่ง่ายที่สุดที่เป็นไปได้ หนึ่งในนั้นเรียกว่า varimax หลังจากการหมุน varimax ส่วนประกอบที่ต่อเนื่องจะไม่จับความแปรปรวนมากเท่าที่จะเป็นไปได้อีกต่อไป! คุณสมบัติของ PCA นี้พังโดยการหมุน varimax เพิ่มเติม (หรืออื่น ๆ )

ดังนั้นก่อนที่จะใช้การหมุน varimax คุณจะต้องมีองค์ประกอบหลัก และหลังจากนั้นคุณจะได้รับส่วนประกอบหลัก "หมุน" ในคำอื่น ๆ คำศัพท์นี้หมายถึงการประมวลผลภายหลังของผลลัพธ์ PCA และไม่ใช่การหมุน PCA เอง


ทั้งหมดนี้ค่อนข้างซับซ้อนด้วยความจริงที่ว่าสิ่งที่ได้รับการหมุนคือการโหลดและไม่ใช่แกนหลักเช่นนี้ อย่างไรก็ตามสำหรับรายละเอียดทางคณิตศาสตร์ฉันแนะนำคุณ (และผู้อ่านที่สนใจ) เพื่อตอบยาวของฉันที่นี่: PCA ตามมาด้วยการหมุน (เช่น varimax) ยังคง PCA หรือไม่


ฉันยังไม่ได้คำอธิบายที่ดีกว่าและชัดเจนกว่านี้ ฉันยังผ่านลิงค์อื่น ๆ ที่คุณให้ไว้ แต่ฉันยังไม่สามารถถอดรหัสได้ทั้งหมด ถ้าฉันเข้าใจถูกต้องส่วนประกอบหลักที่ไม่ได้ลงทะเบียนแล้วจะเป็นฉากฉากและไม่มีส่วนเกี่ยวข้อง ที่นี่ฉันมีความสับสนเล็กน้อย - เนื่องจากพีซีสอดคล้องกับความแปรปรวนสูงสุดต่อเนื่องดังนั้นจึงจำเป็นว่าหลังจากพบพีซีเครื่องแรกบรรทัดแปรปรวนสูงสุดที่สอง (พีซีเครื่องที่สอง) จะอยู่ที่ 90 องศา (orthogonal) กับเครื่องแรกและอื่น ๆ ?
Srewashi Lahiri

ถูกต้องแล้ว: ส่วนประกอบหลัก "ที่ไม่ได้ทำการ" จะไม่มีการเชื่อมโยงกันและแกนหลักที่ "ไม่ได้ทำการ" นั้นเป็นแบบมุมฉาก และใช่มันเป็นสิ่งจำเป็นที่แกนหลักที่ต่อเนื่องกันเป็นส่วนประกอบมุมฉากและองค์ประกอบหลักไม่เกี่ยวข้องกับแกนก่อนหน้า (สามารถพิสูจน์ได้ในเชิงคณิตศาสตร์) อย่างไรก็ตามถ้าคุณคิดว่าคำตอบ (หรืออื่น ๆ ) นี้ช่วยคุณได้คุณสามารถ "ยอมรับ" โดยคลิกที่เครื่องหมายสีเขียวทางด้านซ้าย เมื่อคุณมีชื่อเสียงครบ 15 ข้อแล้วคุณจะสามารถโหวตคำตอบที่คุณเห็นว่ามีประโยชน์ได้ (ฉันคิดว่าคุณไม่สามารถตอบคำตอบใด ๆ ได้ในขณะนี้)
อะมีบาพูดว่า Reinstate Monica

+1 what gets rotated are loadings and not principal axes as suchฉันจะเพิ่มว่านี่เป็นความคิดทางเทคนิค ตามหลักการแล้วการหมุนทั้งสองแบบนี้เป็นที่ยอมรับกัน ใน PCA เราหมุนเพื่อค้นหาพื้นฐานมุมฉากที่เฉพาะเจาะจง (อันที่มีค่าลักษณะเฉพาะของหินที่ชันที่สุด) ใน varimax เราหมุนเพื่อค้นหาพื้นฐาน orthogonal อื่นที่เฉพาะเจาะจง เราสามารถทำพื้นฐานมุมฉากชนิดใดก็ได้
ttnphns

หากเป็นไปได้คุณสามารถอธิบายได้ในแง่คนธรรมดาหมายความว่าพีซีที่ยังไม่ได้จดทะเบียน
sai_636

@ sai_636 สำหรับแง่ของคนธรรมดาโปรดดูstats.stackexchange.com/questions/2691
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.