การวิเคราะห์องค์ประกอบหลักสามารถใช้การสลายตัวของเมทริกซ์ แต่นั่นเป็นเพียงเครื่องมือในการเดินทาง
คุณจะค้นหาส่วนประกอบหลักโดยไม่ใช้พีชคณิตเมทริกซ์ได้อย่างไร
ฟังก์ชั่นวัตถุประสงค์ (เป้าหมาย) คืออะไรและมีข้อ จำกัด อะไร?
การวิเคราะห์องค์ประกอบหลักสามารถใช้การสลายตัวของเมทริกซ์ แต่นั่นเป็นเพียงเครื่องมือในการเดินทาง
คุณจะค้นหาส่วนประกอบหลักโดยไม่ใช้พีชคณิตเมทริกซ์ได้อย่างไร
ฟังก์ชั่นวัตถุประสงค์ (เป้าหมาย) คืออะไรและมีข้อ จำกัด อะไร?
คำตอบ:
โดยไม่ต้องพยายามที่จะให้ไพรเมอร์เต็มรูปแบบใน PCA, จากมุมมองการเพิ่มประสิทธิภาพหลักฟังก์ชันวัตถุประสงค์คือความฉลาดทางเรย์ลี เมทริกซ์ที่ตัวเลขในความฉลาดคือ (หลายตัว) เมทริกซ์ความแปรปรวนตัวอย่าง ที่แต่ละเป็นเวกเตอร์ของคุณสมบัติและเป็นเมทริกซ์ดังกล่าวที่แถว TH เป็น T
PCA พยายามที่จะแก้ปัญหาการเพิ่มประสิทธิภาพลำดับ ลำดับแรกคือปัญหาที่ไม่มีข้อ จำกัด
ตั้งแต่ปัญหาที่ไม่มีข้อ จำกัด ข้างต้นจะเทียบเท่ากับปัญหาที่ จำกัด
นี่คือที่ที่พีชคณิตเมทริกซ์เข้ามาเนื่องจากเป็นเมทริกซ์ semidefinite เชิงบวกแบบสมมาตร (จากการก่อสร้าง!) มันมีการสลายตัวแบบค่าเฉพาะของรูปแบบ ที่เป็น เมทริกซ์มุมฉาก (ดังนั้น ) และเป็นเส้นทแยงมุมเมทริกซ์ที่มีค่าลบรายการดังกล่าวว่า0
ดังนั้น 2 เนื่องจากมีข้อ จำกัด ในปัญหาที่จะมีบรรทัดฐานหนึ่งดังนั้นคือตั้งแต่ , โดยอาศัยอำนาจเป็นมุมฉาก
แต่ถ้าเราต้องการเพิ่มปริมาณภายใต้ข้อ จำกัด ที่สิ่งที่ดีที่สุดที่เราทำได้คือ ชุด , ที่อยู่,และสำหรับ1
ตอนนี้ให้สำรองข้อมูลสอดคล้องกันซึ่งเป็นสิ่งที่เราต้องการตั้งแต่แรกเราได้รับ โดยที่หมายถึงคอลัมน์แรกของคือวิคเตอร์ที่สอดคล้องกับค่าเฉพาะที่ใหญ่ที่สุดของ S ค่าของฟังก์ชั่นโดยมีวัตถุประสงค์แล้วยังมองเห็นได้ง่ายที่จะเป็น\
ส่วนประกอบเวกเตอร์หลักที่เหลือนั้นจะถูกค้นพบโดยการแก้ลำดับ (จัดทำดัชนีโดย ) ของปัญหาการหาค่าเหมาะ ดังนั้นปัญหาที่เกิดขึ้นเหมือนกันยกเว้นว่าเราเพิ่มข้อ จำกัด เพิ่มเติมว่าการแก้ปัญหาจะต้องตั้งฉากกับทั้งหมดของการแก้ปัญหาก่อนหน้านี้ในลำดับ มันไม่ได้เป็นเรื่องยากที่จะขยายการโต้แย้งดังกล่าวข้างต้น inductively เพื่อแสดงให้เห็นว่าวิธีการแก้ปัญหาของปัญหา TH เป็นแท้จริงที่ TH วิคเตอร์ของ S
วิธีการแก้ปัญหา PCA ก็มักจะแสดงในแง่ของการสลายตัวมูลค่าเอกพจน์ของ{X} เพื่อดูว่าทำไมให้ T จากนั้นและ (พูดอย่างเคร่งครัดถึงสัญญาณพลิก) และn
พบส่วนประกอบหลักโดยการฉายลงบนเวกเตอร์องค์ประกอบหลัก จากการกำหนดสูตร SVD เป็นเรื่องง่ายที่จะเห็นว่า
ความเรียบง่ายของการเป็นตัวแทนของทั้งเวกเตอร์องค์ประกอบหลักและส่วนประกอบหลักนั้นในแง่ของ SVD ของเมทริกซ์ของคุณสมบัติเป็นเหตุผลหนึ่งที่คุณสมบัติ SVD นั้นเด่นชัดในการรักษา PCA บางอย่าง
วิธีแก้ปัญหาที่นำเสนอโดยคาร์ดินัลมุ่งเน้นไปที่เมทริกซ์ความแปรปรวนร่วมตัวอย่าง จุดเริ่มต้นอีกจุดหนึ่งคือข้อผิดพลาดในการสร้างใหม่ของข้อมูลโดยไฮเพอร์คิวชัน q -dimensional ถ้าจุดข้อมูลp -dimensional เป็นจุดประสงค์คือการแก้ไข
สำหรับเมทริกซ์ด้วยคอลัมน์ orthonormal และ Q สิ่งนี้ให้อันดับq- การก่อสร้างที่ดีที่สุดที่วัดโดยค่าปริภูมิแบบยุคลิดและคอลัมน์ของ solution เป็นเวกเตอร์องค์ประกอบหลักตัวแรกของคิว
สำหรับที่ทางออกสำหรับและ (นี่คือการถดถอย) คือ
เพื่อความสะดวกในการคำนวณให้สมมุติว่าอยู่กึ่งกลางในการคำนวณต่อไปนี้ เราต้องลดให้น้อยที่สุด
มากกว่าพร้อมคอลัมน์ orthonormal โปรดทราบว่าเป็นเส้นโครงบนพื้นที่คอลัมน์q -dimensional ดังนั้นปัญหาจึงเทียบเท่ากับการลด
กว่าอันดับQประมาณการPนั่นคือเราจำเป็นต้องเพิ่ม
เหนืออันดับqประมาณการโดยที่เป็นเมทริกซ์ความแปรปรวนร่วมตัวอย่าง ตอนนี้
ข้อผิดพลาดในการสร้างใหม่แสดงให้เห็นจำนวนภาพรวมที่มีประโยชน์เช่นส่วนประกอบหลักที่กระจัดกระจายหรือการสร้างใหม่โดย manifolds ที่มีมิติต่ำแทนที่จะเป็นไฮเปอร์เพลน สำหรับรายละเอียดโปรดดูมาตรา 14.5 ในองค์ประกอบของการเรียนรู้ทางสถิติ
ดู NIPALS ( wiki ) สำหรับอัลกอริทึมเดียวซึ่งไม่ได้ใช้การสลายตัวของเมทริกซ์อย่างชัดเจน ฉันคิดว่านั่นคือสิ่งที่คุณหมายถึงเมื่อคุณบอกว่าคุณต้องการหลีกเลี่ยงพีชคณิตเมทริกซ์เนื่องจากคุณไม่สามารถหลีกเลี่ยงพีชคณิตเมทริกซ์ได้ที่นี่ :)