ได้รับ PCA (หรือ SVD) ประมาณของเมทริกซ์กับเมทริกซ์Xเรารู้ว่าXที่ดีที่สุดคือประมาณต่ำยศX
นี่คือตามที่เหนี่ยวนำให้เกิดบรรทัดฐาน (เช่นที่ใหญ่ที่สุดบรรทัดฐาน eigenvalue) หรือตามที่ Frobenius บรรทัดฐาน?
ได้รับ PCA (หรือ SVD) ประมาณของเมทริกซ์กับเมทริกซ์Xเรารู้ว่าXที่ดีที่สุดคือประมาณต่ำยศX
นี่คือตามที่เหนี่ยวนำให้เกิดบรรทัดฐาน (เช่นที่ใหญ่ที่สุดบรรทัดฐาน eigenvalue) หรือตามที่ Frobenius บรรทัดฐาน?
คำตอบ:
‖X‖F=√
PCA จะได้รับจากการสลายตัวของค่าเอกฐานเดียวกันเมื่อข้อมูลอยู่กึ่งกลาง เป็นส่วนประกอบหลักเป็นแกนหลักเช่น eigenvectors ของเมทริกซ์ความแปรปรวนและการฟื้นฟูของมีเพียงองค์ประกอบหลักที่สอดคล้องกับค่าเอกพจน์ที่ใหญ่ที่สุดจะได้รับโดยV_k
Eckart หนุ่มทฤษฎีบทบอกว่าเป็นเมทริกซ์ที่ลดบรรทัดฐานของข้อผิดพลาดการฟื้นฟูในทุกเมทริกซ์ยศkสิ่งนี้เป็นจริงสำหรับทั้ง Frobenius norm และ operator -norm ตามที่ระบุไว้โดย @ cardinal ในความคิดเห็นมันได้รับการพิสูจน์ครั้งแรกโดย Schmidt (จากชื่อเสียง Gram-Schmidt) ในปี 1907 สำหรับคดี Frobenius ต่อมาถูกค้นพบโดย Eckart และ Young ในปี 1936 และตอนนี้ส่วนใหญ่เกี่ยวข้องกับชื่อของพวกเขา มีร์คทั่วไปทฤษฎีบทในปี 1958 กับบรรทัดฐานทั้งหมดที่ไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงแบบรวมและรวมถึงผู้ประกอบการ 2-norm ‖ X - A ‖ A k 2
ทฤษฎีบทนี้บางครั้งเรียกว่าทฤษฎีบท Eckart-Young-Mirsky Stewart (1993) เรียกมันว่าทฤษฎีบทการประมาณชมิดท์ ฉันเคยเห็นมันเรียกว่าทฤษฎีบทชมิดท์ - อีคาร์ท - ยัง - เมียร์สกี้
Let จะเต็มอันดับn ในฐานะที่เป็นเป็นอันดับkพื้นที่ null ที่มีn - kมิติ พื้นที่ทอดโดยk + 1เวกเตอร์เอกพจน์ขวาของXที่สอดคล้องกับค่าเอกพจน์ที่ใหญ่ที่สุดมีk + 1มิติ ดังนั้นช่องว่างทั้งสองนี้จะต้องตัดกัน ให้wเป็นหน่วยเวกเตอร์จากจุดตัด จากนั้นเราก็จะได้รับ: ‖ X - ‖ 2 2 ≥ ‖ ( X - ) W ‖ 2QED
เราต้องการที่จะหาเมทริกซ์ยศkที่ช่วยลด‖ X - ‖ 2 F เราสามารถแยกA = B W ⊤โดยที่Wมีคอลัมน์k orthonormal ลด‖ X - B W ⊤ ‖ 2สำหรับการแก้ไขWเป็นปัญหากับการแก้ปัญหาการถดถอยB = X W เสียบเข้าไปเราจะเห็นว่าตอนนี้เราต้องลด‖ X - X W W ⊤ที่ Σเป็นเมทริกซ์ความแปรปรวนของ Xคือ Σ = X ⊤ X / ( n - 1 ) ซึ่งหมายความว่าข้อผิดพลาดการฟื้นฟูจะลดลงโดยการเป็นคอลัมน์ของ Wบาง k orthonormal เวกเตอร์เพิ่มความแปรปรวนรวมของการฉาย
เป็นที่ทราบกันดีว่าสิ่งเหล่านี้เป็น eigenvector แรกของเมทริกซ์ความแปรปรวนร่วม แน่นอนถ้าX = U S V ⊤แล้วΣ = V S 2 V ⊤ / ( n - 1 ) = V Λ V ⊤ เขียนR = V ⊤ Wซึ่งยังมีคอลัมน์ orthonormal เราได้รับเสื้อR ( W ⊤ Σ W ) = T R ( R ⊤ Λ Rสูงสุดทำได้เมื่อ W = V k ทฤษฎีบทจะตามมาทันที
ดูสามหัวข้อที่เกี่ยวข้องต่อไปนี้:
หลักฐานนี้ฉันพบบางแห่งออนไลน์ แต่มันผิด (มีช่องว่าง) ตามที่อธิบายโดย @ cardinal ในความคิดเห็น