บรรทัดฐานใดของข้อผิดพลาดในการสร้างใหม่จะถูกย่อให้เล็กสุดโดยเมทริกซ์การประมาณอันดับต่ำที่ได้จาก PCA


26

ได้รับ PCA (หรือ SVD) ประมาณของเมทริกซ์Xกับเมทริกซ์Xเรารู้ว่าXที่ดีที่สุดคือประมาณต่ำยศXX^X^X

นี่คือตามที่เหนี่ยวนำให้เกิด2บรรทัดฐาน (เช่นที่ใหญ่ที่สุดบรรทัดฐาน eigenvalue) หรือตามที่ Frobenius Fบรรทัดฐาน?

คำตอบ:


30

คำตอบเดียว: ทั้งสอง


X2XF=

X2=supXv2v2=max(si)
sฉันXSX=USV
XF=ijXij2=tr(XX)=si2,
siXSX=USV

PCA จะได้รับจากการสลายตัวของค่าเอกฐานเดียวกันเมื่อข้อมูลอยู่กึ่งกลาง เป็นส่วนประกอบหลักเป็นแกนหลักเช่น eigenvectors ของเมทริกซ์ความแปรปรวนและการฟื้นฟูของมีเพียงองค์ประกอบหลักที่สอดคล้องกับค่าเอกพจน์ที่ใหญ่ที่สุดจะได้รับโดยV_kUSVXkkXk=UkSkVk

Eckart หนุ่มทฤษฎีบทบอกว่าเป็นเมทริกซ์ที่ลดบรรทัดฐานของข้อผิดพลาดการฟื้นฟูในทุกเมทริกซ์ยศkสิ่งนี้เป็นจริงสำหรับทั้ง Frobenius norm และ operator -norm ตามที่ระบุไว้โดย @ cardinal ในความคิดเห็นมันได้รับการพิสูจน์ครั้งแรกโดย Schmidt (จากชื่อเสียง Gram-Schmidt) ในปี 1907 สำหรับคดี Frobenius ต่อมาถูกค้นพบโดย Eckart และ Young ในปี 1936 และตอนนี้ส่วนใหญ่เกี่ยวข้องกับชื่อของพวกเขา มีร์คทั่วไปทฤษฎีบทในปี 1958 กับบรรทัดฐานทั้งหมดที่ไม่เปลี่ยนแปลงภายใต้การเปลี่ยนแปลงแบบรวมและรวมถึงผู้ประกอบการ 2-normX - A A k 2XkXAAk2

ทฤษฎีบทนี้บางครั้งเรียกว่าทฤษฎีบท Eckart-Young-Mirsky Stewart (1993) เรียกมันว่าทฤษฎีบทการประมาณชมิดท์ ฉันเคยเห็นมันเรียกว่าทฤษฎีบทชมิดท์ - อีคาร์ท - ยัง - เมียร์สกี้


พิสูจน์สำหรับผู้ปฏิบัติงาน -noorm2

Let จะเต็มอันดับn ในฐานะที่เป็นเป็นอันดับkพื้นที่ null ที่มีn - kมิติ พื้นที่ทอดโดยk + 1เวกเตอร์เอกพจน์ขวาของXที่สอดคล้องกับค่าเอกพจน์ที่ใหญ่ที่สุดมีk + 1มิติ ดังนั้นช่องว่างทั้งสองนี้จะต้องตัดกัน ให้wเป็นหน่วยเวกเตอร์จากจุดตัด จากนั้นเราก็จะได้รับ: X - 2 2( X - ) W 2XnAknkk+1Xk+1wQED

XA22(XA)w22=Xw22=i=1k+1si2(viw)2sk+12=XXk22,

พิสูจน์สำหรับบรรทัดฐาน Frobenius

เราต้องการที่จะหาเมทริกซ์ยศkที่ช่วยลดX - 2 F เราสามารถแยกA = B W โดยที่Wมีคอลัมน์k orthonormal ลดX - B W 2สำหรับการแก้ไขWเป็นปัญหากับการแก้ปัญหาการถดถอยB = X W เสียบเข้าไปเราจะเห็นว่าตอนนี้เราต้องลดX - X W W AkXAF2A=BWWkXBW2WB=XWที่ Σเป็นเมทริกซ์ความแปรปรวนของ Xคือ Σ = X X / ( n - 1 ) ซึ่งหมายความว่าข้อผิดพลาดการฟื้นฟูจะลดลงโดยการเป็นคอลัมน์ของ Wบาง k orthonormal เวกเตอร์เพิ่มความแปรปรวนรวมของการฉาย

XXWW2=X2XWW2=consttr(WWXXWW)=constconsttr(WΣW),
ΣXΣ=XX/(n1)Wk

เป็นที่ทราบกันดีว่าสิ่งเหล่านี้เป็น eigenvector แรกของเมทริกซ์ความแปรปรวนร่วม แน่นอนถ้าX = U S V แล้วΣ = V S 2 V / ( n - 1 ) = V Λ V เขียนR = V Wซึ่งยังมีคอลัมน์ orthonormal เราได้รับเสื้อR ( W Σ W ) = T R ( R Λ RkX=USVΣ=VS2V/(n1)=VΛVR=VWสูงสุดทำได้เมื่อ W = V k ทฤษฎีบทจะตามมาทันที

tr(WΣW)=tr(RΛR)=iλijRij2i=1kλk,
W=Vk

ดูสามหัวข้อที่เกี่ยวข้องต่อไปนี้:


ความพยายามในการพิสูจน์ก่อนหน้านี้สำหรับบรรทัดฐาน Frobenius

หลักฐานนี้ฉันพบบางแห่งออนไลน์ แต่มันผิด (มีช่องว่าง) ตามที่อธิบายโดย @ cardinal ในความคิดเห็น

XAF=USVA=SUAV=SB,
B=UAV
XAF=ij(SijBij)2=i(siBii)2+ijBij2.
Bkksi Boptimal=SkAoptimal=UkSkVk

2
การพิสูจน์ในกรณีของบรรทัดฐาน Frobeniius นั้นไม่ถูกต้อง (หรืออย่างน้อยก็สมบูรณ์) เนื่องจากการโต้เถียงที่นี่ไม่ได้ขัดขวางความเป็นไปได้ที่เมทริกซ์ของตำแหน่งเดียวกันจะสามารถตัดคำบางส่วนของแนวทแยงออกได้ขณะที่มี "เล็ก" เส้นทแยงมุม หากต้องการดูช่องว่างที่ชัดเจนยิ่งขึ้นโปรดทราบว่าการถือ diagonals คงที่และ "zeroing" off-diagonals มักจะสามารถเพิ่มอันดับของเมทริกซ์ในคำถาม
พระคาร์ดินัล

1
โปรดทราบว่า SVD เป็นที่รู้จักของ Beltrami (อย่างน้อยก็ในกรณีทั่วไป แต่เป็นกรณีพิเศษ) และ Jordan เร็วเท่าปี 1874
พระคาร์ดินัล

BSkΣผม(sผม-Bผมผม)2ΣผมJBผมJ2
อะมีบาพูดว่า Reinstate Monica

3
ฉันทำเช่น GW สจ๊วต (1993) ในสมัยก่อนประวัติศาสตร์ของการสลายตัวมูลค่าเอกพจน์สยามรีวิวฉบับ 35, ไม่ 4, 551-566 และจากความสนใจในประวัติศาสตร์ที่ผ่านมาฉันคิดว่าคุณก็จะทำเช่นกัน น่าเสียดายที่ฉันคิดว่าสจ๊วร์ตไม่สนใจเรื่องความสง่างามของบทพิสูจน์ของชมิดท์ในปี 1907 โดยไม่ได้ตั้งใจ สิ่งที่ซ่อนอยู่ข้างในนั้นคือการตีความการถดถอยที่สจวร์ตมองเห็นและเป็นสิ่งที่ค่อนข้างสวย มีข้อพิสูจน์อีกประการหนึ่งซึ่งเป็นไปตามวิธีการเริ่มต้นในแนวทแยงมุมที่คุณทำ แต่ต้องใช้งานพิเศษเพื่อเติมช่องว่าง (ต่อ)
สำคัญเมื่อ

2
@ cardinal: ใช่คุณพูดถูกฉันเห็นช่องว่างด้วย ขอบคุณมากสำหรับกระดาษสจ๊วตนั่นเป็นสิ่งที่น่าสนใจมากสำหรับการอ่าน ฉันเห็นว่า Stewart นำเสนอบทพิสูจน์ของ Schmidt และ Weyl แต่ทั้งคู่ดูซับซ้อนกว่าสิ่งที่ฉันต้องการคัดลอกที่นี่ (และจนถึงตอนนี้ฉันยังไม่มีเวลาศึกษาอย่างรอบคอบ) ฉันประหลาดใจ: ฉันคาดว่าสิ่งนี้จะเป็นผลลัพธ์ที่ง่ายมาก แต่ดูเหมือนว่ามันเล็กน้อยเล็กน้อยกว่าที่ฉันคิด โดยเฉพาะอย่างยิ่งฉันไม่คาดหวังว่ากรณีของ Frobenius นั้นซับซ้อนกว่าตัวดำเนินการมาตรฐานมากนัก ฉันจะแก้ไขโพสต์ทันที สวัสดีปีใหม่!
อะมีบาพูดว่า Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.