ไม่ได้สูตรตามปกติของ PCA ไม่ใช่ปัญหานูน แต่พวกเขาสามารถเปลี่ยนเป็นปัญหาการเพิ่มประสิทธิภาพนูน
ความเข้าใจลึกซึ้งและความสนุกของสิ่งนี้กำลังติดตามและมองเห็นลำดับของการเปลี่ยนแปลงมากกว่าเพียงแค่ได้รับคำตอบ: มันอยู่ในการเดินทางไม่ใช่ปลายทาง ขั้นตอนหลักในการเดินทางครั้งนี้คือ
รับนิพจน์อย่างง่ายสำหรับฟังก์ชันวัตถุประสงค์
ขยายโดเมนของมันซึ่งไม่ได้เป็นแบบนูน
ปรับเปลี่ยนวัตถุประสงค์ซึ่งไม่ได้เป็นนูนซึ่งเป็นวิธีที่เห็นได้ชัดว่าไม่ได้เปลี่ยนจุดที่มันบรรลุค่าที่ดีที่สุด
หากคุณเฝ้าดูอย่างใกล้ชิดคุณสามารถเห็นตัวคูณ SVD และ Lagrange ที่ซุ่มซ่อน - แต่มันเป็นเพียงแค่ภาพสไลด์มีความสนใจที่งดงามและฉันจะไม่แสดงความคิดเห็นเพิ่มเติม
การกำหนดค่าความแปรปรวนมาตรฐานสูงสุดของ PCA (หรืออย่างน้อยขั้นตอนสำคัญของมัน) คือ
Maximize f(x)= x′Ax subject to x′x=1(*)
ที่ matrix Aเป็นเมทริกซ์สมมาตรบวก - semidefinite สร้างขึ้นจากข้อมูล (โดยปกติคือผลรวมของกำลังสองและเมทริกซ์ของผลิตภัณฑ์เมทริกซ์แปรปรวนร่วมหรือเมทริกซ์สหสัมพันธ์)n×nA
(เท่ากันเราอาจพยายามเพิ่มวัตถุประสงค์ที่ไม่มีข้อ จำกัดไม่เพียง แต่เป็นการแสดงออกที่น่ารังเกียจ - มันไม่ใช่ฟังก์ชั่นสมการกำลังสอง - แต่กราฟกรณีพิเศษจะแสดงอย่างรวดเร็วว่าไม่ใช่ฟังก์ชันนูน , อย่างใดอย่างหนึ่งมักจะสังเกตว่าฟังก์ชั่นนี้ไม่แปรเปลี่ยนภายใต้ rescalings x → λ xและจากนั้นจะลดลงเป็นสูตร จำกัด( ∗ ) .)x′Ax/x′xx→λx(∗)
ปัญหาการปรับให้เหมาะสมใด ๆ สามารถกำหนดเป็นนามธรรมเป็น
ค้นหาอย่างน้อยหนึ่งที่ทำให้ฟังก์ชั่นf : X → Rมีขนาดใหญ่ที่สุดx∈Xf:X→R
โปรดจำไว้ว่าปัญหาการปรับให้เหมาะสมนั้นจะนูนเมื่อมีคุณสมบัติแยกกันสองอย่าง :
โดเมน นูน X⊂Rn สามารถกำหนดได้หลายวิธี หนึ่งคือว่าเมื่อใดก็ตามและY ∈ Xและ0 ≤ λ ≤ 1 , λ x + ( 1 - λ ) Y ∈ Xยัง เรขาคณิต: เมื่อใดก็ตามที่สองจุดสิ้นสุดของการโกหกส่วนของเส้นในX , ส่วนทั้งโกหกในXx∈Xy∈X0≤λ≤1λx+(1−λ)y∈XXX
ฟังก์ชั่น นูน f นอกจากนี้ยังสามารถกำหนดได้หลายวิธี หนึ่งคือว่าเมื่อใดก็ตามและY ∈ Xและ0 ≤ λ ≤ 1 , F ( λ x + ( 1 - λ ) Y ) ≥ λ F ( x ) + ( 1 - λ ) ฉ( Y ) (เราต้องการXx∈Xy∈X0≤λ≤1
f(λx+(1−λ)y)≥λf(x)+(1−λ)f(y).
Xที่จะนูนออกมาเพื่อให้สภาพเช่นนี้จะทำให้ความรู้สึกใด ๆ ) เรขาคณิต:. เมื่อใดก็ตามที่เป็นส่วนใด ๆ ในแนวXกราฟของF (ตามที่ จำกัด เฉพาะส่วนนี้) อยู่ด้านบนหรือในส่วนที่เชื่อมต่อกัน( x , F ( x ) )และ( Y , F ( Y ) )ในR n + 1xy¯Xf(x,f(x))(y,f(y))Rn+1
y→ay2+by+ca≤0.
(∗)XSn−1⊂Rnxλfλ20<x′x<1xλ=1/x′x−−−√>1f Dn={x∈Rn∣x′x≤1}(∗)
Maximize f(x)= x′Ax subject to x′x≤1(**)
X=Dnf
(∗∗)PRnA
A=P′ΣP
ΣPAx→x′Ax
AΣP
σ1≥σ2≥⋯≥σn≥0.
x=P′yxy=Pxf
f(y)=y′Ay=x′P′APx=x′Σx=σ1x21+σ2x22+⋯+σnx2n.
Xσi
(∗∗)x′x=1σ1fXffσ1
g(y)=f(y)−σ1y′y.
σ1fgfX
−σ1−σ1y′yPy′y=x′xxg
g(y)=σ1x21+⋯+σnx2n−σ1(x21+⋯+x2n)=(σ2−σ1)x22+⋯+(σn−σ1)x2n.
σ1≥σiiggx2=x3=⋯=xn=0x′x=1x1=±1y=P(±1,0,…,0)′P
g∂Dn=Sn−1y′y=1fgσ1gfDnfg