การเพิ่มประสิทธิภาพ PCA นูนหรือไม่


13

ฟังก์ชั่นวัตถุประสงค์ของการวิเคราะห์องค์ประกอบหลัก (PCA) จะลดการผิดพลาดในการฟื้นฟูใน L2 บรรทัดฐาน (ดูหัวข้อ 2.12 นี่อีกมุมมองหนึ่งพยายามที่จะเพิ่มความแปรปรวนในการฉายนอกจากนี้เรายังมีการโพสต์ที่ยอดเยี่ยมที่นี่:.. เป็นฟังก์ชันวัตถุประสงค์ของ PCA อะไร ? )

คำถามของฉันคือการเพิ่มประสิทธิภาพ PCA นูนหรือไม่ (ฉันพบการสนทนาที่นี่แต่หวังว่าใครบางคนสามารถให้หลักฐานที่ดีเกี่ยวกับ CV)


3
ไม่คุณกำลังเพิ่มฟังก์ชันนูน (ภายใต้ข้อ จำกัด ) ให้สูงสุด
user603

5
ฉันคิดว่าคุณต้องเจาะจงเกี่ยวกับสิ่งที่คุณหมายถึงโดย "การเพิ่มประสิทธิภาพ PCA" การกำหนดมาตรฐานหนึ่งคือการเพิ่มxAxอาจมีการxx=1 1 ปัญหาคือนูนไม่ได้สมเหตุสมผล: โดเมนxx=1เป็นทรงกลมไม่ใช่พื้นที่ยูคลิด
whuber

1
@whuber ขอบคุณสำหรับความคิดเห็นของคุณฉันอาจไม่สามารถชี้แจงคำถามเนื่องจากมีความรู้ จำกัด ฉันอาจรอคำตอบบางอย่างสามารถช่วยฉันชี้แจงคำถามในเวลาเดียวกัน
Haitao Du

3
ฉันจะแนะนำคุณเกี่ยวกับคำจำกัดความของ "นูน" ที่คุณคุ้นเคย พวกเขาทุกคนไม่เกี่ยวข้องกับแนวคิดของคะแนนในโดเมนของฟังก์ชันที่อยู่ระหว่างคะแนนอื่นหรือไม่? นั่นเป็นความทรงจำที่คุ้มค่าเพราะมันเตือนให้คุณพิจารณาเรขาคณิตของโดเมนของฟังก์ชันรวมถึงคุณสมบัติเชิงพีชคณิตหรือการวิเคราะห์ของค่าฟังก์ชัน ในแง่ที่มันเกิดขึ้นกับผมว่าการกำหนดความแปรปรวนสูงสุดสามารถปรับเปลี่ยนเล็กน้อยเพื่อให้นูนโดเมน: เพียงแค่ต้องมากกว่าx ' x = 1 วิธีการแก้ปัญหาเหมือนกัน - และคำตอบจะค่อนข้างชัดเจน xx1xx=1
whuber

คำตอบ:


18

ไม่ได้สูตรตามปกติของ PCA ไม่ใช่ปัญหานูน แต่พวกเขาสามารถเปลี่ยนเป็นปัญหาการเพิ่มประสิทธิภาพนูน

ความเข้าใจลึกซึ้งและความสนุกของสิ่งนี้กำลังติดตามและมองเห็นลำดับของการเปลี่ยนแปลงมากกว่าเพียงแค่ได้รับคำตอบ: มันอยู่ในการเดินทางไม่ใช่ปลายทาง ขั้นตอนหลักในการเดินทางครั้งนี้คือ

  1. รับนิพจน์อย่างง่ายสำหรับฟังก์ชันวัตถุประสงค์

  2. ขยายโดเมนของมันซึ่งไม่ได้เป็นแบบนูน

  3. ปรับเปลี่ยนวัตถุประสงค์ซึ่งไม่ได้เป็นนูนซึ่งเป็นวิธีที่เห็นได้ชัดว่าไม่ได้เปลี่ยนจุดที่มันบรรลุค่าที่ดีที่สุด

หากคุณเฝ้าดูอย่างใกล้ชิดคุณสามารถเห็นตัวคูณ SVD และ Lagrange ที่ซุ่มซ่อน - แต่มันเป็นเพียงแค่ภาพสไลด์มีความสนใจที่งดงามและฉันจะไม่แสดงความคิดเห็นเพิ่มเติม


การกำหนดค่าความแปรปรวนมาตรฐานสูงสุดของ PCA (หรืออย่างน้อยขั้นตอนสำคัญของมัน) คือ

(*)Maximize f(x)= xAx  subject to  xx=1

ที่ matrix Aเป็นเมทริกซ์สมมาตรบวก - semidefinite สร้างขึ้นจากข้อมูล (โดยปกติคือผลรวมของกำลังสองและเมทริกซ์ของผลิตภัณฑ์เมทริกซ์แปรปรวนร่วมหรือเมทริกซ์สหสัมพันธ์)n×nA

(เท่ากันเราอาจพยายามเพิ่มวัตถุประสงค์ที่ไม่มีข้อ จำกัดไม่เพียง แต่เป็นการแสดงออกที่น่ารังเกียจ - มันไม่ใช่ฟังก์ชั่นสมการกำลังสอง - แต่กราฟกรณีพิเศษจะแสดงอย่างรวดเร็วว่าไม่ใช่ฟังก์ชันนูน , อย่างใดอย่างหนึ่งมักจะสังเกตว่าฟังก์ชั่นนี้ไม่แปรเปลี่ยนภายใต้ rescalings x λ xและจากนั้นจะลดลงเป็นสูตร จำกัด( ) .)xAx/xxxλx()

ปัญหาการปรับให้เหมาะสมใด ๆ สามารถกำหนดเป็นนามธรรมเป็น

ค้นหาอย่างน้อยหนึ่งที่ทำให้ฟังก์ชั่นf : XRมีขนาดใหญ่ที่สุดxXf:XR

โปรดจำไว้ว่าปัญหาการปรับให้เหมาะสมนั้นจะนูนเมื่อมีคุณสมบัติแยกกันสองอย่าง :

  1. โดเมน นูน XRn สามารถกำหนดได้หลายวิธี หนึ่งคือว่าเมื่อใดก็ตามและY Xและ0 λ 1 , λ x + ( 1 - λ ) Y Xยัง เรขาคณิต: เมื่อใดก็ตามที่สองจุดสิ้นสุดของการโกหกส่วนของเส้นในX , ส่วนทั้งโกหกในXxXyX0λ1λx+(1λ)yXXX

  2. ฟังก์ชั่น นูน f นอกจากนี้ยังสามารถกำหนดได้หลายวิธี หนึ่งคือว่าเมื่อใดก็ตามและY Xและ0 λ 1 , F ( λ x + ( 1 - λ ) Y ) λ F ( x ) + ( 1 - λ ) ( Y ) (เราต้องการXxXyX0λ1

    f(λx+(1λ)y)λf(x)+(1λ)f(y).
    Xที่จะนูนออกมาเพื่อให้สภาพเช่นนี้จะทำให้ความรู้สึกใด ๆ ) เรขาคณิต:. เมื่อใดก็ตามที่เป็นส่วนใด ๆ ในแนวXกราฟของF (ตามที่ จำกัด เฉพาะส่วนนี้) อยู่ด้านบนหรือในส่วนที่เชื่อมต่อกัน( x , F ( x ) )และ( Y , F ( Y ) )ในR n + 1xy¯Xf(x,f(x))(y,f(y))Rn+1

    yay2+by+ca0.

()XSn1Rnxλfλ20<xx<1xλ=1/xx>1f Dn={xRnxx1}()

(**)Maximize f(x)= xAx  subject to  xx1

X=Dnf

()PRnA

A=PΣP

ΣPAxxAx

AΣP

σ1σ2σn0.

x=Pyxy=Pxf

f(y)=yAy=xPAPx=xΣx=σ1x12+σ2x22++σnxn2.

Xσi

()xx=1σ1fXffσ1

g(y)=f(y)σ1yy.

σ1fgfX

σ1σ1yyPyy=xxxg

g(y)=σ1x12++σnxn2σ1(x12++xn2)=(σ2σ1)x22++(σnσ1)xn2.

σ1σiiggx2=x3==xn=0xx=1x1=±1y=P(±1,0,,0)P

gDn=Sn1yy=1fgσ1gfDnfg


4
σ1

@ amoeba ถูกต้องทุกประการ ขอบคุณ. ฉันได้ขยายการอภิปรายของจุดนั้น
whuber

3
(+1) ในคำตอบของคุณดูเหมือนว่าคุณจะกำหนดฟังก์ชั่นนูนให้เป็นสิ่งที่คนส่วนใหญ่จะพิจารณาว่าเป็นฟังก์ชั่นเว้า (อาจเป็นเพราะปัญหาการเพิ่มประสิทธิภาพนูนมีโดเมนนูนและฟังก์ชั่นเว้าซึ่งมีการคำนวณสูงสุด ) นูนฟังก์ชั่นในช่วงที่ต่ำสุดคือการคำนวณ))
user795305

2
gXf

2
fgg

6

เลขที่

kM

X^=argminrank(X)kMXF2

F

แม้ว่าบรรทัดฐานจะเป็นแบบนูน แต่ชุดที่ปรับให้เหมาะสมนั้นไม่ใช่แบบนูน


การผ่อนคลายของปัญหา PCA เรียกว่าการประมาณนูนต่ำอันดับ

X^=argminXcMXF2

(เป็นบรรทัดฐานนิวเคลียร์มันเป็นการผ่อนคลายของอันดับ - เหมือนเป็นการผ่อนคลายของจำนวนองค์ประกอบที่ไม่ใช่ศูนย์สำหรับเวกเตอร์นูน)11

คุณสามารถดูการเรียนรู้ทางสถิติด้วย Sparsity , ch 6 (เมทริกซ์ย่อยสลาย) สำหรับรายละเอียด

หากคุณกำลังสนใจในปัญหาทั่วไปมากขึ้นและวิธีการที่พวกเขาเกี่ยวข้องกับนูนดูทั่วไปต่ำอันดับรุ่น


1

คำเตือน: คำตอบก่อนหน้านี้ทำหน้าที่ได้ดีมากในการอธิบายว่า PCA ในสูตรดั้งเดิมนั้นเป็นแบบไม่นูน แต่สามารถแปลงเป็นปัญหาการปรับให้เหมาะสมแบบนูนได้ คำตอบของฉันนั้นมีไว้สำหรับผู้ยากไร้เท่านั้น (เช่นฉัน) ที่ไม่คุ้นเคยกับศัพท์แสงของ Unit Spheres และ SVDs - ซึ่งก็คือ btw ที่น่ารู้

แหล่งที่มาของฉันคือบันทึกการบรรยายนี้โดยศาสตราจารย์ Tibshirani

สำหรับปัญหาการปรับให้เหมาะสมที่จะแก้ไขด้วยเทคนิคการปรับให้เหมาะสมของนูนมีข้อกำหนดเบื้องต้นสองประการ

  1. ฟังก์ชั่นวัตถุประสงค์จะต้องมีการนูน
  2. ฟังก์ชั่นข้อ จำกัด ควรจะนูน

สูตรส่วนใหญ่ของ PCA เกี่ยวข้องกับข้อ จำกัด ในการจัดอันดับของเมทริกซ์

ในสูตร PCA ประเภทนี้จะมีการละเมิดเงื่อนไข 2 เนื่องจากข้อ จำกัด ที่ไม่ได้เป็นแบบนูน ตัวอย่างเช่นให้ ,เป็นเมทริกซ์ศูนย์ 2 × 2 โดยมี 1 ตัวที่มุมซ้ายบนและมุมขวาล่างตามลำดับ จากนั้นแต่ละเหล่านี้มีอันดับ 1 แต่ค่าเฉลี่ยของพวกเขามีอันดับ 2J 11 J 22rank(X)=k,J11J22


Xk

Xk
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.