ความเข้าใจทางเรขาคณิตของ PCA ในพื้นที่ (เรื่องคู่)


19

ฉันพยายามที่จะได้รับความเข้าใจที่ง่ายของการวิเคราะห์องค์ประกอบวิธีการหลัก (PCA) ทำงานในเรื่อง (คู่) พื้นที่

พิจารณาชุดข้อมูล 2D ที่มีตัวแปรสองตัวคือและและจุดข้อมูล (เมทริกซ์ข้อมูลคือคูณและถือว่าอยู่กึ่งกลาง) การนำเสนอตามปกติของ PCA คือเราพิจารณาคะแนนในเขียนเมทริกซ์ความแปรปรวนร่วมและหาค่าลักษณะเฉพาะของมัน สอดคล้องเครื่องแรกกับทิศทางของความแปรปรวนสูงสุด ฯลฯ นี่คือตัวอย่างที่มีความแปรปรวนเดอะเมทริกซ์ขวา) เส้นสีแดงแสดงค่าไอเกนผู้ประเมินโดยสแควร์รูทของค่าลักษณะเฉพาะนั้น ๆx 2 n X n × 2 n R 2 2 × 2 C = ( 4 2 2 2 )x1x2nXn×2nR22×2C=(4222)

PCA ในพื้นที่ตัวอย่าง

ตอนนี้ให้พิจารณาสิ่งที่เกิดขึ้นในพื้นที่หัวเรื่อง (ฉันเรียนรู้คำศัพท์นี้จาก @ttnphns) หรือที่เรียกว่าช่องว่างคู่ (คำที่ใช้ในการเรียนรู้ของเครื่อง) นี่คือพื้นที่มิติที่ตัวอย่างของสองตัวแปรของเรา (สองคอลัมน์ของ ) รูปแบบสองเวกเตอร์และx_2 ความยาวกำลังสองของเวกเตอร์ตัวแปรแต่ละตัวเท่ากับความแปรปรวน, โคไซน์ของมุมระหว่างเวกเตอร์สองตัวนั้นเท่ากับความสัมพันธ์ระหว่างพวกมัน การเป็นตัวแทนนี้เป็นวิธีที่มีมาตรฐานมากในการบำบัดรักษาการถดถอยหลายครั้ง ในตัวอย่างของฉันพื้นที่หัวเรื่องดูเหมือนว่า (ฉันจะแสดงระนาบ 2D ที่ถูกเวกเตอร์แปรผันสองตัวเท่านั้น):X x 1 x 2nXx1x2

PCA ในหัวเรื่อง 1

ส่วนประกอบหลักซึ่งเป็นการรวมกันเชิงเส้นของตัวแปรทั้งสองจะรวมกันเป็นสองเวกเตอร์และในระนาบเดียวกัน คำถามของฉันคือสิ่งที่เป็นความเข้าใจเรขาคณิต / สัญชาตญาณของวิธีการรูปแบบหลักเวกเตอร์องค์ประกอบตัวแปรโดยใช้พาหะตัวแปรเดิมในพล็อตดังกล่าวหรือไม่ ได้รับและสิ่งที่ขั้นตอนเรขาคณิตจะให้ผลผลิต ?p 2 x 1 x 2 p 1p1p2x1x2p1


ด้านล่างนี้เป็นความเข้าใจบางส่วนของฉันในปัจจุบัน

ก่อนอื่นฉันสามารถคำนวณส่วนประกอบ / แกนหลักผ่านวิธีมาตรฐานและพล็อตพวกมันในรูปแบบเดียวกัน:

PCA ในหัวเรื่อง 2

ยิ่งไปกว่านั้นเราสามารถสังเกตได้ว่านั้นถูกเลือกเช่นว่าผลรวมของระยะทางระหว่าง (เวกเตอร์สีน้ำเงิน) และการคาดการณ์ของพวกเขาในนั้นน้อยมาก ระยะทางเหล่านั้นเป็นข้อผิดพลาดในการสร้างใหม่และแสดงด้วยเส้นประสีดำ เท่าเพิ่มผลรวมของความยาวของทั้งสองยกกำลังสองประมาณการ สิ่งนี้ระบุอย่างสมบูรณ์และแน่นอนคล้ายกับคำอธิบายที่คล้ายกันในพื้นที่หลัก (ดูภาพเคลื่อนไหวในคำตอบของฉันในการทำความเข้าใจการวิเคราะห์องค์ประกอบหลัก eigenvectors & ค่าลักษณะเฉพาะ ) ดูส่วนแรกของ@ttnphns'es ที่นี่ด้วยxฉันp 1 p 1 p 1p1xip1p1p1

อย่างไรก็ตามนี่ไม่เพียงพอสำหรับเรขาคณิต! มันไม่ได้บอกวิธีการหาและไม่ได้ระบุความยาวp1

ฉันเดาว่า , ,และทั้งหมดอยู่ในวงรีหนึ่งที่ศูนย์ที่โดยที่และเป็นแกนหลัก นี่เป็นตัวอย่างของฉัน:x 2 p 1 p 2 0 p 1 p 2x1x2p1p20p1p2

ป้อนคำอธิบายรูปภาพที่นี่

Q1: จะพิสูจน์ได้อย่างไร? การสาธิตพีชคณิตโดยตรงดูเหมือนจะน่าเบื่อมาก วิธีดูว่ากรณีนี้จะต้อง?

แต่มีจุดไข่ปลาที่แตกต่างกันมากมายที่กึ่งกลางที่และผ่านและ :x 1 x 20x1x2

ป้อนคำอธิบายรูปภาพที่นี่

Q2: วงรี "ถูกต้อง" ระบุอะไร? การเดาครั้งแรกของฉันคือวงรีที่มีแกนหลักที่ยาวที่สุดที่เป็นไปได้ แต่ดูเหมือนว่าจะผิด (มีรูปไข่กับแกนหลักของความยาวใด ๆ )

หากมีคำตอบสำหรับไตรมาสที่ 1 และไตรมาสที่ 2 ฉันก็อยากจะรู้ด้วยว่าพวกเขาพูดถึงกรณีของตัวแปรมากกว่าสองตัวหรือไม่


เป็นความจริงไหมว่ามีจุดไข่ปลาที่เป็นไปได้มากมายที่อยู่กึ่งกลางที่จุดกำเนิด (โดยที่ x1 & x2 ตัดกัน) และติดต่อกับปลายสุดของ x1 & x2 หรือไม่? ฉันคิดว่าคงมีแค่อันเดียว แน่นอนว่าอาจมีหลายอย่างถ้าคุณผ่อนคลาย 1 ใน 3 ของเกณฑ์เหล่านั้น (ตรงกลาง, & ปลาย 2)
gung - Reinstate Monica

มีจุดไข่ปลาอยู่ตรงกลางที่จุดกำเนิดผ่านสองเวกเตอร์ แต่สำหรับเวกเตอร์ที่ไม่ใช่ collinearและมีเพียงอันเดียวนั่นคือวงกลมหน่วยในสองฐาน มันคือโลกัสของโดยที่สามารถเรียนรู้ได้มากมายจากแกนหลัก ( c , d ) x ( a , b ) + y ( c , d ) | ( d ) - 1 ( x Y ) | 2 = 1(a,b)(c,d)x(a,b)+y(c,d)
|(acbd)1(xy)|2=1.
whuber

3
variable space (I borrowed this term from ttnphns)- @amoeba คุณต้องเข้าใจผิด ตัวแปรที่เป็นเวกเตอร์ในพื้นที่ n- มิติเรียกว่าพื้นที่ว่าง (วัตถุที่ n เป็นแกน "กำหนด" พื้นที่ในขณะที่ตัวแปร p "ขยาย" มัน) ในทางกลับกันพื้นที่แปรผันคือตรงกันข้าม - นั่นคือ scatterplot ปกติ นี่คือวิธีสร้างคำศัพท์ในสถิติหลายตัวแปร (ถ้าในการเรียนรู้ด้วยเครื่องจักรมันแตกต่างกัน - ฉันไม่รู้ - มันแย่กว่านั้นสำหรับผู้เรียน)
ttnphns

โปรดทราบว่าทั้งคู่เป็นช่องว่างแบบเวกเตอร์: เวกเตอร์ (= คะแนน) คือช่วงใดแกนคือสิ่งที่กำหนดทิศทางและรอยหยักการวัดหมี โปรดทราบด้วยว่าวิภาษ: "ช่องว่าง" ทั้งสองเป็นช่องว่างเดียวกัน (เฉพาะสูตรที่แตกต่างกันสำหรับวัตถุประสงค์ปัจจุบัน) เห็นได้จากตัวอย่างในรูปภาพสุดท้ายของคำตอบนี้ เมื่อคุณซ้อนทับสูตรสองสูตรคุณจะได้ biplot หรือช่องว่างคู่
ttnphns

My guess is that x1, x2, p1, p2 all lie on one ellipseอะไรคือความช่วยเหลือจากการแก้ปัญหาวงรีที่นี่? ฉันสงสัยมัน.
ttnphns

คำตอบ:


5

สรุปทั้งหมดของแสดงในคำถามขึ้นอยู่กับช่วงเวลาที่สองเท่านั้น หรือเท่ากันในเมทริกซ์นายก} เพราะเราคิดว่าเป็นจุดเมฆ -แต่ละจุดคือแถวของ - เราอาจถามว่าการดำเนินการอย่างง่ายในประเด็นเหล่านี้รักษาคุณสมบัติของได้อย่างไรX X X X X XXXXXXXX

หนึ่งคือการซ้ายคูณโดยเมทริกซ์ซึ่งจะผลิตอีกเมทริกซ์{} สำหรับสิ่งนี้ในการทำงานมันเป็นสิ่งสำคัญที่ n × n U n × 2 U XXn×nUn×2UX

XX=(UX)UX=X(UU)X.

ความเท่าเทียมกันเมื่อมีการประกันเป็นเมทริกซ์เอกลักษณ์นั่นคือเมื่อเป็นมุมฉาก n×nคุณUUn×nU

มันเป็นที่รู้จักกันดี (และง่ายที่จะแสดงให้เห็น) ว่า orthogonal เมทริกซ์เป็นผลมาจากการสะท้อนและปริภูมิแบบยุคลิด (พวกเขากลายเป็นกลุ่มสะท้อนใน ) โดยการเลือกอย่างชาญฉลาดผลัดเราอย่างมากสามารถลดความซับซ้อนของ{X} แนวคิดหนึ่งคือการมุ่งเน้นไปที่การหมุนที่ส่งผลกระทบต่อจุดสองจุดในเมฆในเวลาเดียว สิ่งเหล่านี้ง่ายมากเพราะเราเห็นภาพได้XRnX

โดยเฉพาะการให้และเป็นสองจุดภัณฑ์ที่แตกต่างกันในเมฆ constituting แถวและของ{X} การหมุนของพื้นที่คอลัมน์ส่งผลกระทบต่อเพียงสองจุดนี้เท่านั้นที่จะเปลี่ยนเป็น( x j , y j ) i j X R n(xi,yi)(xj,yj)ijXRn

{(xi,yi)=(cos(θ)xi+sin(θ)xj,cos(θ)yi+sin(θ)yj)(xj,yj)=(sin(θ)xi+cos(θ)xj,sin(θ)yi+cos(θ)yj).

อะไรจำนวนนี้เป็นรูปวาดเวกเตอร์และในเครื่องบินและหมุนพวกเขาโดยมุม\(สังเกตว่าพิกัดผสมกันที่นี่ได้อย่างไรไปด้วยกันและไปด้วยกันดังนั้นผลของการหมุนนี้ในมักจะไม่ดูเหมือนการหมุนของ เวกเตอร์และตามที่วาดใน )( y i , y j ) θ x y R n ( x i , y i ) ( x j , y j ) R 2(xi,xj)(yi,yj)θxyRn(xi,yi)(xj,yj) R2

ด้วยการเลือกมุมที่ถูกต้องเราสามารถเป็นศูนย์ในองค์ประกอบใหม่เหล่านี้ จะเป็นคอนกรีตขอเลือกเพื่อให้θ

{cos(θ)=±xixi2+xj2sin(θ)=±xjxi2+xj2.

นี้จะทำให้ 0 เลือกเข้าสู่ระบบเพื่อให้0 ขอเรียกการดำเนินการนี้ซึ่งการเปลี่ยนแปลงจุดที่และในเมฆแสดงโดย ,j)xj=0yj0ijXγ(i,j)

การใช้กับซ้ำ ๆจะทำให้คอลัมน์แรกของไม่ใช่ศูนย์ใน แถวแรก ในทางเรขาคณิตเราจะย้ายทั้งหมด แต่จุดเดียวในเมฆบนแกนตอนนี้เราอาจใช้การหมุนเดียวซึ่งอาจเกี่ยวข้องกับพิกัดในเพื่อบีบจุดเหล่านั้นลงไปที่จุดเดียว เท่ากันถูกลดขนาดลงเป็นรูปแบบบล็อกγ(1,2),γ(1,3),,γ(1,n)XXy2,3,,nRnn1X

X=(x1y10z),

ด้วยและทั้งสองคอลัมน์เป็นเวกเตอร์ที่มีพิกัดในลักษณะที่0zn1

XX=((x1)2x1y1x1y1(y1)2+||z||2).

การหมุนครั้งสุดท้ายนี้ช่วยลดลงในฟอร์มสามเหลี่ยมด้านบนX

X=(x1y10||z||0000).

ผลตอนนี้เราสามารถเข้าใจในแง่ของการที่ง่ายมากเมทริกซ์สร้าง โดยสองคะแนนสุดท้ายไม่ใช่ศูนย์เหลือยืนX2×2(x1y10||z||)

เพื่อแสดงให้เห็นว่าฉันดึงสี่คะแนน iid จากการแจกแจงปกติแบบ bivariate และปัดค่าเป็น

X=(0.090.120.310.630.740.231.80.39)

เมฆจุดเริ่มต้นนี้จะปรากฏที่ด้านซ้ายของรูปถัดไปโดยใช้จุดสีดำทึบโดยมีลูกศรสีที่ชี้จากจุดกำเนิดไปยังแต่ละจุด (เพื่อช่วยให้เรามองเห็นพวกมันเป็นเวกเตอร์ )

รูป

ลำดับของการดำเนินการที่มีผลกับจุดเหล่านี้โดยและส่งผลให้เมฆที่แสดงอยู่ตรงกลาง ที่มากในขณะที่สามจุดนอนพร้อมแกนได้รับการรวมตัวกันเป็นจุดเดียวออกจากการเป็นตัวแทนของรูปแบบที่ลดลงของX ความยาวของเวกเตอร์สีแดงแนวตั้งคือ; อื่น ๆ (สีฟ้า) เป็นเวกเตอร์นายก)γ(1,2),γ(1,3),γ(1,4)yX||z||(x1,y1)

สังเกตุเห็นรูปร่างที่เป็นจุดจาง ๆ สำหรับการอ้างอิงในแผงทั้งห้า มันแสดงให้เห็นถึงความยืดหยุ่นที่เหลืออยู่ล่าสุดในการเป็นตัวแทน :Xเมื่อเราหมุนสองแถวแรกเวกเตอร์สองตัวสุดท้ายจะติดตามวงรีนี้ ดังนั้นเวกเตอร์แรกติดตามเส้นทาง

(1)θ  (cos(θ)x1,cos(θ)y1+sin(θ)||z||)

ในขณะที่เวกเตอร์ที่สองติดตามเส้นทางเดียวกันตาม

(2)θ  (sin(θ)x1,sin(θ)y1+cos(θ)||z||).

เราอาจหลีกเลี่ยงพีชคณิตที่น่าเบื่อโดยสังเกตว่าเพราะเส้นโค้งนี้เป็นภาพของชุดของจุดภายใต้การแปลงเชิงเส้นที่กำหนดโดย{(cos(θ),sin(θ)):0θ<2π}

(1,0)  (x1,0);(0,1)  (y1,||z||),

มันจะต้องเป็นวงรี (ตอบคำถาม 2 ตอนนี้ทั้งหมด) ดังนั้นจะมีค่าวิกฤตสี่ค่าของในการกำหนดพารามิเตอร์ซึ่งทั้งสองสอดคล้องกับจุดสิ้นสุดของแกนหลักและสองสอดคล้องกับจุดสิ้นสุดของแกนย่อย; และตามมาทันทีที่พร้อมกันให้ปลายของแกนรองและแกนหลักตามลำดับ หากเราเลือก aจุดที่เกี่ยวข้องใน cloud point จะอยู่ที่ปลายแกนหลักเช่นนี้:( 1 ) ( 2 ) θθ(1) (2)θ

รูปที่ 2

เนื่องจากสิ่งเหล่านี้เป็นฉากตั้งฉากและหันไปตามแกนของวงรีพวกมันจึงอธิบายแกนหลักได้อย่างถูกต้องนั่นคือโซลูชัน PCA นั่นคือคำตอบคำถามที่ 1


วิเคราะห์ให้ที่นี่ในการเติมเต็มของคำตอบของฉันที่ด้านล่างคำอธิบายด้านบนของระยะทาง Mahalanobis ที่นั่นโดยการตรวจสอบการหมุนและ rescalings ในฉันอธิบายว่าเมฆจุดใดในมิติจะกำหนดระบบพิกัดธรรมชาติสำหรับได้อย่างไร ที่นี่ฉันได้แสดงให้เห็นว่ามันกำหนดทางเรขาคณิตวงรีซึ่งเป็นภาพของวงกลมภายใต้การแปลงเชิงเส้น แน่นอนว่าวงรีนี้เป็นไอโซโทปของระยะทาง Mahalanobis คงที่ p=2 R 2R2p=2R2

อีกสิ่งหนึ่งที่ทำได้โดยการวิเคราะห์นี้คือการแสดงการเชื่อมต่อที่ใกล้ชิดระหว่างการสลายตัว QR (ของเมทริกซ์รูปสี่เหลี่ยมผืนผ้า)และการแยกย่อยค่าเอกพจน์หรือ SVD เป็นที่รู้จักกันผลัด Givens องค์ประกอบของพวกเขาประกอบด้วย orthogonal หรือ " " ซึ่งเป็นส่วนหนึ่งของการสลายตัวของ QR สิ่งที่เหลืออยู่ - รูปแบบที่ลดลงของ - เป็นสามเหลี่ยมด้านบนหรือส่วน " " ของการสลายตัว QR ในเวลาเดียวกันการหมุนและ rescalings (อธิบายว่า relabelings ของพิกัดในตำแหน่งอื่น ๆ ) ประกอบด้วยส่วนหนึ่งของ SVDQ X R DVX = Uγ(i,j)QXRDV UX=UDVนายก} แถวของโดยบังเอิญสร้างจุดของคลาวด์ที่แสดงในรูปสุดท้ายของโพสต์นั้นU

ในที่สุดการวิเคราะห์ที่นำเสนอที่นี่สรุปในรูปแบบที่ชัดเจนต่อกรณี : นั่นคือเมื่อมีองค์ประกอบหลักเพียงหนึ่งหรือสององค์ประกอบp2


แม้ว่าคำตอบของคุณอาจเป็นแบบอย่างในตัวมันเองมันก็ไม่ชัดเจนสำหรับฉัน - มันเกี่ยวข้องกับคำถามอย่างไร คุณกำลังพูดถึงเกี่ยวกับdata cloud X (และเวกเตอร์ที่คุณหมุนคือจุดข้อมูล, แถวของ X) แต่คำถามคือเกี่ยวกับพื้นที่ที่อยู่ภายใต้ลดลง กล่าวอีกนัยหนึ่งเราไม่มีข้อมูล X เรามี 2x2 ความแปรปรวนร่วมหรือเมทริกซ์กระจาย X'X
ttnphns

(ต่อ) เราเป็นตัวแทนของตัวแปร 2 ตัวที่สรุปโดยมันเป็น 2 เวกเตอร์ที่มีความยาว = sqrt (องค์ประกอบแนวทแยงมุม) และมุม = ความสัมพันธ์ของพวกเขา จากนั้น OP ถามว่าเราจะแก้ปัญหาทางเรขาคณิตอย่างหมดจดสำหรับองค์ประกอบหลักได้อย่างไร กล่าวอีกนัยหนึ่ง OP ต้องการอธิบายeigendecomposition ทางเรขาคณิต (eigenvalues ​​& eigenvectors หรือดีกว่าโหลด) ของเมทริกซ์ความแปรปรวนร่วม symmetric 2x2
ttnphns

(ต่อ.) โปรดดูที่ภาพที่สองมี สิ่งที่ OP ของคำถามปัจจุบันพยายามหาคือเครื่องมือหรือลูกเล่นทางเรขาคณิต (ตรีโกณมิติ ฯลฯ ) เพื่อวาดเวกเตอร์ P1 และ P2 บนรูปนั้นโดยมีเพียงเวกเตอร์ X และ Y ตามที่กำหนด
ttnphns

1
@ttnphns ไม่สำคัญว่าจุดเริ่มต้นคืออะไร: ครึ่งแรกของคำตอบนี้แสดงให้เห็นว่าคุณสามารถลด cloudจุดใดจุดหนึ่งให้เป็นคู่ของจุดที่มีข้อมูลทั้งหมดเกี่ยวกับ . ครึ่งหลังแสดงให้เห็นว่าจุดคู่นั้นไม่เหมือนกัน แต่อย่างไรก็ตามแต่ละจุดนั้นอยู่บนวงรีเดียวกัน มันจะช่วยให้การก่อสร้างที่ชัดเจนของการเริ่มต้นวงรีที่มีใด ๆตัวแทนสองจุด (เช่นคู่ของเวกเตอร์สีฟ้าแสดงในคำถาม) แกนหลักและแกนรองทำให้ได้โซลูชัน PCA (เวกเตอร์สีแดง) X X X XXXXXX
whuber

1
ขอบคุณฉันเริ่มเข้าใจความคิดของคุณ (ฉันหวังว่าคุณจะเพิ่มคำบรรยาย / บทสรุปในคำตอบของคุณเกี่ยวกับ "ครึ่งหนึ่ง" ของมันเพียงเพื่อจัดโครงสร้างสำหรับผู้อ่าน)
ttnphns
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.