1
การกระจายค่าประมาณค่าลักษณะเฉพาะสำหรับข้อมูล iid (สม่ำเสมอหรือปกติ)
สมมติว่าฉันมีชุดข้อมูลด้วย ddd ขนาด (เช่น d= 20d=20d=20) เพื่อให้แต่ละมิติคือ iid Xผม∼ คุณ[ 0 ; 1 ]Xi∼U[0;1]X_i \sim U[0;1] (อีกทางหนึ่งแต่ละมิติ Xผม∼ N[ 0 ; 1 ]Xi∼N[0;1]X_i \sim \mathcal N[0;1]) และเป็นอิสระจากกัน ตอนนี้ฉันวาดวัตถุสุ่มจากชุดข้อมูลนี้และรับ k = 3 ⋅ dk=3⋅dk=3\cdot dเพื่อนบ้านที่ใกล้ที่สุดและคำนวณ PCA ในชุดนี้ ตรงกันข้ามกับสิ่งที่เราคาดหวังค่าลักษณะเฉพาะนั้นไม่เหมือนกันทั้งหมด ในเครื่องแบบ 20 มิติผลลัพธ์ทั่วไปจะเป็นดังนี้: 0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198, 0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605, 0.06346159593226684, 0.054527131148532824, …