ในขณะที่ "องค์ประกอบของการเรียนรู้ทางสถิติ" เป็นหนังสือที่ยอดเยี่ยม แต่ก็ต้องการระดับความรู้ค่อนข้างสูงเพื่อให้ได้ประโยชน์สูงสุดจากมัน มีแหล่งข้อมูลอื่น ๆ มากมายบนเว็บเพื่อช่วยให้คุณเข้าใจหัวข้อในหนังสือ
ให้ยกตัวอย่างง่ายๆของการวิเคราะห์จำแนกเชิงเส้นที่คุณต้องการจัดกลุ่มชุดของจุดข้อมูลสองมิติในกลุ่ม K = 2 มิติการดร็อปจะเป็นเพียง K-1 = 2-1 = 1 ตามที่ @deinst อธิบายแล้วมิติการดร็อปสามารถอธิบายได้ด้วยเรขาคณิตเบื้องต้น
จุดสองจุดในมิติใด ๆ สามารถรวมกันเป็นเส้นได้และเส้นหนึ่งมิติ นี่คือตัวอย่างของ K-1 = 2-1 = 1 สเปซย่อย
ในตัวอย่างง่าย ๆ นี้ชุดของจุดข้อมูลจะกระจัดกระจายในพื้นที่สองมิติ คะแนนจะถูกแทนด้วย (x, y) ดังนั้นตัวอย่างเช่นคุณอาจมีจุดข้อมูลเช่น (1,2), (2,1), (9,10), (13,13) ตอนนี้การใช้การวิเคราะห์จำแนกเชิงเส้นเพื่อสร้างสองกลุ่ม A และ B จะส่งผลให้จุดข้อมูลที่ถูกจัดว่าเป็นของกลุ่ม A หรือกลุ่ม B เช่นว่าคุณสมบัติบางอย่างมีความพึงพอใจ การวิเคราะห์จำแนกเชิงเส้นพยายามที่จะเพิ่มความแปรปรวนระหว่างกลุ่มเมื่อเทียบกับความแปรปรวนภายในกลุ่ม
กล่าวอีกนัยหนึ่งกลุ่ม A และ B จะอยู่ห่างกันและมีจุดข้อมูลที่อยู่ติดกัน ในตัวอย่างง่ายๆนี้มันชัดเจนว่าคะแนนจะถูกจัดกลุ่มดังนี้ กลุ่ม A = {(1,2), (2,1)} และกลุ่ม B = {(9,10), (13,13)}
ตอนนี้เซนทรอยด์จะถูกคำนวณเป็นเซนทรอยด์ของกลุ่มจุดข้อมูล
Centroid of group A = ((1+2)/2, (2+1)/2) = (1.5,1.5)
Centroid of group B = ((9+13)/2, (10+13)/2) = (11,11.5)
Centroids นั้นมีเพียง 2 จุดและมันจะขยายเป็นเส้น 1 มิติซึ่งเชื่อมต่อเข้าด้วยกัน
คุณสามารถคิดถึงการวิเคราะห์จำแนกเชิงเส้นเป็นเส้นโครงของจุดข้อมูลบนเส้นเพื่อให้จุดข้อมูลทั้งสองกลุ่มเป็น "แยกเท่าที่จะเป็นไปได้"
หากคุณมีสามกลุ่ม (และพูดจุดข้อมูลสามมิติ) คุณจะได้สามเซ็นทรอยด์เพียงแค่สามจุดและสามจุดในพื้นที่ 3 มิติกำหนดระนาบสองมิติ กฎอีกครั้ง K-1 = 3-1 = 2 มิติ
ฉันขอแนะนำให้คุณค้นหาเว็บเพื่อหาแหล่งข้อมูลที่จะช่วยอธิบายและขยายการแนะนำง่ายๆที่ฉันได้รับ ตัวอย่างเช่นhttp://www.music.mcgill.ca/~ich/classes/mumt611_07/classifiers/lda_theory.pdf