ทำไมแบบจำลองการวิเคราะห์แบบ "แบ่งแยก" ของเกาส์เซียนจึงถูกเรียกว่า


13

แบบจำลองการวิเคราะห์จำแนกแบบเกาส์เรียนรู้แล้วใช้กฎ Bayes เพื่อประเมิน ดังนั้นพวกเขาเป็นแบบจำลองกำเนิด ทำไมจึงเรียกว่าการวิเคราะห์จำแนก ถ้าเป็นเพราะในที่สุดเราก็ได้เส้นโค้งที่แยกแยะระหว่างชั้นเรียนนั่นก็เกิดขึ้นสำหรับทุกรุ่นกำเนิดP ( y | x ) = P ( x | y ) P p r i o r ( y )P(x|y)

P(y|x)=P(x|y)Pprior(y)ΣgYP(x|g)Pprior(g).

คำตอบ:


19

ถ้าคุณหมายถึงLDAฉันจะบอกว่าชื่อการวิเคราะห์การแบ่งแยกเชิงเส้นสามารถอธิบายได้ในอดีตย้อนหลังอย่างน้อยกับบทความของฟิชเชอร์ในปี 1936ซึ่งความรู้ที่ดีที่สุดของฉันนำหน้าคำศัพท์ปัจจุบันและความแตกต่างในการเรียนรู้เครื่องจักรระหว่างการเลือกปฏิบัติและ แบบจำลองกำเนิด ไม่ใช่ฟิชเชอร์ที่เรียกมันว่าการวิเคราะห์จำแนกเชิงเส้นโดยตรง แต่เขาได้ขอฟังก์ชั่นเชิงเส้นสำหรับการเลือกปฏิบัติอย่างชัดเจน ฟิชเชอร์คิดว่าการเลือกปฏิบัติสำหรับข้อมูล Iris ที่มีชื่อเสียงตั้งอยู่ในกระดาษ

ฟิชเชอร์ไม่ได้นำเสนอวิธีการเชิงเส้นสำหรับการเลือกปฏิบัติในรูปแบบกำเนิด เขาค้นหาการรวมกันเชิงเส้น (สำหรับสองคลาส) ที่เพิ่มอัตราส่วนของความแปรปรวนระหว่างกลุ่มให้มากที่สุดกับความแปรปรวนภายในกลุ่มซึ่งไม่จำเป็นต้องมีข้อสมมติปกติ รายละเอียดและความเกี่ยวข้องกับ LDA ในฐานะกฎ Bayes สำหรับโมเดลทั่วไปนั้นสามารถพบได้ในบทที่ 3 ในหนังสือของไบรอัน Ripley ว่า "การจดจำรูปแบบและโครงข่ายประสาท"


2

เป็นเรื่องง่ายในกรณีที่คุณมีสองคลาส GDA ใช้สมมติฐานนี้:(Y=0,Y=1)

  1. P(X|Y=0)N(μ0,Σ0)
  2. P(X|Y=1)N(μ1,Σ1)
  3. P(Y=1)=1P(Y=0)=Φ

จากนั้นรับพารามิเตอร์โดยใช้การประมาณความน่าจะเป็นสูงสุด(μ0,Σ0,μ1,Σ1,Φ)

ดังนั้นมันคือเกาส์เซียนเพราะมันใช้สมมติฐานเกาส์เซียนสำหรับการกระจายภายใน (คุณอาจต้องการใช้เครื่องแบบแทนอดีต) และแยกแยะเพราะมันมีจุดมุ่งหมายเพื่อแยกข้อมูลออกเป็นกลุ่ม

คุณสามารถค้นหาข้อมูลเพิ่มเติมได้ที่นี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.