เมทริกซ์การกระจายทั้งหมด (ภายในคลาส + ระหว่างคลาส)


14

ฉันเล่นซอกับวิธี PCA และ LDA และฉันติดอยู่ที่จุดหนึ่งฉันรู้สึกว่ามันง่ายมากจนฉันมองไม่เห็น

เมทริกการกระจายแบบกระจายภายในคลาส ( ) และระหว่างคลาส ( ) ถูกกำหนดเป็น:S BSWSB

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

เมทริกซ์การกระจายทั้งหมดถูกกำหนดเป็น:ST

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

โดยที่ C คือจำนวนคลาสและ N คือจำนวนตัวอย่างเป็นตัวอย่างคือค่าเฉลี่ยของคลาส,คือค่าเฉลี่ยโดยรวมμ i μxμiμ

ในขณะที่พยายามรับฉันมาถึงจุดที่ฉันมี:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

เป็นคำ สิ่งนี้ต้องเป็นศูนย์ แต่ทำไม


อันที่จริง:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
คำตอบก็คือคุณกำลังรวมส่วนเบี่ยงเบนของค่ารอบค่าเฉลี่ยของพวกเขาและผลรวมนั้นเป็นศูนย์ แต่สิ่งที่ได้อย่างแม่นยำเป็น ,และ ? วิธีการที่และเกี่ยวข้องกับและ ? คุณภาพของคำตอบนั้นขึ้นอยู่กับว่าเราคาดเดาได้อย่างแม่นยำเพียงใด แต่คุณกำลังบังคับให้เราต้องคาดเดามากมาย! ผมฉัน μ μ ฉันxmmimmiμμi
whuber

@whuber: คุณถูกต้องทั้งหมดฉันแก้ไขคำถามของฉัน
nimcap

คำตอบ:


8

ถ้าคุณคิด

1Nt=1Nxti=μi

แล้วก็

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

และสูตรถือ คุณจัดการกับคำศัพท์ที่สองในทำนองเดียวกัน


2
(+1) เทอมที่สองซึ่งเป็นทรานสโพสของแรกต้องเป็นศูนย์ :-)
whuber

@whuber ใช่นั่นก็เหมือนกัน :)
mpiktas

สวัสดีฉันไม่เข้าใจว่าทำไมการสันนิษฐานถึงถือได้ว่ามีใครอธิบายได้บ้าง
Mvkt

1
@Mvkt มันไม่ได้เป็นข้อสันนิษฐานเท่าที่นิยามของฉันคิดว่า นั่นคือจะพูดว่า:เป็นค่าเฉลี่ยของการสังเกตในกลุ่มผมผมคาดว่าคำตอบที่ใช้ 'ถือว่า' เพราะ OP ไม่ได้อธิบายสัญกรณ์ดังนั้นเราจึงมีการคาดเดาว่าหมายถึงกลุ่มที่หมายโดย\μ ฉันฉันμ ฉันμiμiiμi
Vincent
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.