ทำไมการติดตาม


13

ในโมเดลy=Xβ+ϵเราสามารถประมาณβโดยใช้สมการปกติ:

β^=(XX)1Xy,
และเราจะได้รับ Y =Xβ
y^=Xβ^.

เวกเตอร์ของส่วนที่เหลือประมาณโดย

ϵ^=yXβ^=(IX(XX)1X)y=Qy=Q(Xβ+ϵ)=Qϵ,

ที่

Q=IX(XX)1X.

คำถามของฉันคือวิธีการที่จะได้รับข้อสรุปของ

tr(Q)=np.

คำตอบ:


12

ข้อสรุปนั้นนับขนาดของปริภูมิเวกเตอร์ อย่างไรก็ตามมันไม่เป็นความจริงโดยทั่วไป

คุณสมบัติพื้นฐานที่สุดของการคูณเมทริกซ์แสดงให้เห็นว่าการแปลงเชิงเส้นแทนด้วยเมทริกซ์ตามH=X(XX)X

H2=(X(XX)X)2=X(XX)(XX)(XX)X=H,

การแสดงว่าเป็นผู้ประกอบการฉาย ดังนั้นส่วนประกอบของมัน

Q=1H

(ตามที่ระบุในคำถาม) ยังเป็นตัวดำเนินการฉายภาพ ร่องรอยของคืออันดับของเอช (ดูด้านล่าง) มาจากไหนร่องรอยของQเท่ากับn -ชั่วโมงHhQnh

จากสูตรของมันเป็นที่ชัดเจนว่าคือเมทริกซ์ที่เกี่ยวข้องกับองค์ประกอบของการแปลงเชิงเส้นสองอันJ = ( X X ) - X และXเอง ครั้งแรก ( J ) แปลงnเวกเตอร์Yเข้าไปในพีเวกเตอร์β ที่สอง ( X ) คือการเปลี่ยนแปลงจากR PไปR nกำหนดโดยY = X βH

J=(XX)X
XJnypβ^XRpRny^=Xβ^. อันดับของมันต้องไม่เกินขนาดที่เล็กกว่าของสองมิติซึ่งในการตั้งค่ากำลังสองน้อยที่สุดจะเป็นเสมอ(แต่อาจน้อยกว่าpเมื่อใดก็ตามที่Jไม่อยู่ในอันดับเต็ม) ดังนั้นอันดับขององค์ประกอบH = X Jไม่สามารถเกินอันดับXได้ ข้อสรุปที่ถูกต้องนั้นคือppJH=XJX

หากว่า Jนั้นอยู่ในอันดับเต็มเท่านั้น และโดยทั่วไป n TR ( Q ) n -พี ในกรณีก่อนหน้านี้โมเดลได้รับการกล่าวถึงว่า "สามารถระบุตัวตนได้" (สำหรับค่าสัมประสิทธิ์ของ β )tr(Q)=npJntr(Q)npβ

จะอยู่ในอันดับที่สมบูรณ์หากว่า X Xกลับด้านไม่ได้JXX


การตีความทางเรขาคณิต

หมายถึงการฉายภาพมุมฉากจาก n- vector y (แสดงถึง "การตอบสนอง" หรือ "ตัวแปรตาม") บนพื้นที่ซึ่งถูกทอดโดยคอลัมน์ของ X (แทน "ตัวแปรอิสระ" หรือ "covariates") ความแตกต่าง Q = 1 - Hแสดงให้เห็นว่าจะสลายตัว n -vector yใด ๆให้เป็นผลรวมของเวกเตอร์ y = H ( y ) + Q ( y ) โดยที่ตัวแรกสามารถ "ทำนาย" จาก Xและที่สองตั้งฉากกับมัน . เมื่อ pHnyXQ=1Hny

y=H(y)+Q(y),
Xpคอลัมน์ของสร้างp -dimensional space (นั่นคือไม่ใช่ collinear), อันดับของHคือpและอันดับของQคือn - p , สะท้อนn - pมิติเพิ่มเติมของการเปลี่ยนแปลงในการตอบสนองที่ไม่ได้เป็นตัวแทน ภายในตัวแปรอิสระ การติดตามให้สูตรพีชคณิตสำหรับมิติเหล่านี้XpHpQnpnp

พื้นหลังพีชคณิตเชิงเส้น

ผู้ประกอบการฉายบนปริภูมิเวกเตอร์ (เช่นR n ) คือการแปลงเชิงเส้นP : V V (นั่นคือการendomorphismของV ) เช่นที่P 2 = P สิ่งนี้ทำให้ส่วนเสริมQ = 1 - Pเป็นตัวดำเนินการฉายภาพเช่นกันเพราะVRnP:VVVP2=PQ=1P

Q2=(1P)2=12P+P2=12P+P=Q.

ประมาณการทั้งหมดแก้ไของค์ประกอบของภาพของพวกเขาทุกคนสำหรับเมื่อใดก็ตามที่เราอาจจะเขียนV = P ( W )สำหรับบางW Vดังนั้นW = P ( V ) = P 2 ( V ) = P ( P ( โวลต์) ) = P ( W )vIm(P)v=P(w)wV

w=P(v)=P2(v)=P(P(v))=P(w).

เกี่ยวข้องกับ endomorphism ของVเป็นสอง subspaces: kernel ker ( P ) = { v vPV และรูปภาพ Im ( P ) = { v v

ker(P)={vv|P(v)=0}
ทุกเวกเตอร์วีVสามารถเขียนในรูปแบบ V = W + Uที่ W อิ่ม( P )และยูเคอร์( P ) ดังนั้นเราอาจสร้างพื้นฐาน E Fสำหรับ Vที่ E Ker ( P )และ F Im
Im(P)={vv|wVP(w)=v}.
vV
v=w+u
wIm(P)uKer(P)EFVEKer(P) ) เมื่อ Vเป็นมิติ จำกัด , เมทริกซ์ของ Pในพื้นฐานนี้จะอยู่ในรูปแบบบล็อกเส้นทแยงมุม, กับหนึ่งบล็อก (ตรงกับการกระทำของ Pใน E ) ทั้งหมดศูนย์และอื่น ๆ (สอดคล้องกับการกระทำของ Pใน F ) เท่ากับโดยเมทริกซ์เอกลักษณ์ที่มิติของ Fคือฉ ร่องรอยของ Pคือผลรวมของค่าในแนวทแยงและดังนั้นจึงจะต้องเท่ากับ× 1 = F หมายเลขนี้คืออันดับของFIm(P)VPPEPFffFfPf×1=f : มิติของภาพP

ร่องรอยของเท่ากับร่องรอยของ1 (เท่ากับnมิติของV ) ลบร่องรอยของP1P1nVP

ผลลัพธ์เหล่านี้อาจสรุปได้ด้วยการยืนยันว่าร่องรอยของการฉายเท่ากับอันดับของมัน


ขอบคุณมาก ๆ. ฉันได้เรียนรู้ความรู้มากมายจากคำตอบของคุณ
zhushun0008

19

@Dougal ได้ให้คำตอบแล้ว แต่นี่เป็นอีกคำตอบที่ง่ายกว่าเล็กน้อย

tr(AB)=tr(A)tr(B)

tr(Q)=tr(I)tr(X(XX)1X).
In×ntr(I)=ntr(AB)=tr(BA)
tr(Q)=ntr((XX)1(XX)).
(XX)1(XX)p×pp
tr(Q)=np.

6

npX

X=UΣVTΣRp×pURn×p,VRp×pUTU=VTV=VVT=IpUUTpIn) แล้วก็

X(XTX)1XT=UΣVT(VΣUTUΣVT)1VΣUT=UΣVT(VΣ2VT)1VΣUT=UΣVTVΣ2VTVΣUT=UUT.

U2Rn×npUn=[UU2]

IX(XTX)1XT=UnUnTUUT=Un(In[Ip000])UnT=Un[000Inp]UnT.
QQnppQnp
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.