ฟังก์ชั่นที่มีอิทธิพลและ OLS


15

ฉันพยายามที่จะเข้าใจว่าการทำงานของฟังก์ชั่นมีอิทธิพลอย่างไร มีคนอธิบายได้ในบริบทของการถดถอย OLS แบบง่าย ๆ

yi=α+βxi+εi

ที่ฉันต้องการฟังก์ชั่นที่มีอิทธิพลสำหรับ\β


2
ยังไม่มีคำถามเฉพาะที่นี่: คุณต้องการดูวิธีการคำนวณฟังก์ชั่นอิทธิพลหรือไม่? คุณต้องการตัวอย่างเชิงประจักษ์ที่เฉพาะเจาะจงหรือไม่? คำอธิบายแบบฮิวริสติกของความหมายของอะไร
whuber

1
หากคุณมองกระดาษ 1986 ของ Frank Critchley "มีอิทธิพลต่อฟังก์ชั่นในองค์ประกอบหลัก" (จำไม่ได้ว่าชื่อที่แน่นอนของกระดาษ) เขากำหนดหน้าที่อิทธิพลสำหรับการถดถอยปกติที่นี่ (ซึ่งอาจจะใช่หรือไม่ใช่พิสูจน์คำตอบของฉันผิด)
ความน่าจะเป็นทางคณิตศาสตร์

คำตอบ:


15

ฟังก์ชั่นมีอิทธิพลต่อการมีพื้นเป็นเครื่องมือวิเคราะห์ที่สามารถใช้ในการประเมินผล (หรือ "อิทธิพล") ในการลบข้อสังเกตเกี่ยวกับคุณค่าของสถิติที่โดยไม่ต้องใหม่คำนวณว่าสถิติ พวกเขายังสามารถใช้ในการสร้างการประมาณค่าความแปรปรวนแบบซีโมติก หากมีอิทธิพลเท่ากับแล้วแปรปรวน asymptotic เป็น{n}ฉัน2II2n

วิธีที่ฉันเข้าใจฟังก์ชั่นอิทธิพลมีดังนี้ คุณมีอะไรบางอย่าง CDF ทฤษฎีแสดงโดย{i}) สำหรับ OLS แบบง่ายคุณมีFi(y)=Pr(Yi<yi)

Φ(Z)σ2S(F)FFF(ฉัน)(Z)=(1+ζ)F(Z)-ζδ(ฉัน)(Z)δฉัน(Z)=ฉัน(Yฉัน<z)ζ=1

Pr(Yi<yi)=Pr(α+βxi+ϵi<yi)=Φ(yi(α+βxi)σ)
โดยที่เป็น CDF มาตรฐานทั่วไปและคือความแปรปรวนของข้อผิดพลาด ตอนนี้คุณสามารถแสดงให้เห็นว่าสถิติใด ๆ ที่จะเป็นฟังก์ชั่นของ CDF นี้ดังนั้นสัญกรณ์ (เช่นฟังก์ชั่นบางส่วนของ ) ตอนนี้สมมติว่าเราเปลี่ยนฟังก์ชั่นโดย "นิด ๆ หน่อย ๆ " เป็นที่ไหนและ{n-1} ดังนั้นหมายถึง CDF ของข้อมูลโดยลบจุดข้อมูล "ith" เราสามารถทำชุดเทย์เลอร์ของΦ(z)σ2S(F)FFF(i)(z)=(1+ζ)F(z)ζδ(i)(z)δi(z)=I(yi<z) F(i)F(i)(z)ζ=0ζ=1n1F(i)F(i)(z)เกี่ยวกับ 0 สิ่งนี้ให้:ζ=0

S[F(i)(z,ζ)]S[F(i)(z,0)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

โปรดทราบว่าดังนั้นเราจึงได้รับ: S [ F ( i ) ( z , ζ ) ] S [ F ( z ) ] + ζ [ S [ F ( i ) ( z , ζ ) ]F(i)(z,0)=F(z)

S[F(i)(z,ζ)]S[F(z)]+ζ[S[F(i)(z,ζ)]ζ|ζ=0]

อนุพันธ์ย่อยที่นี่เรียกว่าฟังก์ชันอิทธิพล ดังนั้นนี่จึงหมายถึงการแก้ไข "ลำดับแรก" โดยประมาณที่จะทำกับสถิติเนื่องจากการลบการสังเกต "ith" โปรดทราบว่าในการถดถอยส่วนที่เหลือไม่ได้ไปที่ศูนย์ asymtotically ดังนั้นนี่เป็นการประมาณการเปลี่ยนแปลงที่คุณอาจได้รับ ตอนนี้เขียนเป็น:β

β=1nj=1n(yjy¯)(xjx¯)1nj=1n(xjx¯)2

ดังนั้นเบต้าเป็นหน้าที่ของสองสถิติ: ความแปรปรวนของ X และความแปรปรวนร่วมระหว่าง X และ Y สถิติทั้งสองนี้มีการแสดงในแง่ของ CDF เป็น:

v a r ( X ) = ( X - μ x ( F ) ) 2 d F μ x = x d F

cov(X,Y)=(Xμx(F))(Yμy(F))dF
และ โดยที่
var(X)=(Xμx(F))2dF
μx=xdF

ในการลบการสังเกต ith เราจะแทนที่ในทั้งอินทิกรัลเพื่อให้:FF(i)=(1+ζ)Fζδ(i)

μx(i)=xd[(1+ζ)Fζδ(i)]=μxζ(xiμx)
Var(X)(i)=(Xμx(i))2dF(i)=(Xμx+ζ(xiμx))2d[(1+ζ)Fζδ(i)]

ไม่สนใจเงื่อนไขของและทำให้เราเข้าใจง่ายขึ้น: ในทำนองเดียวกันสำหรับความแปรปรวนร่วม ζ2

Var(X)(i)Var(X)ζ[(xiμx)2Var(X)]
Cov(X,Y)(i)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]

ดังนั้นตอนนี้เราสามารถแสดงเป็นหน้าที่ของ\นี่คือ:β(i)ζ

β(i)(ζ)Cov(X,Y)ζ[(xiμx)(yiμy)Cov(X,Y)]Var(X)ζ[(xiμx)2Var(X)]

ตอนนี้เราสามารถใช้ซีรี่ส์ Taylor:

β(i)(ζ)β(i)(0)+ζ[β(i)(ζ)ζ]ζ=0

ทำให้สิ่งนี้ง่ายขึ้น:

β(i)(ζ)βζ[(xiμx)(yiμy)Var(X)β(xiμx)2Var(X)]

และเสียบค่าสถิติ , , , และเราได้รับ:μyμxvar(X)ζ=1n1

β(i)βxix¯n1[yiy¯1nj=1n(xjx¯)2βxix¯1nj=1n(xjx¯)2]

และคุณสามารถดูว่าผลกระทบของการลบการสังเกตเพียงครั้งเดียวสามารถประมาณได้อย่างไรโดยไม่ต้องปรับโมเดลให้เหมาะสม นอกจากนี้คุณยังสามารถดูวิธีการที่ x เท่ากับค่าเฉลี่ยมีอิทธิพลต่อความลาดชันของเส้นไม่มี คิดเกี่ยวกับสิ่งนี้และคุณจะเห็นว่ามันสมเหตุสมผล คุณยังสามารถเขียนได้อย่างชัดเจนมากขึ้นในแง่ของค่ามาตรฐาน (ในทำนองเดียวกันสำหรับ y):x~=xx¯sx

β(i)βxi~n1[yi~sysxxi~β]

ดังนั้นเรื่องราวเกี่ยวกับอิทธิพลของจุดข้อมูลเพิ่มเติมหรือไม่ ฉันคุ้นเคยกับการตอบสนองแบบแรงกระตุ้นสำหรับข้อมูลอนุกรมเวลามากขึ้นในบริบททางสถิติอิทธิพลทั้งหมดจะอธิบายโดยผลกระทบเล็กน้อยหรือ (ทางเลือกที่ดีกว่า) ค่าสัมประสิทธิ์เบต้าจากการถดถอยแบบมาตรฐาน ฉันต้องการบริบทมากขึ้นเพื่อตัดสินคำถามและคำตอบ แต่อันนี้ดีฉันคิดว่า (+1 ยังไม่ได้ แต่รอ)
Dmitrij Celov

@dmitrij - นั่นคือสิ่งที่บอกเป็นนัย (หรือสิ่งที่ฉันอนุมาน) จากลิงก์ - มันเกี่ยวกับคุณสมบัติความทนทานของสถิติ ฟังก์ชั่น Influence นั้นทั่วไปมากกว่าจุดข้อมูล 1 จุดเล็กน้อยคุณสามารถกำหนดฟังก์ชันเดลต้าให้เป็นผลรวมของพวกมันอีกครั้ง ฉันคิดว่ามันเป็น "Jacknife ราคาถูก" ในระดับหนึ่ง - เพราะคุณไม่จำเป็นต้องปรับโมเดลให้เหมาะสม
ความน่าจะเป็นทางการ

10

นี่คือวิธีทั่วไปสุดยอดในการพูดคุยเกี่ยวกับฟังก์ชั่นอิทธิพลของการถดถอย ครั้งแรกฉันจะจัดการวิธีหนึ่งในการนำเสนอฟังก์ชั่นอิทธิพล:

สมมติว่าคือการกระจายบน\ฟังก์ชันการกระจายปนเปื้อน ,สามารถกำหนดเป็น: ที่เป็นตัวชี้วัดความน่าจะเป็นในซึ่งน่าจะเป็น 1 กำหนดให้และ 0 ถึงองค์ประกอบอื่น ๆ ทั้งหมดของ\FΣFϵ(x)

Fϵ(x)=(1ϵ)F+ϵδx
δxΣ{x}Σ

จากนี้เราสามารถกำหนดฟังก์ชั่นอิทธิพลได้อย่างง่ายดาย:

ฟังก์ชั่นอิทธิพลของที่ ,หมายถึง: θ^Fψi:XΓ

ψθ^,F(x)=limϵ0θ^(Fϵ(x))θ^(F)ϵ

จากที่นี่มันเป็นไปได้ที่จะเห็นว่าฟังก์ชั่นที่มีอิทธิพลเป็นอนุพันธ์กาโตว์ของที่ในทิศทางของ\สิ่งนี้ทำให้การตีความของฟังก์ชั่นอิทธิพล (สำหรับฉัน) ชัดเจนขึ้นเล็กน้อย: ฟังก์ชั่นอิทธิพลจะบอกคุณถึงผลกระทบที่การสังเกตโดยเฉพาะมีต่อตัวประมาณθ^Fδx

การประมาณค่า OLS เป็นวิธีแก้ไขปัญหา:

θ^=argminθE[(YXθ)T(YXθ)]

ลองนึกภาพการกระจายที่ปนเปื้อนซึ่งทำให้มีน้ำหนักเพิ่มขึ้นเล็กน้อยเมื่อสังเกต :(x,y)

θ^ϵ=argminθ(1ϵ)E[(YXθ)T(YXθ)]+ϵ(yxθ)T(yxθ)

รับเงื่อนไขการสั่งซื้อครั้งแรก:

{(1ϵ)E[XTX]+ϵxTx}θ^ϵ=(1ϵ)E[XTY]+ϵxTy

เนื่องจากฟังก์ชันอิทธิพลเป็นเพียงอนุพันธ์ของ Gateaux เราจึงสามารถพูดได้ว่า:

(E[XTX]+xTx)θ^ϵ+E[XTX]ψθ(x,y)=E[XTY]+xTy

ที่ ,ดังนั้น:ϵ=0θ^ϵ=θ^=E[XTX]1E[XTY]

ψθ(x,y)=E[XTX]1xT(yxθ)

ตัวอย่างที่ จำกัด ของฟังก์ชันอิทธิพลนี้คือ:

ψθ(x,y)=(1NiXiTXi)1xT(yxθ)

โดยทั่วไปฉันพบกรอบงานนี้ (ทำงานกับฟังก์ชั่นอิทธิพลเป็นอนุพันธ์ของ Gateaux) ง่ายต่อการจัดการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.