ฉันพยายามที่จะเข้าใจว่าการทำงานของฟังก์ชั่นมีอิทธิพลอย่างไร มีคนอธิบายได้ในบริบทของการถดถอย OLS แบบง่าย ๆ
ที่ฉันต้องการฟังก์ชั่นที่มีอิทธิพลสำหรับ\
ฉันพยายามที่จะเข้าใจว่าการทำงานของฟังก์ชั่นมีอิทธิพลอย่างไร มีคนอธิบายได้ในบริบทของการถดถอย OLS แบบง่าย ๆ
ที่ฉันต้องการฟังก์ชั่นที่มีอิทธิพลสำหรับ\
คำตอบ:
ฟังก์ชั่นมีอิทธิพลต่อการมีพื้นเป็นเครื่องมือวิเคราะห์ที่สามารถใช้ในการประเมินผล (หรือ "อิทธิพล") ในการลบข้อสังเกตเกี่ยวกับคุณค่าของสถิติที่โดยไม่ต้องใหม่คำนวณว่าสถิติ พวกเขายังสามารถใช้ในการสร้างการประมาณค่าความแปรปรวนแบบซีโมติก หากมีอิทธิพลเท่ากับแล้วแปรปรวน asymptotic เป็น{n}ฉัน2
วิธีที่ฉันเข้าใจฟังก์ชั่นอิทธิพลมีดังนี้ คุณมีอะไรบางอย่าง CDF ทฤษฎีแสดงโดย{i}) สำหรับ OLS แบบง่ายคุณมี
Φ(Z)σ2S(F)FFF(ฉัน)(Z)=(1+ζ)F(Z)-ζδ(ฉัน)(Z)δฉัน(Z)=ฉัน(Yฉัน<z)ζ=1
โปรดทราบว่าดังนั้นเราจึงได้รับ: S [ F ( i ) ( z , ζ ) ] ≈ S [ F ( z ) ] + ζ [ ∂ S [ F ( i ) ( z , ζ ) ]
อนุพันธ์ย่อยที่นี่เรียกว่าฟังก์ชันอิทธิพล ดังนั้นนี่จึงหมายถึงการแก้ไข "ลำดับแรก" โดยประมาณที่จะทำกับสถิติเนื่องจากการลบการสังเกต "ith" โปรดทราบว่าในการถดถอยส่วนที่เหลือไม่ได้ไปที่ศูนย์ asymtotically ดังนั้นนี่เป็นการประมาณการเปลี่ยนแปลงที่คุณอาจได้รับ ตอนนี้เขียนเป็น:
ดังนั้นเบต้าเป็นหน้าที่ของสองสถิติ: ความแปรปรวนของ X และความแปรปรวนร่วมระหว่าง X และ Y สถิติทั้งสองนี้มีการแสดงในแง่ของ CDF เป็น:
v a r ( X ) = ∫ ( X - μ x ( F ) ) 2 d F μ x = ∫ x d F
ในการลบการสังเกต ith เราจะแทนที่ในทั้งอินทิกรัลเพื่อให้:
ไม่สนใจเงื่อนไขของและทำให้เราเข้าใจง่ายขึ้น: ในทำนองเดียวกันสำหรับความแปรปรวนร่วม
ดังนั้นตอนนี้เราสามารถแสดงเป็นหน้าที่ของ\นี่คือ:
ตอนนี้เราสามารถใช้ซีรี่ส์ Taylor:
ทำให้สิ่งนี้ง่ายขึ้น:
และเสียบค่าสถิติ , , , และเราได้รับ:
และคุณสามารถดูว่าผลกระทบของการลบการสังเกตเพียงครั้งเดียวสามารถประมาณได้อย่างไรโดยไม่ต้องปรับโมเดลให้เหมาะสม นอกจากนี้คุณยังสามารถดูวิธีการที่ x เท่ากับค่าเฉลี่ยมีอิทธิพลต่อความลาดชันของเส้นไม่มี คิดเกี่ยวกับสิ่งนี้และคุณจะเห็นว่ามันสมเหตุสมผล คุณยังสามารถเขียนได้อย่างชัดเจนมากขึ้นในแง่ของค่ามาตรฐาน (ในทำนองเดียวกันสำหรับ y):
นี่คือวิธีทั่วไปสุดยอดในการพูดคุยเกี่ยวกับฟังก์ชั่นอิทธิพลของการถดถอย ครั้งแรกฉันจะจัดการวิธีหนึ่งในการนำเสนอฟังก์ชั่นอิทธิพล:
สมมติว่าคือการกระจายบน\ฟังก์ชันการกระจายปนเปื้อน ,สามารถกำหนดเป็น: ที่เป็นตัวชี้วัดความน่าจะเป็นในซึ่งน่าจะเป็น 1 กำหนดให้และ 0 ถึงองค์ประกอบอื่น ๆ ทั้งหมดของ\
จากนี้เราสามารถกำหนดฟังก์ชั่นอิทธิพลได้อย่างง่ายดาย:
ฟังก์ชั่นอิทธิพลของที่ ,หมายถึง:
จากที่นี่มันเป็นไปได้ที่จะเห็นว่าฟังก์ชั่นที่มีอิทธิพลเป็นอนุพันธ์กาโตว์ของที่ในทิศทางของ\สิ่งนี้ทำให้การตีความของฟังก์ชั่นอิทธิพล (สำหรับฉัน) ชัดเจนขึ้นเล็กน้อย: ฟังก์ชั่นอิทธิพลจะบอกคุณถึงผลกระทบที่การสังเกตโดยเฉพาะมีต่อตัวประมาณ
การประมาณค่า OLS เป็นวิธีแก้ไขปัญหา:
ลองนึกภาพการกระจายที่ปนเปื้อนซึ่งทำให้มีน้ำหนักเพิ่มขึ้นเล็กน้อยเมื่อสังเกต :
รับเงื่อนไขการสั่งซื้อครั้งแรก:
เนื่องจากฟังก์ชันอิทธิพลเป็นเพียงอนุพันธ์ของ Gateaux เราจึงสามารถพูดได้ว่า:
ที่ ,ดังนั้น:
ตัวอย่างที่ จำกัด ของฟังก์ชันอิทธิพลนี้คือ:
โดยทั่วไปฉันพบกรอบงานนี้ (ทำงานกับฟังก์ชั่นอิทธิพลเป็นอนุพันธ์ของ Gateaux) ง่ายต่อการจัดการ