วิธีการออกกำลังกาย 2.2a.16 ของ“ สถิติที่แข็งแกร่ง: วิธีการที่อยู่บนพื้นฐานของฟังก์ชั่นอิทธิพล”


9

ในหน้า 180 ของสถิติที่แข็งแกร่ง: วิธีการที่ขึ้นอยู่กับฟังก์ชั่นอิทธิพลหนึ่งพบคำถามต่อไปนี้:

  • 16: แสดงว่าสำหรับประมาณค่าสถานที่ค่าคงที่เสมอ {2} ค้นหาขอบเขตบนที่สอดคล้องกันในจุดแยกตัวอย่าง จำกัดทั้งในกรณีที่เป็นเลขคี่หรือเป็นคู่ε12εnnn

ส่วนที่สอง (หลังจากช่วงเวลา) เป็นเรื่องเล็กน้อย (ให้ไว้ก่อน) แต่ฉันไม่สามารถหาวิธีที่จะพิสูจน์ส่วนแรก (ประโยค) ของคำถาม

ในส่วนของหนังสือที่เกี่ยวข้องกับคำถามนี้พบ (p98):

คำจำกัดความ 2: จุดแตกหักตัวอย่าง จำกัดของตัวประมาณที่ตัวอย่างมอบให้โดย:εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

โดยที่ตัวอย่าง(z1,,zn)ได้มาจากการแทนที่m data points xi1,,ximด้วยค่าที่กำหนดเอง y1,,ym.

คำนิยามอย่างเป็นทางการของตัวมันเองทำงานเกือบหนึ่งหน้า แต่สามารถคิดได้ว่าเป็น แม้ว่าจะไม่ได้กำหนดไว้อย่างชัดเจน สามารถเดาได้ว่าตำแหน่งที่ไม่แปรเปลี่ยนหมายความว่าต้องเป็นไปตาม ε

ε=limnεn
Tn
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

ฉัน (ลอง) ตอบคำถามของ whuber ในความคิดเห็นด้านล่าง หนังสือกำหนดตัวประมาณเป็นหลายหน้าเริ่มต้นที่ p82 ฉันพยายามทำซ้ำส่วนหลัก (ฉันคิดว่ามันจะตอบคำถามของ whuber):Tn

สมมติว่าเรามีการสังเกตการณ์หนึ่งมิติซึ่งมีความเป็นอิสระและกระจายตัวเหมือนกัน (iid) การสังเกตเป็นของพื้นที่ตัวอย่างซึ่งเป็นส่วนย่อยของเส้นจริง (บ่อยครั้งที่เพียงแค่เท่ากับตัวเองดังนั้นการสังเกตอาจมีค่าใด ๆ ) แบบจำลองพารามิเตอร์ประกอบด้วยตระกูลการแจกแจงความน่าจะเป็นบนพื้นที่ตัวอย่างโดยที่พารามิเตอร์ที่ไม่รู้จักเป็นของพื้นที่พารามิเตอร์บางตัว(X1,,Xn)HRHRFθθΘ

...

เราระบุตัวอย่างด้วยการแจกแจงเชิงประจักษ์โดยไม่สนใจลำดับของการสังเกต (ดังที่ทำเกือบทุกครั้ง) อย่างเป็นทางการมอบให้โดย ที่เป็นมวล 1 จุดในXในฐานะที่เป็นประมาณของเราจะพิจารณาสถิติจริงมูลค่า(G_n) ในความหมายที่กว้างขึ้นประมาณการสามารถดูเป็นลำดับของสถิติ หนึ่งสำหรับแต่ละที่เป็นไปได้ขนาดตัวอย่างnเป็นการดีที่การสังเกตการณ์เป็นไอดอลตามสมาชิกของโมเดลพาราเมทริก (X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}n{Fθ;θΘ}แต่คลาส ของการแจกแจงความน่าจะเป็นไปได้ทั้งหมดใน มีขนาดใหญ่กว่ามากF(H)H

เราพิจารณาตัวประมาณซึ่งเป็นฟังก์ชัน [เช่น สำหรับและ ] หรือสามารถแทนที่ด้วยฟังก์ชันแบบเชิงเส้นกำกับ ซึ่งหมายความว่าเราคิดว่ามีการทำงาน [โดยที่โดเมนของคือชุดของการแจกแจงทั้งหมดซึ่ง กำหนด ] เช่นนั้น ในความน่าจะเป็นเมื่อการสังเกตการณ์ Iid ตามการแจกแจงจริงใน(T) เราบอกว่าTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)เป็นค่า asymptotic ของ ที่G{Tn;n1}G

...

ในบทนี้เรามักจะสันนิษฐานว่า functionals ภายใต้การศึกษาคือ Fisher สอดคล้องกัน (Kallianpur และ Rao, 1955): ซึ่งหมายความว่าที่ แบบจำลองตัวประมาณ วัดปริมาณที่เหมาะสม แนวคิดเรื่องความมั่นคงของชาวประมงเหมาะสมกว่าและสง่างามสำหรับฟังก์ชั่นมากกว่าความมั่นคงปกติหรือความไม่เอนเอียง

T(Fθ)=θ for all θΘ
{Tn;n1}


1
หนังสือเล่มนี้อธิบาย "ตัวประมาณค่า" อย่างไร มันดูเหมือนว่าฉันที่ใด ๆล้อมรอบประมาณต้องมีจุดสลายของดังนั้นแน่นอนมันคือการวางชนิดของข้อ จำกัด พิเศษในบาง ; และมีตัวประมาณค่าตำแหน่งคงที่เสมอ (จะรวมค่าคงที่) Tn1Tn
whuber

1
ขอบคุณสำหรับวัสดุที่ขยาย ดูเหมือนว่ายังมีตัวอย่างอยู่มากมาย หนึ่งง่ายๆคือคงประมาณการสำหรับครอบครัวหนึ่งพารามิเตอร์ของการแจกแจงปกติของความแปรปรวน1นี่เป็นตัวประมาณค่าความแปรปรวนของตำแหน่ง จุดสลายของมันคือ1มันเป็นฟิชเชอร์ที่สอดคล้องกัน (เล็กน้อย) แต่ฉันจำเป็นต้องตีความคำจำกัดความอย่างระมัดระวัง: " " ไม่สามารถอ้างถึงพารามิเตอร์ทั้งหมดได้อย่างถูกต้องเพราะตอนนี้ไม่มีตัวประมาณค่าคงที่ของตำแหน่งที่ไม่สอดคล้องกัน! Tn(X1,,Xn)=111θ
whuber

@whuber: ขอบคุณฉันเข้าใจตัวอย่างเคาน์เตอร์ของคุณ ฉันคิดว่าฉันจะติดต่อผู้เขียนและขอข้อมูลเพิ่มเติม ...
user603

คำตอบ:


4

หนังสือสถิติเก่าที่ใช้ "ค่าคงที่" ในวิธีที่แตกต่างกันเล็กน้อยกว่าหนึ่งอาจคาดหวัง; คำศัพท์ที่ไม่ชัดเจนยังคงมีอยู่ เทียบเท่าทันสมัยมากขึ้นคือ "equivariant" (ดูอ้างอิงในตอนท้ายของบทความนี้) ในบริบทปัจจุบันมันหมายถึง

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

สำหรับจริงทั้งหมดคc

หากต้องการตอบคำถามสมมติว่ามีคุณสมบัติที่มีขนาดใหญ่พอจริงทั้งหมดและ ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

เมื่อใดก็ตามที่แตกต่างจากโดยมากที่สุดในพิกัดมากที่สุดYXcm

(นี่คือเงื่อนไขที่อ่อนแอกว่าที่คาดไว้ในคำจำกัดความของ breakdown bound ในความเป็นจริงสิ่งที่เราต้องสมมติคือเมื่อมีขนาดใหญ่พอการแสดงออก " " เป็นค่าที่รับประกันว่าจะน้อยกว่าขนาด 2)no(|c|)|c|/2

การพิสูจน์นั้นเกิดจากความขัดแย้ง สมมติตามที่ว่านี้ยังเป็น equivariant และสมมติว่า1/2 จากนั้นสำหรับขนาดใหญ่พอ ,เป็นจำนวนเต็มซึ่งและ{*} สำหรับจำนวนจริงใด ๆกำหนดTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

โดยที่มี 's และ ' s โดยการเปลี่ยนหรือน้อยกว่าของพิกัดเราสรุปทั้งคู่m(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

และ

|t(a,b)t(a,0)|=o(|b|).

สำหรับความไม่เท่าเทียมกันของสามเหลี่ยมยืนยันc>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

ความไม่เสมอภาคที่เข้มงวดในบรรทัดสุดท้ายจะมั่นใจขนาดใหญ่พอสำหรับnความขัดแย้งที่มันบอกเป็นนัย, , พิสูจน์nc<cε1/2.


อ้างอิง

EL มาห์ทฤษฎีการประเมินจุด John Wiley 1983

ในข้อความ (บทที่ 3 ส่วนที่ 1) และเชิงอรรถประกอบ Lehmann เขียน

เครื่องมือประมาณพอใจสำหรับทั้งหมดจะถูกเรียกว่าequivariant ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

ผู้เขียนบางคนเรียกตัวประมาณว่า "ค่าคงที่" ตั้งแต่นี้แสดงให้เห็นว่าประมาณการยังคงไม่เปลี่ยนแปลงภายใต้ดูเหมือนว่าดีกว่าที่จะขอสงวนคำว่าสำหรับฟังก์ชั่นความพึงพอใจของสำหรับทุกเป็นXi=Xi+au(x+a)=u(x)x,a


1
ใช่ฉันได้ติดต่อผู้เขียนหลักของหนังสือเมื่อวานนี้ด้วยคำถามเดียวกันเกี่ยวกับคำจำกัดความที่แท้จริงของการแปรปรวนที่ใช้ (ฉันดูในดัชนีและฉันไม่สามารถหาได้ชัดเจนในหนังสือ) ฉันลงคะแนนเพราะฉันคิดว่าคำตอบของคุณเป็นคำตอบที่ถูกต้อง แต่จะให้เวลาผู้เขียนสองสามวันเพื่อให้แน่ใจก่อนที่จะยอมรับ
user603

1
ฉันไม่ได้รับคำตอบจากผู้เขียน แต่ข้อโต้แย้งที่นำเสนอข้างต้น (ในคำตอบและความคิดเห็น) ทำให้ฉันเชื่อว่านี่จะต้องเป็นการตีความที่ถูกต้องของปัญหา
user603
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.