ความโน้มเอียงของ MLE ลดลงเร็วกว่าความแปรปรวนอย่างไร


14

ให้เป็นค่าประมาณโอกาสสูงสุดของพารามิเตอร์จริงของบางรุ่น ขณะที่จำนวนของจุดข้อมูลเพิ่มขึ้นข้อผิดพลาดมักจะลดลงเป็นO (1 / \ sqrt n) การใช้ความไม่เท่าเทียมกันของสามเหลี่ยมและคุณสมบัติของการคาดหวังเป็นไปได้ที่จะแสดงให้เห็นว่าอัตราความผิดพลาดนี้หมายความว่าทั้ง "อคติ" \ lVert \ mathbb E \ hat \ theta - \ theta ^ * \ rVertและ "เบี่ยงเบน" \ lVert \ mathbb E \ hat \ theta - \ hat \ theta \ rVertลดลงที่Oเดียวกัน(1 / \ sqrt {n})θ^θ - θ *O ( 1 / θnθ^θO(1/n)Eθ^θEθ^θ^O(1/n)ประเมินค่า. แน่นอนว่ามันเป็นไปได้สำหรับรุ่นที่มีอคติที่หดตัวในอัตราที่เร็วขึ้น หลายรุ่น (เช่นการถดถอยกำลังสองน้อยสุด) ไม่มีอคติ

ฉันสนใจในรูปแบบที่มีอคติที่หดตัวเร็วกว่าO(1/n)แต่ข้อผิดพลาดที่ไม่หดตัวนี้ในอัตราที่เร็วเพราะส่วนเบี่ยงเบนยังคงหดตัวเป็นO(1/n)n) โดยเฉพาะอย่างยิ่งผมอยากจะรู้ว่าเงื่อนไขที่เพียงพอสำหรับการมีอคติแบบจำลองจะหดตัวลงในอัตราO(1/n)n)


ไม่ ? หรือ? θ^θ=(θ^θ)2
Alecos Papadopoulos

ฉันถูกถามโดยเฉพาะเกี่ยวกับบรรทัดฐาน L2 ใช่ แต่ฉันก็สนใจมาตรฐานอื่น ๆ ด้วยถ้ามันทำให้คำถามตอบง่ายขึ้น
Mike Izbicki

O P ( 1 / n )(θ^θ)2เป็นn) Op(1/n)
Alecos Papadopoulos

ขออภัยฉันอ่านความคิดเห็นของคุณผิด สำหรับกฎเกณฑ์ L2 ในมิติและการบรรจบกันที่อัตรา . ผมเห็นว่าถ้าเรายืดมันแล้วมันจะมาบรรจบกันเป็นn) a - b = d O(1/ab=i=1d(aibi)2O(1/n)O(1/n)O(1/n)
Mike Izbicki

คุณเคยเห็นกระดาษถดถอยของสันเขา (Hoerl & Kennard 1970) ไหม? ฉันเชื่อว่ามันให้เงื่อนไขในเมทริกซ์การออกแบบ + การลงโทษที่คาดว่าจะเป็นจริง
dcl

คำตอบ:


5

โดยทั่วไปแล้วคุณต้องการรุ่นที่ MLE ไม่ปกติแบบไม่แสดงอาการ แต่แปลงเป็นการกระจายอื่น ๆ (และทำได้ในอัตราที่เร็วขึ้น) สิ่งนี้มักจะเกิดขึ้นเมื่อพารามิเตอร์ภายใต้การประมาณอยู่ที่ขอบเขตของพื้นที่พารามิเตอร์ หมายความว่า MLE จะเข้าหาพารามิเตอร์ "จากด้านใดด้านหนึ่งเท่านั้น" ดังนั้นจึง "ปรับปรุงความเร็วในการลู่เข้า" เนื่องจากมันไม่ "เบี่ยงเบนความสนใจ" โดยการ "ย้อนกลับ" รอบพารามิเตอร์

ตัวอย่างมาตรฐานคือ MLE สำหรับในตัวอย่าง iid ของเครื่องแบบ rv ของ MLE MLE ที่นี่เป็นสถิติลำดับสูงสุดU ( 0 , θ )θU(0,θ)

θ^n=u(n)

การกระจายตัวอย่างอัน จำกัด ของมันคือ

Fθ^n=(θ^n)nθn,fθ^=n(θ^n)n1θn

E(θ^n)=nn+1θB(θ^)=1n+1θ

ดังนั้นn) แต่อัตราที่เพิ่มขึ้นเดียวกันจะยังคงสำหรับความแปรปรวนB(θ^n)=O(1/n)

เราสามารถตรวจสอบได้ว่าเพื่อให้ได้การแจกแจงที่ จำกัด เราต้องดูตัวแปร , (เช่นเราต้องขยายด้วย )nn(θθ^n)n

P[n(θθ^n)z]=1P[θ^nθ(z/n)]

=11θn(θ+zn)n=1θnθn(1+z/θn)n

1ez/θ

ซึ่งเป็น CDF ของการแจกแจงเอ็กซ์โปเนนเชียล

ฉันหวังว่านี่จะให้ทิศทาง


นี่กำลังใกล้เข้ามา แต่ฉันสนใจเป็นพิเศษในสถานการณ์ที่ความเอนเอียงลดลงเร็วกว่าความแปรปรวน
Mike Izbicki

2
@MikeIzbicki อืม ... การบรรจบกันของอคติขึ้นอยู่กับช่วงเวลาแรกของการแจกแจงและความแปรปรวน (รากที่สองของ) ยังเป็น "ลำดับที่หนึ่ง" ฉันไม่แน่ใจว่าสิ่งนี้เป็นไปได้ที่จะเกิดขึ้นเพราะดูเหมือนว่ามันจะหมายความว่าช่วงเวลาของการกระจาย จำกัด "เกิดขึ้น" ที่อัตราการบรรจบกันที่ไม่เข้ากัน ... ฉันจะคิดถึงมัน
Alecos Papadopoulos

2

การติดตามความคิดเห็นในคำตอบอื่นของฉัน (และดูอีกครั้งที่ชื่อคำถามของ OP!) นี่เป็นการสำรวจเชิงทฤษฎีที่ไม่เข้มงวดมากของปัญหา

เราต้องการตรวจสอบว่า Biasอาจมีอัตราการคอนเวอร์เจนซ์ที่แตกต่างจากรากที่สองของความแปรปรวนหรือไม่B(θ^n)=E(θ^n)θ

B(θ^n)=O(1/nδ),Var(θ^n)=O(1/nγ),γδ???

เรามี

B(θ^n)=O(1/nδ)limnδE(θ^n)<Klimn2δ[E(θ^n)]2<K

(1)[E(θ^n)]2=O(1/n2δ)

ในขณะที่

Var(θ^n)=O(1/nγ)limnγE(θ^n2)[E(θ^n)]2<M

limn2γE(θ^n2)n2γ[E(θ^n)]2<M

(2)limn2γE(θ^n2)limn2γ[E(θ^n)]2<M

เราเห็นว่าอาจเกิดขึ้นได้หาก (2)

A)ส่วนประกอบทั้งสองเป็น ซึ่งในกรณีนี้เราสามารถมีเพียง\ O(1/n2γ)γ=δ

B)แต่มันก็อาจจะช่วยได้ถ้า

(3)limn2γ[E(θ^n)]20[E(θ^n)]2=o(1/n2γ)

เพื่อให้เข้ากันได้กับเราต้องมี(3)(1)

(4)n2γ<n2δδ>γ

ดังนั้นดูเหมือนว่าโดยหลักการแล้วมันเป็นไปได้ที่จะให้ไบแอสมาบรรจบกันในอัตราที่เร็วกว่าสแควร์รูทของความแปรปรวน แต่เราไม่สามารถหาสแควร์รูทของการแปรปรวนมาบรรจบกันในอัตราที่เร็วกว่าอคติ


คุณจะกระทบยอดสิ่งนี้กับการดำรงอยู่ของตัวประมาณแบบไม่เอนเอียงเหมือนกำลังสองน้อยสุดธรรมดาได้อย่างไร? ในกรณีที่แต่n) B(θ^)=0Var(θ^)=O(1/n)
Mike Izbicki

@MikeIzbicki เป็นแนวคิดของการบรรจบกัน / ใหญ่ -O ใช้ในกรณีนี้หรือไม่? เพราะที่นี่ไม่ใช่ "ทุกอย่าง" ที่จะเริ่มต้นด้วย B(θ^)O()
Alecos Papadopoulos

ในกรณีนี้ดังนั้น0) Eθ^=θB(θ^)=Eθ^θ=0=O(1)=O(1/n0)
Mike Izbicki

@MikeIzbicki แต่ยังหรือหรืออื่น ๆ ที่คุณต้องการจด แล้วอัตราการบรรจบกันที่นี่เป็นเท่าไหร่? B(θ^)=O(n)B(θ^)=O(1/n)
Alecos Papadopoulos

@MikeIzbicki ฉันได้แก้ไขคำตอบของฉันเพื่อแสดงว่าเป็นไปได้ในหลักการที่จะให้อคติมาบรรจบกันได้เร็วขึ้นแม้ว่าฉันจะยังคงคิดว่าตัวอย่าง "zero-bias" เป็นปัญหา
Alecos Papadopoulos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.