ปัญหาการประมาณค่าที่เป็นไปไม่ได้?


17

คำถาม

ความแปรปรวนของการแจกแจงแบบทวินามลบ (NB) นั้นมากกว่าค่าเฉลี่ยเสมอ เมื่อค่าเฉลี่ยของตัวอย่างมากกว่าความแปรปรวนให้พยายามปรับพารามิเตอร์ของ NB ให้มีความเป็นไปได้สูงสุดหรือประมาณช่วงเวลาที่จะล้มเหลว (ไม่มีวิธีแก้ปัญหาด้วยพารามิเตอร์ จำกัด )

อย่างไรก็ตามเป็นไปได้ว่าตัวอย่างที่นำมาจากการแจกแจงแบบ NB มีความหมายมากกว่าความแปรปรวน นี่คือตัวอย่างที่ทำซ้ำได้ใน R

set.seed(167)
x = rnbinom(100, size=3.2, prob=.8);
mean(x) # 0.82
var(x) # 0.8157576

มีความน่าจะเป็นที่ไม่เป็นศูนย์ที่ NB จะสร้างตัวอย่างซึ่งไม่สามารถประมาณค่าพารามิเตอร์ได้ (โดยความน่าจะเป็นสูงสุดและวิธีการโมเมนต์)

  1. สามารถประมาณค่าที่เหมาะสมสำหรับตัวอย่างนี้ได้หรือไม่?
  2. ทฤษฎีการประมาณค่าพูดว่าอย่างไรเมื่อตัวประมาณไม่ได้ถูกกำหนดไว้สำหรับตัวอย่างทั้งหมด?

เกี่ยวกับคำตอบ

คำตอบของ @MarkRobinson และ @Yves ทำให้ฉันรู้ว่า parametrization เป็นปัญหาหลัก ความหนาแน่นของความน่าจะเป็นของ NB มักจะถูกเขียนเป็น

P(X=k)=Γ(r+k)Γ(r)k!(1p)rpk
หรือ
P(X=k)=Γ(r+k)Γ(r)k!(rr+m)r(mr+m)k.

ภายใต้ตัวแปรที่แรกประมาณการโอกาสสูงสุดคือเมื่อใดก็ตามที่ความแปรปรวนของกลุ่มตัวอย่างที่มีขนาดเล็กกว่าค่าเฉลี่ยดังนั้นไม่มีอะไรที่มีประโยชน์สามารถพูดเกี่ยวกับพีภายใต้สองก็คือเพื่อให้เราสามารถให้ประมาณการที่เหมาะสมของม.ในที่สุดการแสดง @MarkRobinson ว่าเราสามารถแก้ปัญหาของค่าอนันต์โดยใช้แทนR(,0)p(,x¯)mr1+rr

โดยสรุปไม่มีอะไรผิดปกติกับปัญหาการประมาณค่านี้ยกเว้นว่าคุณไม่สามารถตีความและมีความหมายสำหรับทุกตัวอย่างได้เสมอ เพื่อความเป็นธรรมความคิดที่มีอยู่ในคำตอบทั้งสอง ฉันเลือกที่ @MarkRobinson เป็นสิ่งที่ถูกต้องสำหรับการเติมเต็มที่เขาให้prp


มันไม่ถูกต้องที่จะระบุว่าโอกาสสูงสุดล้มเหลวในกรณีเช่นนี้ วิธีการเฉพาะช่วงเวลาอาจประสบปัญหา
ซีอาน

@ ซีอานคุณสามารถขยายหรือไม่ ความน่าจะเป็นของกลุ่มตัวอย่างนี้มีจำนวนมากที่สุดไม่มีในโดเมน (ยังเห็นนี้เป็นต้น) ฉันพลาดอะไรไปรึเปล่า? ไม่ว่าในกรณีใดถ้าคุณสามารถให้ ML โดยประมาณของพารามิเตอร์สำหรับกรณีนี้ฉันจะอัปเดตคำถาม (0,)×(0,1)
gui11aume

1
โอกาสอาจจะมีสูงสุดที่ระยะอนันต์และR ปัญหาที่คล้ายกัน แต่มีการวินิจฉัยที่เรียบง่ายมีไว้สำหรับการกระจายโลแม็กซ์ : มันเป็นที่รู้จักกันว่าประมาณการ ML ของรูปร่างเป็นอนันต์เมื่อตัวอย่างมีค่าสัมประสิทธิ์ของการเปลี่ยนแปลงCV < 1 แต่น่าจะเป็นของเหตุการณ์นี้เป็นบวกสำหรับขนาดของกลุ่มตัวอย่างใด ๆ และค่อนข้างแข็งแกร่งสำหรับการพูดα = 20และn = 200 p0rCV<1α=20n=200
อีฟว์

@ Yves ขอบคุณสำหรับตัวอย่างอื่นนี้ (ซึ่งฉันไม่ได้ตระหนักถึง) ผู้คนทำอะไรในกรณีนี้
gui11aume

2
ในตัวอย่างโลแม็กซ์บางคนจะเลือกที่จะใช้การกระจายชี้แจงซึ่งเป็นข้อ จำกัด สำหรับและλ /อัลฟ่า→การθ > 0 สิ่งนี้จะลดลงเพื่อยอมรับการประเมิน ML ที่ไม่มีที่สิ้นสุด เพื่อความไม่แปรเปลี่ยนโดยการปรับค่าพารามิเตอร์อีกครั้งผมเชื่อว่าพารามิเตอร์ที่ไม่สิ้นสุดสามารถทำให้เข้าใจได้ในบางกรณี ยกตัวอย่างเช่น NB ของคุณเหมือนกันเกิดขึ้นถ้าเราเลือกที่จะใช้การกระจาย Poisson เป็นผลมาจากอาร์พี/ ( 1 - P ) →การ λαλ/αθ>0rp/(1p)λ
Yves

คำตอบ:


11

ป้อนคำอธิบายรูปภาพที่นี่โดยทั่วไปสำหรับตัวอย่างของคุณค่าประมาณของขนาดพารามิเตอร์จะอยู่บนขอบเขตของพื้นที่พารามิเตอร์ เราสามารถพิจารณาการแก้ไขใหม่เช่น d = size / (size + 1); เมื่อ size = 0, d = 0, เมื่อขนาดมีแนวโน้มที่จะไม่มีสิ้นสุด, d เข้าใกล้ 1. ปรากฎว่าสำหรับการตั้งค่าพารามิเตอร์ที่คุณได้รับ, ขนาดโดยประมาณของอินฟินิตี้ (d ใกล้กับ 1) เกิดขึ้นประมาณ 13% ของเวลา Cox-เรดโอกาสปรับรายละเอียด (APL) ประมาณการซึ่งเป็นทางเลือกในการประมาณการ MLE สำหรับ NB (ตัวอย่างที่แสดงที่นี่) การประมาณค่าพารามิเตอร์เฉลี่ย (หรือ 'โพรบ') ดูเหมือนจะโอเค (ดูรูปเส้นสีน้ำเงินเป็นค่าจริงจุดสีแดงคือค่าประมาณสำหรับเมล็ดของคุณ = 167 ตัวอย่าง) รายละเอียดเพิ่มเติมเกี่ยวกับทฤษฎี APL มีที่นี่

ดังนั้นฉันจะบอกว่า 1: การประมาณการพารามิเตอร์ที่ดีสามารถมี .. ขนาด = อนันต์หรือการกระจายตัว = 0 เป็นค่าประมาณที่สมเหตุสมผลเมื่อได้รับตัวอย่าง พิจารณาพื้นที่พารามิเตอร์ที่แตกต่างกันและการประมาณจะ จำกัด


ขอบคุณที่เข้าร่วมเว็บไซต์เพื่อตอบคำถามของฉัน! รายละเอียดของความน่าจะเป็นของโปรไฟล์ที่ปรับแล้วของ Cox-Reid นั้นดูมีแนวโน้มมาก
gui11aume

8

p0rΘ:=(0,1)×(0,)λ>0[p,r]Θp0rrp/(1p)λ

CV<1>0.3α=20n=200

คุณสมบัติ ML ใช้สำหรับขนาดตัวอย่างขนาดใหญ่: ภายใต้เงื่อนไขความสม่ำเสมอการประเมิน ML จะปรากฏขึ้นเพื่อให้มีลักษณะเฉพาะและมีแนวโน้มที่จะเป็นพารามิเตอร์จริง แต่สำหรับขนาดตัวอย่างที่กำหนดขอบเขตการประเมิน ML สามารถล้มเหลวในโดเมนได้เช่นเนื่องจากมีค่าถึงค่าสูงสุดในขอบเขต มันสามารถมีอยู่ในโดเมนที่ใหญ่กว่าโดเมนที่ใช้สำหรับการขยายให้ใหญ่สุด

αλ/αθ>0GPD(σ,ξ)ξ>0ξ^<0ξ^=0

เพื่อความไม่แปรเปลี่ยนโดยการปรับค่าพารามิเตอร์อีกครั้งผมเชื่อว่าพารามิเตอร์ที่ไม่สิ้นสุดสามารถทำให้เข้าใจได้ในบางกรณี

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.