ML ประมาณค่าการแจกแจงเอ็กซ์โปเนนเชียล (พร้อมข้อมูลเซ็นเซอร์)


9

ในการวิเคราะห์การเอาตัวรอดคุณจะถือว่าเวลาการอยู่รอดของ rvมีการแจกแจงแบบเอ็กซ์โพเนนเชียล พิจารณาว่าตอนนี้ฉันมี "ผล" ของ IID RV ของx_iมีเพียงบางส่วนของผลลัพธ์เหล่านี้ที่จริงแล้ว "รับรู้เต็มที่" เช่นการสังเกตที่เหลือยังคง "มีชีวิตอยู่"Xix1,,xnXi

ถ้าฉันต้องการทำการประมาณ ML สำหรับพารามิเตอร์ rateของการกระจายฉันจะใช้การสังเกตการณ์ที่ไม่ได้รับรู้ในลักษณะที่สอดคล้อง / เหมาะสมได้อย่างไร ฉันเชื่อว่าพวกเขายังคงมีข้อมูลที่เป็นประโยชน์สำหรับการประเมินλ

ใครช่วยแนะนำฉันเกี่ยวกับวรรณกรรมในหัวข้อนี้ ฉันแน่ใจว่ามันมีอยู่ อย่างไรก็ตามฉันมีปัญหาในการค้นหาคำหลัก / คำค้นหาที่ดีสำหรับหัวข้อ


3
ดังนั้นคุณกำลังบอกว่าจากตัวแปรสุ่มตัวที่คุณมีการวัดบอกว่าการสังเกตแสดงถึงความยาวตลอดชีวิต (สรุปแล้ว) (เพราะตัวแปรสุ่มที่เกี่ยวข้องนั้นเป็น "ตาย" ในเวลาวัด) ในขณะที่ส่วนที่เหลือการสังเกตคือความยาวการเอาชีวิตรอดของตัวแปรสุ่มที่ยังมีชีวิตอยู่ ณ เวลาที่วัด? ( )nn1<nn2<nn1+n2=n
Alecos Papadopoulos

1
นี่เป็นรูปแบบที่ถูกตัดทอนตัวแปรสุ่ม "มีชีวิต" ที่ถูกตัดทอนเมื่อการสังเกตหยุดลง
ซีอาน

1
ตรวจสอบโมเดล Tobitสำหรับข้อมูลที่ถูกตัดทอนและแหล่งที่เกี่ยวข้อง (เช่นที่นี่ )
Richard Hardy

2
คุณดูเหมือนจะมีข้อมูลการตรวจสอบเช่นเดียวกับชีวิตที่บางคนเสียชีวิต แต่บางคนยังมีชีวิตอยู่ taht เช่นคุณจะรู้ว่าการพูด,สำหรับบางคนคงรู้จักกันt_ixi>titi
kjetil b halvorsen

3
ระวังความแตกต่างเล็กน้อยบางครั้งระหว่างสองสถานการณ์ ไม่ใช่เรื่องแปลกที่การตัดจะสับสนสำหรับการเซ็นเซอร์และในทางกลับกัน
Alecos Papadopoulos

คำตอบ:


17

คุณยังสามารถประมาณพารามิเตอร์โดยใช้โอกาสในการโดยตรง ให้การสังเกตเป็น ด้วยการแจกแจงแบบเอ็กซ์โพเนนเชียลที่มีอัตราและไม่ทราบ ฟังก์ชันความหนาแน่นคือ , ฟังก์ชันการแจกแจงสะสมและฟังก์ชันหางx} สมมติว่าการสังเกตแรกนั้นถูกสังเกตอย่างสมบูรณ์ในขณะที่สำหรับเรารู้เพียงว่าสำหรับค่าคงที่บวกที่รู้จักบางตัวx1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj. เช่นเคยความน่าจะเป็นคือ "ความน่าจะเป็นของข้อมูลที่สังเกตได้" สำหรับการตรวจสอบการสังเกตที่ได้รับจากดังนั้นฟังก์ชันโอกาสทั้งหมดคือ ฟังก์ชัน loglikelihood จะกลายเป็น ซึ่งมีรูปแบบเดียวกับ loglikelihood สำหรับกรณีปกติสังเกตอย่างสมบูรณ์ยกเว้นจากคำแรกใน สถานที่ของnการเขียนสำหรับค่าเฉลี่ยของการสังเกตและเวลาในการเซ็นเซอร์ตัวประมาณความน่าจะเป็นสูงสุดของจะกลายเป็นP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλλ^=rnTซึ่งคุณสามารถเปรียบเทียบกับกรณีที่สังเกตได้อย่างสมบูรณ์
 EDIT   

เพื่อพยายามตอบคำถามในความคิดเห็น: หากการสังเกตทั้งหมดถูกเซ็นเซอร์นั่นคือเราไม่ได้รอนานพอที่จะสังเกตเหตุการณ์ใด ๆ (ความตาย) เราจะทำอะไรได้บ้าง ในกรณีที่ดังนั้น loglikelihood จะกลายเป็น นั่นคือมันเป็นเส้นตรงลดลง\ดังนั้นค่าสูงสุดต้องเป็น ! แต่ศูนย์ไม่ใช่ค่าที่ถูกต้องสำหรับพารามิเตอร์ rateเนื่องจากไม่สอดคล้องกับการแจกแจงเอ็กซ์โปเนนเชียลใด ๆ เราต้องสรุปว่าในกรณีนี้ไม่มีตัวประมาณความน่าจะเป็นสูงสุด! บางทีเราอาจลองสร้างช่วงความมั่นใจบางอย่างสำหรับr=0

l(λ)=nTλ
λλ=0λλขึ้นอยู่กับฟังก์ชั่น loglikelihood นั้น? เพื่อที่ดูด้านล่าง

แต่ในกรณีใด ๆ ข้อสรุปที่แท้จริงจากข้อมูลในกรณีนั้นคือเราควรรอเวลามากขึ้นจนกว่าเราจะได้รับเหตุการณ์บางอย่าง ...

นี่คือวิธีที่เราสามารถสร้างช่วงความมั่นใจ (ด้านเดียว) สำหรับในกรณีที่การสังเกตทั้งหมดได้รับการตรวจสอบ ฟังก์ชันความน่าจะเป็นในกรณีนี้คือซึ่งมีรูปแบบเดียวกันกับฟังก์ชันความน่าจะเป็นจากการทดลองแบบทวินามที่เราได้รับความสำเร็จทั้งหมดซึ่งก็คือ (ดูช่วงความเชื่อมั่นรอบประมาณการทวินามของ 0 หรือ 1 ) ในกรณีที่เราต้องการช่วงความเชื่อมั่นด้านเดียวสำหรับของแบบฟอร์ม1] จากนั้นเราก็จะได้รับช่วงเวลาสำหรับโดยการแก้Tλอี-λnTพีnพี[พี¯,1]λเข้าสู่ระบบพี=-λT

เราได้รับความเชื่อมั่นสำหรับโดยการแก้ เพื่อให้0.95 สิ่งนี้ให้ช่วงความมั่นใจในที่สุดสำหรับ : พี

P(X=n)=พีn0.95    (พูด)
nเข้าสู่ระบบพีเข้าสู่ระบบ0.95λ
λ-เข้าสู่ระบบ0.95nT.

1
การอ่านคำถามและคำตอบฉันคิดว่า "จะเป็นเช่นไรหากการสังเกตทั้งหมดเป็นประเภทที่สองซึ่งเรารู้เพียงว่าและไม่มีการสังเกตใด ๆ ที่สมบูรณ์" มันจะมีประโยชน์มากที่จะรวมกรณีนี้ให้กับคำตอบของคุณด้วยเช่นกันเป็นส่วนขยาย xJ>เสื้อJ
Alecos Papadopoulos
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.