ตัวประมาณความน่าจะเป็นสูงสุดสำหรับการแจกแจงที่ถูกตัดทอน


28

พิจารณากลุ่มที่เป็นอิสระที่ได้รับจากตัวแปรสุ่มที่จะถือว่าเป็นไปตามการกระจายตัดทอน (เช่นตัดทอนกระจายปกติ ) รู้จักขั้นต่ำ ( จำกัด ) และค่าสูงสุดและแต่ของพารามิเตอร์ที่ไม่รู้จักและ 2 ถ้าตามการกระจายที่ไม่ถูกตัดทอนตัวประมาณค่าความน่าจะเป็นสูงสุดและสำหรับและจากจะเป็นค่าเฉลี่ยตัวอย่างNSXabμ X μ σ 2 μ σ 2 S μ = 1σ2Xμ^σ^2μσ2S σ 2=1μ^=1NiSiและตัวอย่างแปรปรวน 2 อย่างไรก็ตามสำหรับการแจกแจงที่ถูกตัดทอนตัวอย่างความแปรปรวนที่กำหนดในลักษณะนี้จะถูก จำกัด ด้วยดังนั้นจึงไม่ใช่ตัวประมาณที่สอดคล้องกันเสมอ: สำหรับมันไม่สามารถรวมกันในความน่าจะเป็นเมื่อไปที่อนันต์ ดังนั้นดูเหมือนว่าและไม่ใช่ตัวประมาณโอกาสสูงสุดของและสำหรับการแจกแจงที่ถูกตัดทอน แน่นอนว่าต้องมีการคาดการณ์ตั้งแต่และ(-)2σ2>(-)2σ2N μ σ 2μσ2μσ2σ^2=1Ni(Siμ^)2(ba)2σ2>(ba)2σ2Nμ^σ^2μσ2μσ2 พารามิเตอร์ของการแจกแจงแบบปกติที่ถูกตัดทอนไม่ได้เป็นค่าเฉลี่ยและความแปรปรวน

ดังนั้นตัวประมาณค่าความน่าจะเป็นสูงสุดของพารามิเตอร์และของการแจกแจงแบบตัดทอนของค่าต่ำสุดและค่าสูงสุดที่ทราบคืออะไรσμσ


คุณแน่ใจเกี่ยวกับการวิเคราะห์ของคุณหรือไม่ ฉันคิดว่าคุณกำลังทำการสันนิษฐานที่ไม่ถูกต้อง: สำหรับสถานการณ์ที่ถูกตัดทอน MLE ของไม่ใช่ความแปรปรวนตัวอย่างอีกต่อไป (และโดยทั่วไปแล้ว MLE ของนั้นไม่ใช่ค่าเฉลี่ยตัวอย่างอีกต่อไป!) μσ2μ
whuber

whuber: ฉันรู้ว่านี่เป็นคำถามของฉัน: MLEs ของและในกรณีที่ถูกตัดทอนคืออะไร? การเพิ่มประโยคเพื่อยืนยันสิ่งนี้ μσ2μ
a3nm

1
ไม่มีโซลูชันแบบปิด สิ่งที่คุณทำได้คือลดโอกาสในการบันทึก แต่สิ่งนี้มีคุณภาพไม่ต่างจากรุ่นอื่น ๆ เช่นการถดถอยโลจิสติกซึ่งไม่มีวิธีแก้ปัญหาแบบปิด
whuber

whuber: ถ้านี่เป็นเรื่องจริงมันก็น่าผิดหวังอยู่ดี คุณมีข้อมูลอ้างอิงเกี่ยวกับการขาดโซลูชั่นแบบปิดหรือไม่? มีตัวประมาณแบบปิดที่ไม่ได้เป็นโอกาสสูงสุด แต่มีความสอดคล้องอย่างน้อย (และไม่ฝักใฝ่ทางเลือกหรือไม่)
a3nm

1
@whuber: อย่างน้อยคุณสามารถทำให้ตัวอย่างของคุณง่ายขึ้นเป็นสถิติที่เพียงพอเพื่อให้การย่อขนาดนั้นรวดเร็วหรือไม่
Neil G

คำตอบ:


29

พิจารณาใด ๆของครอบครัวที่ตั้งขนาดกำหนดโดย "มาตรฐาน" การกระจาย ,F

ΩF={F(μ,σ):xF(xμσ)σ>0}.

สมมติว่าอนุพันธ์เราพร้อมพบว่าไฟล์ PDF ที่มี\1F1σf((xμ)/σ)dx

การตัดทอนการแจกแจงเหล่านี้เพื่อ จำกัด การสนับสนุนระหว่างและ , , หมายความว่า PDF ถูกแทนที่ด้วยb a < baba<b

f(μ,σ;a,b)(x)=f(xμσ)dxσC(μ,σ,a,b),axb

(และเป็นศูนย์สำหรับค่าอื่น ๆ ทั้งหมดของ ) โดยที่เป็นปัจจัยการทำให้เป็นมาตรฐานที่จำเป็นเพื่อให้แน่ใจว่ารวมเข้ากับความสามัคคี (โปรดทราบว่าคือเหมือนกันในกรณีที่ไม่มีการตัดทอน) โอกาสในการบันทึกสำหรับข้อมูล iidจึงเป็นxC(μ,σ,a,b)=F(μ,σ)(b)F(μ,σ)(a)f(μ,σ;a,b)C1xi

Λ(μ,σ)=i[logf(xiμσ)logσlogC(μ,σ,a,b)].

จุดวิกฤต (รวมถึง minima ทั่วโลก) จะพบที่ใด (กรณีพิเศษที่ฉันจะไม่สนใจที่นี่) หรือการไล่ระดับสีหายไป การใช้ห้อยเพื่อแสดงอนุพันธ์เราอาจคำนวณการไล่ระดับสีอย่างเป็นทางการและเขียนสมการความน่าจะเป็นσ=0

0=Λμ=i[fμ(xiμσ)f(xiμσ)Cμ(μ,σ,a,b)C(μ,σ,a,b)]0=Λσ=i[fσ(xiμσ)σ2f(xiμσ)1σCσ(μ,σ,a,b)C(μ,σ,a,b)]

เนื่องจากและได้รับการแก้ไขให้ปล่อยจากสัญลักษณ์และเขียนเป็นและเป็นซิก) (ไม่มีการตัดทอนฟังก์ชันทั้งสองจะเป็นศูนย์เหมือนกัน) การแยกคำที่เกี่ยวข้องกับข้อมูลจากส่วนที่เหลือให้abnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)

A(μ,σ)=ifμ(xiμσ)f(xiμσ)σ2B(μ,σ)nσ=ifσ(xiμσ)f(xiμσ)

โดยการเปรียบเทียบสิ่งเหล่านี้กับสถานการณ์ที่ไม่มีการตัดทอนมันก็เห็นได้ชัดว่า

  • สถิติที่เพียงพอสำหรับปัญหาดั้งเดิมนั้นเพียงพอสำหรับปัญหาที่ถูกตัดทอน (เนื่องจากด้านขวามือไม่ได้เปลี่ยน)

  • ความสามารถของเราที่จะหาทางแก้ปัญหาปิดรูปแบบขึ้นอยู่กับการจัดการได้ง่ายของและBหากสิ่งเหล่านี้ไม่เกี่ยวข้องกับและด้วยวิธีง่าย ๆ เราไม่สามารถหวังที่จะได้รับโซลูชั่นแบบปิดโดยทั่วไปABμσ

สำหรับกรณีของครอบครัวปกติของหลักสูตรจะได้รับจาก PDF ปกติสะสมซึ่งเป็นความแตกต่างของฟังก์ชั่นข้อผิดพลาด: ไม่มีโอกาสที่วิธีแก้ปัญหาแบบปิดสามารถ ที่ได้รับโดยทั่วไป อย่างไรก็ตามมีเพียงสองสถิติที่เพียงพอ (ค่าเฉลี่ยตัวอย่างและความแปรปรวนจะทำ) และ CDF นั้นราบรื่นที่สุดเท่าที่จะทำได้ดังนั้นการแก้ปัญหาเชิงตัวเลขจึงค่อนข้างง่ายที่จะได้รับC(μ,σ,a,b)


ขอบคุณมากสำหรับคำตอบที่ละเอียดมาก! ฉันไม่แน่ใจว่าฉันได้รับอะไร , ,และเป็นคุณช่วยกำหนดพวกเขา? นอกจากนี้ยังมีความชัดเจน แต่อาจจะแม่นยำบางทีคุณอาจพูดได้ว่านิพจน์ของคุณสำหรับ pdf นั้นใช้สำหรับ (และ pdf นั้นเป็นศูนย์นอกนั้น) ขอบคุณอีกครั้ง! f σ C μ C σ x [ a , b ]fμfσCμCσx[a,b]
a3nm

1
สัญกรณ์ที่ยาวกว่าปกติคือ , ฯลฯ : ตามที่ประกาศไว้มันเป็นอนุพันธ์ ฉันจะทำการเปลี่ยนแปลงครั้งที่สองที่คุณแนะนำเพราะเป็นคำชี้แจงที่สำคัญขอบคุณ Cμ=μC(μ,σ,a,b)
whuber

นอกจากนี้เนื่องจากคำตอบของคุณนั้นกว้างกว่าที่ฉันคาดไว้ฉันจึงแก้ไขคำถามเพื่อยืนยันน้อยลงในกรณีที่มีการแจกแจงแบบปกติ ขอบคุณอีกครั้งสำหรับความพยายามของคุณ
a3nm

1
มันง่ายที่จะอธิบายในระดับทั่วไปเมื่อเทียบกับการมุ่งเน้นไปที่การแจกแจงแบบปกติ! การคำนวณอนุพันธ์และการแสดงรูปแบบที่แม่นยำของ CDF เป็นการรบกวนที่ไม่จำเป็น (แม้ว่าจะมีประโยชน์เมื่อคุณเริ่มเขียนรหัสด้วยวิธีแก้ปัญหาเชิงตัวเลข)
whuber

1
ขอบคุณสำหรับการแก้ไข! คุณพลาดหนึ่งในนั้น คุณสามารถตรวจสอบการแก้ไขของฉันได้ไหม
a3nm
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.