ครอบครัวเอ็กซ์โพเนนเชียล: พบกับสถิติที่เพียงพอที่คาดหวัง


10

คำถามของฉันเกิดขึ้นจากการอ่านการอ่านของ Minka "การประมาณการแจกแจงดีริชเลต์"ซึ่งระบุสิ่งต่อไปนี้โดยไม่มีข้อพิสูจน์ในบริบทของการหาตัวประมาณความน่าจะเป็นสูงสุดสำหรับการแจกแจงไดริชเล็ตจากการสังเกตเวกเตอร์สุ่ม

เช่นเดียวกับตระกูลเอ็กซ์โพเนนเชียลเมื่อการไล่ระดับสีเป็นศูนย์สถิติเพียงพอที่คาดหวังจะเท่ากับสถิติที่เพียงพอที่สังเกตได้

ฉันไม่เห็นการประเมินความเป็นไปได้สูงสุดในตระกูลเอ็กซ์โปเนนเชียลที่นำเสนอด้วยวิธีนี้และฉันไม่พบคำอธิบายที่เหมาะสมในการค้นหาของฉัน ใครบางคนสามารถให้ข้อมูลเชิงลึกเกี่ยวกับความสัมพันธ์ระหว่างสถิติที่สังเกตและคาดว่าเพียงพอและอาจช่วยให้เข้าใจการประมาณค่าความน่าจะเป็นสูงสุดในการลดความแตกต่างได้

คำตอบ:


11

นี่เป็นการยืนยันตามปกติเกี่ยวกับตระกูลเอ็กซ์โปเนนเชียล แต่ในความคิดของฉันส่วนใหญ่จะระบุไว้ในลักษณะที่อาจสร้างความสับสนให้กับผู้อ่านที่มีประสบการณ์น้อยกว่า เพราะนำมาซึ่งมูลค่าตามจริงมันอาจตีความได้ว่าการพูดว่า "ถ้าตัวแปรสุ่มของเราตามการแจกแจงในตระกูลเอ็กซ์โพเนนเชียลถ้าเรานำตัวอย่างและใส่เข้าไปในสถิติที่เพียงพอเราจะได้ค่าตามจริงที่คาดหวังของสถิติ " ถ้าเพียง แต่มันเป็นอย่างนั้น ... มากกว่านั้นไม่ได้คำนึงถึงขนาดของตัวอย่างซึ่งอาจทำให้เกิดความสับสนต่อไป

ฟังก์ชันความหนาแน่นเลขชี้กำลังคือ

(1)fX(x)=h(x)eη(θ)T(x)eA(θ)

ที่เป็นสถิติที่เพียงพอT(x)

เนื่องจากนี่คือความหนาแน่นจึงต้องรวมเข้ากับความสามัคคีดังนั้น (คือการสนับสนุนของ )SxX

(2)Sxh(x)eη(θ)T(x)eA(θ)dx=1

อีคิว ถือสำหรับเพื่อให้เราสามารถแยกความแตกต่างของทั้งสองฝ่ายด้วยความเคารพ:(2)θ

(3)θSxh(x)eη(θ)T(x)eA(θ)dx=(1)θ=0

เราได้รับลำดับของความแตกต่างและบูรณาการ

(4)Sxθ(h(x)eη(θ)T(x)eA(θ))dx=0

ดำเนินการตามความแตกต่างที่เรามี

(5)θ(h(x)eη(θ)T(x)eA(θ))=fX(x)[T(x)η(θ)A(θ)]

การแทรกเข้าไปเราได้(5)(4)

SxfX(x)[T(x)η(θ)A(θ)]dx=0

(6)η(θ)E[T(X)]A(θ)=0E[T(X)]=A(θ)η(θ)

ตอนนี้เราถาม: ด้านซ้ายมือของเป็นจำนวนจริง ดังนั้นทางด้านขวามือด้านข้างยังต้องเป็นตัวเลขที่จริงและไม่ได้ฟังก์ชั่น ดังนั้นมันจะต้องได้รับการประเมินที่เฉพาะเจาะจงและมันควรจะเป็น "ความจริง"มิฉะนั้นซ้ายมือด้านที่เราจะไม่ได้คาดว่ามูลค่าที่แท้จริงของ(X) เพื่อเน้นสิ่งนี้เราแสดงถึงคุณค่าที่แท้จริงโดยและเราเขียนใหม่เป็น(6)θθT(X)θ0(6)

(6a)Eθ0[T(X)]=A(θ)η(θ)|θ=θ0

ตอนนี้เราหันมาใช้การประมาณความเป็นไปได้สูงสุดแล้ว โอกาสในการบันทึกสำหรับตัวอย่างของขนาดคือn

L(θx)=i=1nlnh(xi)+η(θ)i=1nT(xi)nA(θ)

การตั้งค่าอนุพันธ์ของมันเทียบกับเท่ากับเราได้ MLEθ0

(7)θ^(x):1ni=1nT(xi)=A(θ)η(θ)|θ=θ^(x)

เปรียบเทียบกับ(6a)ด้านขวามือไม่เท่ากันเนื่องจากเราไม่สามารถยืนยันได้ว่าตัวประมาณค่า MLE นั้นกระทบกับมูลค่าที่แท้จริง ด้านซ้ายมือก็เช่นกัน แต่จำไว้ว่า eq ถือครองสำหรับและดังนั้นสำหรับเช่นกัน ดังนั้นขั้นตอนใน eq สามารถดำเนินการกับและเพื่อให้เราสามารถเขียน eq สำหรับ :(7)(6a)2 θθ^3,4,5,6θ^6aθ^

(6b)Eθ^(x)[T(X)]=A(θ)η(θ)|θ=θ^(x)

ซึ่งเมื่อรวมกับจะทำให้เรามีความสัมพันธ์ที่ถูกต้อง(7)

Eθ^(x)[T(X)]=1ni=1nT(xi)

ซึ่งเป็นสิ่งที่ยืนยันภายใต้การตรวจสอบจริง ๆ พูดว่า: ค่าคาดหวังของสถิติเพียงพอภายใต้ MLE สำหรับพารามิเตอร์ที่ไม่รู้จัก (ในคำอื่น ๆ มูลค่าของช่วงเวลาดิบครั้งแรกของการกระจายที่เราจะได้รับถ้าเราใช้ในสถานที่ของ ) เท่ากับ (และมันไม่ได้เป็นเพียงแค่ประมาณ) เดอะเฉลี่ยของสถิติที่เพียงพอตามที่คำนวณจากตัวอย่างx θ^(x)θx

ยิ่งกว่านั้นถ้าขนาดตัวอย่างคือเราก็สามารถพูดได้อย่างแม่นยำว่า "ค่าคาดหวังของสถิติที่เพียงพอภายใต้ MLE เท่ากับสถิติที่เพียงพอ"n=1


คุณช่วยอธิบายเพิ่มเติมได้ไหมว่าทำไมการเปลี่ยนจาก 6a ถึง 6b นั้นใช้ได้โปรด?
Theoden

1
@ Theoden ในระหว่าง eq และฉันเขียน "eq.ถือสำหรับ " ทั้งหมด - และดังนั้นสำหรับด้วย ดังนั้นขั้นตอนทั้งหมดใน eq สามารถนำมาด้วยความเคารพ\ ฉันพูดคำนี้ซ้ำในข้อความเพื่อความชัดเจน (2)(3)(2) θθ^3,4,5,6θ^
Alecos Papadopoulos

@AlcosPapadopoulos ข้อพิสูจน์ของคุณด้านล่างดูเหมือนจะแนะนำว่าสิ่งที่คุณพูดตอนเริ่มต้น - "ถ้าตัวแปรสุ่มของเราติดตามการแจกแจงในตระกูลเลขชี้กำลังแล้วถ้าเรานำตัวอย่างและใส่ลงในสถิติที่เพียงพอเราจะได้ค่าที่คาดหวังจริง ของสถิติ "เป็นจริง ฉันหมายความว่าฉันสามารถทำเช่นนั้นได้ตลอดเวลาสำหรับ (2) แทนที่ด้วยสถิติที่สังเกตได้เพียงพอและรับผล ฉันหายไปนี่อะไร ฉันไม่เข้าใจเลย
user10024395

@ user136266 จริงคาดว่าค่าตัวของสถิติเป็นและเพื่อที่จะนำไปคำนวณหนึ่งความต้องการที่จะรู้ว่าโดยที่ไม่รู้จักการออกแบบพารามิเตอร์\ดังนั้นสิ่งที่เราสามารถทำได้จริงมีที่คำนวณซึ่งเป็นค่าที่คาดหวังของสถิติภายใต้สมมติฐานว่าประมาณการจุดของเราได้ตีมูลค่าที่แท้จริง 6aθ6b
Alecos Papadopoulos

1
คุณช่วยอธิบายได้ไหมว่าทำไมเราถึงแลกเปลี่ยนลำดับของความแตกต่างและการรวมเป็น eq (3) ได้ไหม
Markus777
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.