อัปเดต MLE ซ้ำ ๆ เป็นสตรีมการสังเกตใหม่


15

คำถามทั่วไป

บอกว่าเรามีข้อมูล IID , ... \ ซิม f (x \ | \, \ boldsymbol {\ theta}) . สตรีมมิ่งในเราต้องการที่จะซ้ำคำนวณประมาณการความน่าจะเป็นสูงสุดของ\ boldsymbol {\ theta} นั่นคือการคำนวณ \ hat {\ boldsymbol {\ theta}} _ {n-1} = \ underset {\ boldsymbol {\ theta} \ in \ mathbb {R} ^ p} {\ arg \ max} \ prod_ { i = 1} ^ {n-1} f (x_i \, | \, \ boldsymbol {\ theta}) เราสังเกตเห็นx_nใหม่และต้องการที่จะอัปเดตประมาณการของเรา \ hat {\ boldsymbol {\ theta}} _ {n-1}, \, x_n \ to \ hat {\ boldsymbol {\ theta}} _ {n} โดยไม่ต้องเริ่มจากศูนย์ มีอัลกอริทึมทั่วไปสำหรับสิ่งนี้หรือไม่?x1x2f(x|θ)θθ n - 1 = หาเรื่องสูงสุดθ R P n - 1 Πฉัน= 1 F ( x ฉัน

θ^n1=argmaxθRpi=1n1f(xi|θ),
xnθ n - 1 ,
θ^n1,xnθ^n

ตัวอย่างของเล่น

หากx1 , x2 , ... N(x|μ,1)ดังนั้น

μ^n1=1n1i=1n1xiandμ^n=1ni=1nxi,
เพื่อให้
μ^n=1n[(n1)μ^n1+xn].


6
อย่าลืมความผกผันของปัญหานี้: อัปเดตตัวประมาณเนื่องจากข้อสังเกตเก่าจะถูกลบ
Hong Ooi

แบบวนซ้ำกำลังสองน้อยที่สุด (RLS) เป็นวิธีแก้ปัญหา (ที่มีชื่อเสียงมาก) สำหรับตัวอย่างหนึ่งของปัญหานี้ใช่ไหม โดยทั่วไปฉันเชื่อว่าวรรณกรรมการกรองสุ่มอาจมีประโยชน์ในการตรวจสอบ
jhin

คำตอบ:


13

ดูแนวคิดของความพอเพียงและโดยเฉพาะอย่างยิ่งสถิติเพียงพอที่น้อยที่สุด ในหลายกรณีคุณจำเป็นต้องมีตัวอย่างทั้งหมดเพื่อคำนวณการประเมินที่ขนาดตัวอย่างที่กำหนดโดยไม่มีวิธีการเล็กน้อยในการอัปเดตจากตัวอย่างที่มีขนาดเล็กกว่าหนึ่งขนาด (เช่นไม่มีผลลัพธ์ทั่วไปที่สะดวก)

หากการแจกแจงเป็นตระกูลแบบเอ็กซ์โพเนนเชียล (และในบางกรณีนอกจากนั้นเครื่องแบบเป็นตัวอย่างที่เรียบร้อย) มีสถิติที่ดีพอที่สามารถอัปเดตในหลาย ๆ กรณีในลักษณะที่คุณต้องการ (เช่นมีการแจกแจงที่ใช้กันทั่วไปจำนวนมาก อัปเดตอย่างรวดเร็ว)

ตัวอย่างหนึ่งที่ฉันไม่ทราบวิธีโดยตรงในการคำนวณหรืออัปเดตคือการประมาณตำแหน่งของการแจกแจง Cauchy (เช่นด้วยขนาดหน่วยเพื่อทำให้ปัญหาเป็นปัญหาพารามิเตอร์เดียวอย่างง่าย) อาจมีการอัปเดตที่เร็วขึ้น แต่ฉันก็ไม่ได้สังเกตเห็น - ฉันไม่สามารถพูดได้ว่าฉันทำมันได้อย่างรวดเร็วเกินกว่าที่จะพิจารณากรณีการอัปเดต

ในอีกทางหนึ่งด้วย MLE ที่ได้รับผ่านวิธีการเพิ่มประสิทธิภาพเชิงตัวเลขการประเมินก่อนหน้านี้ในหลาย ๆ กรณีอาจเป็นจุดเริ่มต้นที่ดีเนื่องจากโดยทั่วไปการประมาณการก่อนหน้านี้จะใกล้เคียงกับการประมาณการที่อัปเดตแล้วมาก อย่างน้อยก็ควรมีการอัพเดทอย่างรวดเร็ว แม้ว่านี่ไม่ใช่กรณีทั่วไปแม้ว่า - ด้วยฟังก์ชั่นความเป็นไปได้หลายรูปแบบ (อีกครั้งให้ดูตัวอย่าง Cauchy) การสังเกตใหม่อาจนำไปสู่โหมดสูงสุดที่อยู่ห่างจากที่หนึ่งก่อนหน้า (แม้ว่าสถานที่ของแต่ละคน ในโหมดที่ใหญ่ที่สุดไม่ได้เปลี่ยนอะไรมากซึ่งหนึ่งในโหมดที่สูงที่สุดอาจเปลี่ยนแปลงได้)


1
ขอบคุณ! จุดเกี่ยวกับ MLE ที่อาจเป็นไปได้ว่าการสลับโหมดกลางคันมีประโยชน์อย่างยิ่งสำหรับการทำความเข้าใจว่าทำไมสิ่งนี้จึงเป็นเรื่องยากโดยทั่วไป
jcz

1
คุณสามารถเห็นสิ่งนี้ด้วยตัวคุณเองด้วยโมเดล Cauchy ขนาดหน่วยข้างต้นและข้อมูล (0.1,0.11,0.12,2.91,2.91,2.921,2.933) โอกาสในการบันทึกตำแหน่งของโหมดนั้นอยู่ใกล้ 0.5 และ 2.5 และจุดสูงสุดที่สูงขึ้น (เล็กน้อย) คือระดับใกล้ 0.5 ตอนนี้ให้สังเกตต่อไป 10 และโหมดของทั้งสองจุดยอดเคลื่อนแทบจะไม่ย้าย แต่จุดสูงสุดที่สองคือตอนนี้สูงขึ้นอย่างมีนัยสำคัญ การไล่ระดับสีจะไม่ช่วยคุณได้เมื่อมันเกิดขึ้นมันเกือบจะเหมือนกับการเริ่มต้นใหม่ หากประชากรของคุณเป็นส่วนผสมของสองกลุ่มย่อยที่มีขนาดใกล้เคียงกันที่มีสถานที่ต่างกันสถานการณ์ดังกล่าวอาจเกิดขึ้นได้ - ... ctd
Glen_b

ctd ... แม้ในตัวอย่างที่มีขนาดค่อนข้างใหญ่ ในสถานการณ์ที่เหมาะสมการสลับโหมดอาจเกิดขึ้นค่อนข้างบ่อย
Glen_b -Reinstate Monica

n

ใช่ถูกต้อง; ฉันถกเถียงกับตัวเองว่าจะพูดเรื่องนั้นในคำตอบไหม
Glen_b

4

ในการเรียนรู้เครื่องนี้จะเรียกว่าการเรียนรู้ออนไลน์

@Glen_b ชี้ให้เห็นว่ามีกรณีพิเศษที่ MLE สามารถปรับปรุงได้โดยไม่จำเป็นต้องเข้าถึงข้อมูลก่อนหน้านี้ทั้งหมด ในขณะที่เขาชี้ให้เห็นฉันไม่เชื่อว่ามีวิธีการทั่วไปในการค้นหา MLE

วิธีการทั่วไปในการหาวิธีแก้ปัญหาโดยประมาณคือการใช้สิ่งต่าง ๆ เช่นการไล่ระดับสีแบบสุ่ม ในกรณีนี้เมื่อการสังเกตแต่ละครั้งเข้ามาเราคำนวณการไล่ระดับสีด้วยความเคารพต่อการสังเกตการณ์ของบุคคลนี้และย้ายค่าพารามิเตอร์ในปริมาณที่น้อยมากในทิศทางนี้ ภายใต้เงื่อนไขบางประการเราสามารถแสดงให้เห็นว่าสิ่งนี้จะมาบรรจบกันกับย่าน MLE ที่มีความน่าจะเป็นสูง พื้นที่ใกล้เคียงมีความเข้มงวดและเข้มงวดมากขึ้นในขณะที่เราลดขนาดขั้นตอน แต่จำเป็นต้องมีข้อมูลเพิ่มเติมสำหรับการลู่เข้า อย่างไรก็ตามวิธีการสุ่มทั่วไปเหล่านี้ต้องการเล่นซอเพื่อให้ได้ประสิทธิภาพที่ดีกว่าพูดปิดการอัพเดตแบบฟอร์ม

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.