การหาค่าเฉลี่ยที่แท้จริงจากการสังเกตที่มีเสียงดัง


13

ฉันมีชุดข้อมูลขนาดใหญ่ของฟอร์ม (mean, stdev) ฉันต้องการลดสิ่งนี้ให้เป็นค่าเฉลี่ยเดียว (ดีกว่า) และส่วนเบี่ยงเบนมาตรฐานขนาดเล็ก (หวังว่า)

เห็นได้ชัดว่าฉันสามารถคำนวณอย่างไรก็ตามเรื่องนี้ไม่ได้ใช้เวลาในบัญชีความจริงที่ว่าบางส่วนของจุดข้อมูลที่ถูกต้องอย่างมีนัยสำคัญมากกว่าคนอื่น ๆdatameanN

เพื่อให้ง่ายฉันต้องการ preform น้ำหนักเฉลี่ยของจุดข้อมูลเหล่านี้ แต่ไม่ทราบว่าฟังก์ชันน้ำหนักควรอยู่ในรูปของค่าเบี่ยงเบนมาตรฐาน

คำตอบ:


24

คุณค้นหาตัวประมาณเชิงเส้นสำหรับค่าเฉลี่ยของแบบฟอร์มμ

μ^=i=1nαixi

ที่เป็นน้ำหนักและx ฉันเป็นข้อสังเกต วัตถุประสงค์คือเพื่อหาค่าที่เหมาะสมสำหรับน้ำหนัก ให้σ ฉันเป็นจริงเบี่ยงเบนมาตรฐานของx ผมซึ่งอาจจะหรืออาจจะไม่ตรงกับการประมาณค่าเบี่ยงเบนมาตรฐานคุณมีแนวโน้มที่จะมี สมมติว่าการสังเกตนั้นไม่เอนเอียง นั่นคือความคาดหวังของพวกเขาทั้งหมดเท่ากับค่าเฉลี่ยμ ในแง่เหล่านี้เราสามารถคำนวณว่าความคาดหวังของμคือαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

และ (หากไม่มีส่วนเกี่ยวข้อง) ความแปรปรวนของตัวประมาณนี้คือxi

Var[μ^]=i=1nαi2σi2.

ณ จุดนี้หลายคนต้องการให้ตัวประมาณมีความเป็นกลาง นั่นคือเราต้องการความคาดหวังให้เท่ากับค่าเฉลี่ยที่แท้จริง นี่แสดงถึงน้ำหนักที่จะต้องรวมกับความสามัคคี ภายใต้ข้อ จำกัด นี้ความถูกต้องของเครื่องประมาณ (ตามที่วัดได้ด้วยค่าคลาดเคลื่อนกำลังสอง) ถูกปรับให้เหมาะสมโดยลดความแปรปรวนให้น้อยที่สุด วิธีการแก้ปัญหาที่ไม่ซ้ำกัน (ที่ได้รับได้อย่างง่ายดายด้วยตัวคูณ Lagrange หรือโดยการตีความสถานการณ์ทางเรขาคณิตเป็นปัญหาระยะลด) คือการที่น้ำหนักจะต้องได้สัดส่วนกับ1 / σ 2ฉัน αi1/σi2 ข้อ จำกัด sum-to-unity ตรึงค่าลงและให้ผล

μ^=i=1nxi/σi2i=1n1/σi2

และ

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

ในคำ,

1/n

σi


1
และเกี่ยวข้องกับคำตอบนี้เช่นกันจาก whuber: stats.stackexchange.com/questions/9071/…
Henry

xi
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.