การแจกแจงแบบใดมีตัวประมาณแบบไม่เอนเอียงสำหรับค่าเบี่ยงเบนมาตรฐาน


16

สำหรับการแจกแจงแบบปกติจะมีการประมาณค่าส่วนเบี่ยงเบนมาตรฐานโดย:

σ^unbiased=Γ(n12)Γ(n2)12k=1n(xix¯)2

เหตุผลที่ผลนี้ไม่เป็นที่รู้จักเป็นอย่างดีน่าจะเป็นที่มันเป็นส่วนใหญ่โบราณมากกว่าเรื่องของการนำเข้าที่ดีใดหลักฐานที่จะครอบคลุมในหัวข้อนี้ ; มันใช้ประโยชน์จากคุณสมบัติที่สำคัญของการแจกแจงแบบปกติ:

1σ2k=1n(xix¯)2χn12

จากนั้นด้วยการทำงานเล็กน้อยก็เป็นไปได้ที่จะคาดหวังและโดยการระบุคำตอบนี้เป็นหลายของσเราสามารถสรุปผลการ σเป็นกลางE(k=1n(xix¯)2)σσ^unbiased

นี่ทำให้ฉันอยากรู้ว่าการแจกแจงแบบอื่นมีตัวประมาณค่าเบี่ยงเบนมาตรฐานแบบปิดแบบเป็นกลาง ต่างจากการประมาณค่าความแปรปรวนแบบไม่เอนเอียงนี่คือการแจกแจงที่เฉพาะเจาะจงอย่างชัดเจน ยิ่งไปกว่านั้นมันจะไม่ตรงไปตรงมาที่จะปรับเปลี่ยนหลักฐานเพื่อค้นหาตัวประมาณสำหรับการแจกแจงแบบอื่น

การแจกแจงแบบเบ้ปกติมีคุณสมบัติการแจกแจงที่ดีสำหรับรูปแบบสมการกำลังสองซึ่งคุณสมบัติการแจกแจงแบบปกติที่เราใช้นั้นมีประสิทธิภาพเป็นกรณีพิเศษของ (เนื่องจากปกติเป็นชนิดพิเศษแบบเบ้ปกติ) ดังนั้นบางทีมันอาจไม่ยากนัก ขยายวิธีการนี้ให้กับพวกเขา แต่สำหรับความแตกต่างอื่น ๆ มันจะปรากฏวิธีการที่แตกต่างกันโดยสิ้นเชิงเป็นสิ่งจำเป็น

มีการแจกแจงอื่น ๆ ที่ทราบการประมาณเช่นนี้หรือไม่?


1
หากคุณไม่สนใจสิ่งรบกวนทางเทคนิคลักษณะของคำตอบจะชัดเจนขึ้น ในกรณีปกติเล็กน้อยของสิ่งที่คุณเขียนนั้นเกี่ยวข้องกับข้อสรุป สิ่งที่สำคัญคือปริมาณของความเอนเอียงในตัวประมาณค่านี้เป็นฟังก์ชันของเพียงอย่างเดียว (และไม่ได้ขึ้นอยู่กับพารามิเตอร์การกระจายอื่น ๆ ที่จำเป็นต้องได้รับการประมาณจากข้อมูล) n
whuber

@ เมื่อฉันคิดว่าฉันสามารถเห็นความคิดทั่วไปที่คุณกำลังพูดถึงและจำเป็นต้องใช้"ฟังก์ชั่นของคนเดียว" อย่างชัดเจน แต่ฉันไม่คิดว่ามันจะเพียงพอ - ถ้าเราไม่สามารถเข้าถึงผลลัพธ์การกระจายที่ดีบางอย่างฉันไม่สามารถดูได้ว่าลักษณะ "ปิดแบบฟอร์ม" จะสามารถใช้งานได้ง่าย n
Silverfish

5
ขึ้นอยู่กับสิ่งที่คุณหมายถึงโดย "ฟอร์มปิด" ตัวอย่างเช่นสำหรับคนคนหนึ่งฟังก์ชัน theta อาจ "ปิด" แต่สำหรับอีกคนมันเป็นเพียงผลิตภัณฑ์ที่ไม่มีที่สิ้นสุด, อนุกรมกำลังหรืออินทิกรัลที่ซับซ้อน ลองคิดดูสิฟังก์ชั่นแกมม่าคือ :-)
whuber

@whuber Good point! By "the amount of bias in this particular estimator", I take it you mean that the bias in s (rather than the estimator listed in the question, which has zero bias) is a function of n (and also in σ, but fortunately in such a way that we can easily rearrange to find an unbiased estimator)?
Silverfish

1
@whuber: There should be a similar formula for any location-scale family, with the caveat you pointed out that the function of n may be an intractable integral.
Xi'an

คำตอบ:


10

Fq(F) (for a sample size n large enough) if and only if q(αF+(1α)G) is a polynomial in 0α1. This theorem does not apply to the problem here because the collection of Gaussian distributions is not convex (a mixture of Gaussians is not a Gaussian).

An extension of the result in the question is that any power σα of the standard deviation can be unbiasedly estimated, provided there are enough observations when α<0. This follows from the result

1σ2k=1n(xix¯)2χn12
σ is the scale (and unique) parameter for k=1n(xix¯)2.

X1,,Xniidτ1f(τ1{xμ})
with a finite variance σ2. Indeed,
  1. the variance
    varμ,τ(X)=Eμ,τ[(Xμ)2]=τ2E0,1[X2]
    is only a function of τ;
  2. the sum of squares
    Eμ,τ[k=1n(XiX¯)2]=τ2Eμ,τ[k=1nτ2(XiμX¯+μ)2]=τ2E0,1[k=1n(XiX¯)2]
    has an expectation of the form τ2ψ(n);
  3. and similarly for any power
    Eμ,τ[{k=1n(XiX¯)2}α]=τ2αE0,1[{k=1n(XiX¯)2}α]
    such that the expectation is finite.

10

A probably well known case, but a case nevertheless.
Consider a continuous uniform distribution U(0,θ). Given an i.i.d. sample, the maximum order statistic, X(n) has expected value

E(X(n))=nn+1θ

The standard deviation of the distribution is

σ=θ23

So the estimator

σ^=123n+1nX(n)

is evidently unbiased for σ.

This generalizes to the case where the lower bound of the distribution is also unknown, since we can have an unbiased estimator for the Range, and then the standard deviation is again a linear function of the Range (as is essentially above also).

This exemplifies @whuber's comment, that "the amount of bias is a function of n alone" (plus possibly any known constants) -so it can be deterministically corrected. And this is the case here.


4
Now the hard part: when in the world are we interested in the standard deviation of a uniform distribution? (+1)
shadowtalker

1
@ssdecontrol That's an excellent question! -please proceed to the next one...
Alecos Papadopoulos

2
One thing I love about this answer is how poor the estimator is. It's quite common to see a question which boils down to "why do we use θ^ as an estimator even though it's biased?" Some students need convincing that unbiasedness is not the be-all and end-all, and a poor unbiased estimator is one way to show them.
Silverfish

1
@Silverfish Poor in what way? Some quick simulations show this to have lower MSE than the usual standard deviation (which surprised me).
Dave

@Dave Interesting! I had jumped to the conclusion it would be poor since it only looked at the maximum order statistic, but I too stand surprised! Shows the value of doing some simulation...
Silverfish
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.