การประมาณค่าพารามิเตอร์ของการแจกแจงแบบ t


23

ตัวประมาณโอกาสสูงสุดสำหรับพารามิเตอร์ของการแจกแจงแบบ t คืออะไร พวกมันมีอยู่ในรูปแบบปิดหรือไม่? การค้นหาโดย Google อย่างรวดเร็วไม่ได้ให้ผลลัพธ์ใด ๆ แก่ฉัน

วันนี้ฉันสนใจกรณี univariate แต่บางทีฉันอาจจะต้องขยายโมเดลเป็นหลายมิติ

แก้ไข: ฉันจริง ๆ แล้วส่วนใหญ่สนใจในพารามิเตอร์ที่ตั้งและขนาด สำหรับตอนนี้ฉันสามารถสรุปได้ว่าค่าพารามิเตอร์องศาอิสระได้รับการแก้ไขและอาจใช้รูปแบบตัวเลขเพื่อหาค่าที่ดีที่สุดในภายหลัง


สำหรับความรู้ของฉันพวกเขาไม่ได้อยู่ในรูปแบบปิด อาจจำเป็นต้องใช้วิธีแบบลาดแบบลาดขึ้น
Pat

แม้ว่าการแจกแจง Student t มีพารามิเตอร์เดียวแต่คุณอ้างถึง "พารามิเตอร์" ในพหูพจน์ คุณอาจรวมถึงพารามิเตอร์ตำแหน่งและ / หรือสเกล?
whuber

@whuber ขอบคุณสำหรับความคิดเห็นแน่นอนฉันสนใจในพารามิเตอร์ตำแหน่งและสเกลมากกว่าในองศาอิสระ
Grzenio

ด้วยข้อมูลสมโอกาสสำหรับพารามิเตอร์สถานที่เป็นพีชคณิตเทียบเท่ากับพหุนามของปริญญา2n-1คุณคิดว่าศูนย์ของพหุนามดังกล่าวให้ใน "รูปแบบปิด" หรือไม่ n2n1
whuber

@whuber มีกรณีพิเศษสำหรับ n ตัวเล็กเช่น n = 3 หรือไม่
Grzenio

คำตอบ:


27

รูปแบบปิดไม่มีอยู่สำหรับ T แต่วิธีการที่ใช้งานง่ายและมีความเสถียรนั้นผ่านทางอัลกอริธึม EM ตอนนี้เพราะนักเรียนเป็นส่วนผสมของบรรทัดฐานคุณสามารถเขียนแบบจำลองของคุณเป็น

yi=μ+ei

where ei|σ,wiN(0,σ2wi1) and wiGa(ν2,ν2). This means that conditionally on wi the mle are just the weighted mean and standard deviation. This is the "M"step

μ^=iwiyiiwi
σ^2=iwi(yiμ^)2n

Now the "E" step replaces wi with its expectation given all the data. This is given as:

w^i=(ν+1)σ2νσ2+(yiμ)2

so you simply iterate the above two steps, replacing the "right hand side" of each equation with the current parameter estimates.

This very easily shows the robustness properties of the t distribution as observations with large residuals receive less weight in the calculation for the location μ, and bounded influence in the calculation of σ2. By "bounded influence" I mean that the contribution to the estimate for σ2 from the ith observation cannot exceed a given threshold (this is (ν+1)σold2 in the EM algorithm). Also ν is a "robustness"parameter in that increasing (decreasing) ν will result in more (less) uniform weights and hence more (less) sensitivity to outliers.

One thing to note is that the log likelihood function may have more than one stationary point, so the EM algorithm may converge to a local mode instead of a global mode. The local modes are likely to be found when the location parameter is started too close to an outlier. So starting at the median is a good way to avoid this.


1
That's awesome. I've been toying with the idea of fitting student t's using EM for a while for precisely the reason that it looks like a mixture of gaussians. Do you have a citation/reference for the update equations you give? Having that would increase the awesomeness of this post even further.
Pat

Actually, i think I've found one myself, for a mixture model of student t's (which I'm so going to use for stuff): The mixtures of Student’s t-distributions as a robust framework for rigid registration. Demetrios Gerogiannis, Christophoros Nikou, Aristidis Likas. Image and Vision Computing 27 (2009) 1285–1294.
Pat

The link in my answer to this question has a very general EM framework for loads and loads of likelihood functions - quantile, student, logistic, and does general regression. You specific case is "regression" without covariates - intercept only - so fits nicely into this framework. Also, there are a vast number of penalty terms that you can incorporate into this framework.
probabilityislogic

@probabilityislogic really neat! And what if ν is also unknown? Can you also give some reference please? Maybe best here: stats.stackexchange.com/questions/87405/…
Quartz

I think this reference is better than @Pat's. 'ML ESTIMATION OF THE t DISTRIBUTION USING EM AND ITS EXTENSIONS, ECM AND ECME.' You have to be very careful on the selection of initial parameter value while running the EM algorithm because of the local-optimum issue. In other words, you have to know something about your data. Usually, I avoid the use of the t distribution in my research.

4

The following paper addresses exactly the problem you posted.

Liu C. and Rubin D.B. 1995. "ML estimation of the t distribution using EM and its extensions, ECM and ECME." Statistica Sinica 5:19–39.

It provides a general multivariate t-distribution parameter estimation, with or without the knowledge of the degree of freedom. The procedure can be found in Section 4, and it is very similar to probabilityislogic's for 1-dimension.


7
It sounds like the paper you refer to contains a useful answer to the question, but answers are better when they are standalone and do not necessitate outside resources (here, for example, it is possible that OP or readers do not have access to this paper). Could you flesh out your answer a little bit to make it more standalone?
Patrick Coulombe

3

I doubt that it exists in closed form: if you write any one of the factors of the likelihood as

Γ(ν+12)νπΓ(ν2)(1+t2ν)ν+12=Γ(ν+12)νπΓ(ν2)exp{[ln(1+t2ν)][ν+12]}
and take the ln of that, you will get a nonlinear equation in ν. Even if you manage to get a solution, then depending on the number of factors (terms) n, the MLE equation is going to depend on this n in a nontrivial way. All that dramatically simplifies, of course, when ν, when the power approaches an exponential (Gaussian PDF).

1
Even in the Gaussian setting the log likelihood is nonlinear in its parameters :-).
whuber

I am actually interested in location and scale parameters, more than in the degrees of freedom. Please see edit to the question, and sorry for being not precise.
Grzenio

2

I have recently discovered a closed-form estimator for the scale of the Student's t distribution. To the best of my knowledge, this is a new contribution, but I would welcome comments suggesting any related results. The paper describes the method in the context of a family of "coupled exponential" distributions. The Student's t is referred to as the Coupled Gaussian, where the coupling term is the reciprocal of the degree of freedom. The closed-form statistic is the geometric mean of the samples. Assuming a value of the coupling or degree of freedom, an estimate of the scale is determined by multiplying the geometric mean of the samples by a function involving the coupling and a harmonic number.

https://arxiv.org/abs/1804.03989 Use of the geometric mean as a statistic for the scale of the coupled Gaussian distributions, Kenric P. Nelson, Mark A. Kon, Sabir R. Umarov

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.