เธต้าหมายถึงอะไร


16

ผมมือใหม่สถิติและพบนี้

ในสถิติθตัวอักษรกรีกตัวพิมพ์เล็ก 'theta' เป็นชื่อปกติสำหรับพารามิเตอร์ (vector of) (s) ของการแจกแจงความน่าจะเป็นทั่วไป ปัญหาที่พบบ่อยคือการหาค่าของ theta โปรดสังเกตว่าไม่มีความหมายใด ๆ ในการตั้งชื่อพารามิเตอร์ด้วยวิธีนี้ เราอาจจะเรียกมันว่าอะไรก็ได้ ในความเป็นจริงการแจกแจงจำนวนมากมีพารามิเตอร์ที่มักจะได้รับชื่ออื่น ตัวอย่างเช่นการใช้งานทั่วไปเพื่อตั้งชื่อค่าเฉลี่ยและส่วนเบี่ยงเบนของการแจกแจงปกติμ (อ่าน: 'mu') และการเบี่ยงเบนσ ('sigma') ตามลำดับ

แต่ฉันก็ยังไม่รู้ว่ามันแปลว่าอะไรในภาษาอังกฤษธรรมดา?


10
θθเป็นเพียงสัญลักษณ์ทางคณิตศาสตร์และหมายถึงสิ่งต่าง ๆ ในบริบทที่แตกต่างกัน บางครั้ง θθใช้เพื่ออ้างถึงพารามิเตอร์ที่ต้องประมาณ แต่ไม่มีคำตอบที่แท้จริงสำหรับคำถาม "What is θθ ?" มันเหมือนกับถามว่า "จดหมาย A คืออะไร" ลิงก์ของคุณยังบอกใบ้ถึงเรื่องนี้เมื่อมีข้อความว่า"โปรดสังเกตว่าไม่มีความหมายใด ๆ ในการตั้งชื่อพารามิเตอร์ด้วยวิธีนี้เราอาจเรียกมันว่าอย่างอื่นก็ได้" .
มาโคร

เป็นเพียงวิธีตั้งชื่อพารามิเตอร์ทางสถิติ (ซึ่งกำหนดการกระจายของปริมาณที่เกี่ยวข้องกับ 'พารามิเตอร์') ด้วยตัวอักษรพิเศษ (นอกเหนือจากตัวอักษรภาษาอังกฤษ)
Stat-R

4
พวกเราส่วนใหญ่จะใช้ใบเสนอราคานี้เป็นภาษาอังกฤษที่ธรรมดามาก แต่เพื่อความคืบหน้าเราต้องยอมรับว่าคำถามนั้นไม่เกี่ยวกับวิธีการอ่านภาษาอังกฤษ ถ้าเช่นนั้นจะเป็นอย่างไร ฉันส่งมันขอให้เราอธิบายคำศัพท์ทางเทคนิคในใบเสนอราคา: คำที่เราคุ้นเคยมากจนเราไม่เห็นว่าพวกเขาจะแปลกไปที่มือใหม่ที่ไม่มีสถิติ สิ่งนี้เรียกร้องให้เราจัดการกับความหมายของการแจกแจงและพารามิเตอร์ (ของการแจกแจงนั่นคือไม่ใช่เส้นโค้งที่พอดีหรือแบบจำลองอื่น ๆ ที่กำหนดขึ้น)
whuber

คำตอบ:


31

มันไม่ใช่แบบแผน แต่บ่อยครั้งที่θθหมายถึงชุดของพารามิเตอร์ของการแจกแจง

นั่นเป็นเพียงภาษาอังกฤษธรรมดามาแสดงตัวอย่างแทน

ตัวอย่างที่ 1คุณต้องการศึกษาการโยนของตะปูหัวโตแบบเก่า (อันที่มีก้นกลมขนาดใหญ่) คุณคิดว่าน่าจะเป็นที่มันตรงจุดลงเป็นค่าที่ไม่รู้จักที่คุณเรียกθ θคุณสามารถเรียกตัวแปรสุ่มXXแล้วบอกว่าX = 1X=1เมื่อ thumbtack ตกชี้ลงและX = 0X=0เมื่อมันชี้ลง คุณจะเขียนแบบ

P ( X = 1 ) = θP ( X = 0 ) = 1 - θ ,

P(X=1)=θP(X=0)=1θ,

และคุณสนใจที่จะประเมินθθ (ที่นี่ที่เปตองตกลงมา)

ตัวอย่างที่ 2คุณต้องการศึกษาการแตกตัวของอะตอมกัมมันตภาพรังสี จากวรรณกรรมคุณรู้ว่าปริมาณกัมมันตภาพรังสีลดลงอย่างมากดังนั้นคุณตัดสินใจที่จะทำแบบจำลองเวลาที่จะสลายตัวด้วยการแจกแจงแบบทวีคูณ ถ้าtเป็นเวลาที่จะแตกหักโมเดลจะเป็นt

F ( T ) = θ อี- θที

f(t)=θeθt.

นี่f ( T )คือความหนาแน่นของความน่าจะเป็นซึ่งหมายความว่าน่าจะเป็นที่พังทลายอะตอมในช่วงเวลา( T , T + d T )คือF ( T ) d T คุณจะมีความสนใจในการประเมินθอีกครั้ง(ที่นี่อัตราการแตกตัว)f(t)(t,t+dt)f(t)dtθ

ตัวอย่างที่ 3คุณต้องการศึกษาความแม่นยำของเครื่องมือชั่งน้ำหนัก จากวรรณกรรมคุณรู้ว่าการวัดเป็นแบบเกาส์ดังนั้นคุณตัดสินใจที่จะทำแบบจำลองการชั่งน้ำหนักของวัตถุมาตรฐาน 1 กก

f ( x ) = 1σ 2 πประสบการณ์{-(x-μ2 σ )2}

f(x)=1σ2πexp{(xμ2σ)2}.

นี่xเป็นตัวชี้วัดที่กำหนดโดยขนาดของF ( x )คือความหนาแน่นของความน่าจะเป็นและพารามิเตอร์ที่มีμและσดังนั้นθ = ( μ , σ ) พารามิเตอร์μคือน้ำหนักเป้าหมาย (เครื่องชั่งจะลำเอียงถ้าμ 1 ) และσคือค่าเบี่ยงเบนมาตรฐานของการวัดทุกครั้งที่คุณชั่งน้ำหนักวัตถุ คุณจะสนใจในการประมาณθอีกครั้ง(ที่นี่ความลำเอียงและความไม่แน่นอนของขนาด)xf(x)μσθ=(μ,σ)μμ1σθ


1
+1 FWIW, I recently posted a worked example along the same lines at stats.stackexchange.com/a/34894. Although it would be misleading to construe it as "plain English"--it does not shy from using technical terms--I made an effort to explain as clearly and briefly as possible what is going on, what assumptions are made, and how one works with a parameterized family of distributions to produce an estimate based on data. For some, this might be an informative adjunct to your answer here.
whuber

1
Great answer! I am confused when you state the scale is biased if mu != 1, though. In fact, upon "normalizing", the standard normal distribution becomes x ~ N(0, 1). Or, in English, the mu = 0 and the variance = 1. See e.g., en.wikipedia.org/wiki/…
Mike Williamson

I just mean that the instrument has a bias if it indicates something else than 1 kg when it measures a 1 kg object. Perhaps the word "scale" is confusing. Here it just designates the instrument.
gui11aume

3

What θθ refers to depends on what model you are working with. For example, in ordinary least squares regression, you model a dependent variable (usually called Y) as a linear combination of one or more independent variables (usually called X), getting something like

Yi=b0+b1x1+b2x2+...+bpxpYi=b0+b1x1+b2x2+...+bpxp

where p is the number of independent variables. The parameters to be estimated here are the βsβs and θθ is a name for all the βsβs. But θθ is more general can apply to any parameters we want to estimate.


3
Peter, although you didn't say this exactly, I'm afraid this answer may give a novice the incorrect impression that the symbol θθ will always refer to a parameter vector and, conversely, that this is the only way to refer to a parameter value. As my comment above indicates, I think the answer is nothing more than "θθ is a mathematical symbol", making it not really a statistical question.
Macro

1
@Macro I think, in this context, it's clear that this is the meaning of θθ that Kamilski wanted. Sure, any symbol can refer to anything. But in this paragraph, Macro means you, and not a course in Economics or a part of SAS or whatnot.
Peter Flom - Reinstate Monica

1
ok well I don't think that analogy is really apt but I will take it as an attempt at hyperbole. In any case, I'm really referring to something very basic which is that mathematical novices often mistake notation as something inherently meaningful and as something other than what it is - simply a label. My point was that this answer (I think unintentionally) does nothing to dispel that idea. As you know, θθ can refer to other things a statistician may encounter. For example, angles are often denoted by θθ.
Macro

4
This explanation, although it is clear and technically correct, does not explicitly involve any distributions whatsoever, and thus appears not to be relevant to the quotation in the question.
whuber

1

In plain English:

Statistical distribution is a mathematical function ff that tells you what is the probability of different values of your random variable XX that has the distribution ff, i.e. f(x)f(x) outputs a probability of xx. There are different such a functions, but for now let consider ff as some kind of "general" function.

However, for ff to be universal, that is, one that is possible to apply to different data (that share similar properties), it needs parameters that change its shape so that it fits different data. A simple example of such a parameter is μμ in normal distribution that tells where is the center (mean) of this distribution and so it can describe random variables with different mean values. Normal distribution has another parameter σσ and other distributions also have at least one such a parameters. The parameters are often called θ, where for normal distribution θ is a shorthand for both μ and σ (i.e. is a vector of the two values).

Why is θ important? Statistical distributions are used to approximate the empirical distributions of data. Say you have dataset of ages of a group of people and on average they are 50 years old and you want to approximate the distribution of their ages using a normal distribution. If normal distribution didn't allow for different values of μ (e.g. had a fixed value of this parameter, say μ=0), then it would be useless for this data. However, since μ is not fixed, normal distribution could use different values of μ, with μ=50 being one of them. This is a simple example, but there are more complicated cases where the values of θ parameters are not so clear and so you have to use statistical tools for estimating (finding the most appropriate) θ values.

So you could say that statistics is about finding the best θ values given the data (Bayesians would say: given the data and priors).

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.