สัญชาตญาณเบื้องหลังอัตราอันตราย


16

ฉันสับสนเกี่ยวกับสมการที่ทำหน้าที่เป็นคำจำกัดความของอัตราอันตราย ฉันเข้าใจว่าอัตราอันตรายนั้นเป็นอย่างไร แต่ฉันไม่เห็นว่าสมการแสดงความรู้สึกนั้น

ถ้าxเป็นตัวแปรสุ่มซึ่งหมายถึงจุดของเวลาของการตายของคนในช่วงเวลา[0,T] ] ดังนั้นอัตราความเสี่ยงคือ:

ชั่วโมง(x)=(x)1-F(x)

ที่ไหนF(x)แสดงให้เห็นถึงความน่าจะเป็นของการเสียชีวิตจนถึงจุดเวลาx[0,T] ,
1-F(x)แสดงให้เห็นถึงความน่าจะเป็นของการมีชีวิตรอดจนถึงจุดเวลาx[0,T] ,
และ(x)ความน่าจะเป็นของการเสียชีวิตที่จุดxx

วิธีการที่ไม่หารโดยอัตราการรอดตายอธิบายสัญชาตญาณของความน่าจะเป็นของการเสียชีวิตทันทีในที่อยู่ถัดΔ ที ? ไม่ควรเป็นแค่f ( x )การคำนวณอัตราความเสี่ยงเป็นเรื่องเล็กน้อยใช่หรือไม่(x)Δเสื้อ(x)

คำตอบ:


11

ให้แสดงเวลาที่เสียชีวิต (หรือเวลาที่ล้มเหลวหากคุณต้องการคำอธิบายที่ผิดปกติน้อยกว่า) สมมติว่าXเป็นตัวแปรสุ่มแบบต่อเนื่องซึ่งฟังก์ชันความหนาแน่นf ( t )ไม่ใช่ศูนย์บน ( 0 , )เท่านั้น ตอนนี้สังเกตเห็นว่ามันจะต้องเป็นกรณีที่F ( T ) สูญสลายไป0เป็นเสื้อ→การเพราะถ้าF ( T )ไม่สลายตัวออกไปตามที่ระบุไว้แล้ว - XXf(t)(0,)f(t)0tf(t)ไม่สามารถถือได้ ดังนั้นความคิดของคุณที่f(T)คือความน่าจะเป็นของการเสียชีวิตในเวลาT (ที่จริงแล้วมันคือf(T)Δtที่ (ประมาณ) ความน่าจะเป็นของการเสียชีวิตในช่วงเวลาสั้น ๆ(T,T+Δt] ของ ความยาวΔt) นำไปสู่ข้อสรุปที่ไม่น่าเชื่อและไม่น่าเชื่อเช่นf(t)dt=1f(T)Tf(T)Δt(T,T+Δt]Δt

คุณมีแนวโน้มที่จะตายภายในเดือนถัดไปเมื่อคุณอายุสามสิบปีมากกว่าเมื่อคุณอายุเก้าสิบแปดปี

เมื่อใดก็ตามที่เป็นเช่นนั้น( 30 ) > F ( 98 )f(t)f(30)>f(98)

เหตุผลที่ (หรือf ( T ) Δ t ) คือความน่าจะเป็น "ผิด" ที่ต้องดูคือค่าของf ( T )เป็นสิ่งที่น่าสนใจสำหรับคนที่ยังมีชีวิตอยู่ตอนอายุT (และยังคงมีจิตใจ) แจ้งเตือนมากพอที่จะอ่าน stats.SE เป็นประจำ!) สิ่งที่ควรพิจารณาคือความน่าจะเป็นที่T- year จะตายในเดือนถัดไปนั่นคือf(T)f(T)Δtf(T)TT

P{(X(T,T+Δt]XT}=P{(X(T,T+Δt])(XT)}P{XT} definition of conditional probability=P{X(T,T+Δt]}P{XT}=f(T)Δt1F(T)because X is a continuous rv

เลือกจะเป็นปักษ์สัปดาห์วันชั่วโมงนาที ฯลฯ เรามาถึงข้อสรุปที่ว่านี้ (ทันที) อัตราอันตรายสำหรับTทุบทุกสถิติเก่าΔtT

h(T)=f(T)1F(T)

ในแง่ที่ความน่าจะเป็นโดยประมาณของการเสียชีวิตใน femtosecond ถัดไป ของT- year เก่าคือf ( T ) Δ t(Δt)Tf(T)Δt1F(T).

Note that in contrast to the density f(t) integrating to 1, the integral 0h(t)dt must diverge. This is because the CDF F(t) is related to the hazard rate through

F(t)=1exp(0th(τ)dτ)
and since limtF(t)=1, it must be that
limt0th(τ)dτ=,
or stated more formally, the integral of the hazard rate must diverge: there is no potential divergence as a previous edit claimed.

Typical hazard rates are increasing functions of time, but constant hazard rates (exponential lifetimes) are possible. Both of these kinds of hazard rates obviously have divergent integrals. A less common scenario (for those who believe that things improve with age, like fine wine does) is a hazard rate that decreases with time but slowly enough that the integral diverges.


"Let X denote the time of death (or time of failure if you prefer a less morbid description". Time until recovery is even less morbid.
ryu576

10

Imagine that you are interested in the incidence of (first) marriage for men. To look at the incidence of marriage at age 20, say, you would select a sample of people who are not married at that age and see if they get married within the next year (before they turn 21).

The you could get a rough estimate for

P(marrybefore21|notmarriedat20)
as the proportion of individuals who got married from your sample of single 20 year olds, i.e.
N(marriedbefore21andnotmarriedat20)N(notmarriedat20)

So basically this is just using the definition of conditional probability,

P(X|Y)=P(X,Y)P(Y).
Now imagine we make the age unit smaller and smaller, up to days for example. I.e. what is the incidence of marriage at age of 7300 days? Then you would do the same, but survey all individuals of 7300 days and look who gets married before the end of the day. If T is a random variable age at marriage, then we could write
P(T7301)|T7300)=P(T[7300,7301))P(T7300)
by the same logic as before.

The hazard would then be the instantaneous probability of marriage at age t, for a non-married individual. We can write this as

h(t)dt=P(T[t,t+dt)|Tt)=P(T[t,t+dt))P(Tt)

5

f(x) is not the probability of death, but the probability density; the expected number of times you die within the next unit of time if the probability density remained constant during that unit of time.

Notice there is a problem: your probability of dying when you already died before is rather problematic. So it makes more sense to compute the probability of dying conditional on having survived thus far. 1F(t) it the probability of having survived until t, so dividing the probabilty density by that probability, will get us the expected number of times we will die within the next unit of time conditional on not having died before. That is the hazard rate.

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.