การกระจายของสถิติลำดับที่สุ่มใด ๆ อย่างต่อเนื่อง ตัวแปรที่มี PDF ได้รับจากการกระจายแบบ "beta-F" วิธีที่ง่ายที่จะคิดเกี่ยวกับการกระจายนี้คือการพิจารณาสถิติการสั่งซื้อที่ i ในกลุ่มตัวอย่างของNทีนี้เพื่อให้ค่าของสถิติลำดับ ith ของตัวแปรสุ่มเท่ากับเราต้องการ 3 เงื่อนไข:
X xNXx
- x F X ( x ) F X ( x ) = P r ( X < x )i−1ด้านล่างมีความน่าจะเป็นสำหรับการสังเกตแต่ละครั้งโดยที่คือ CDF ของตัวแปรสุ่ม XxFX(x)FX(x)=Pr(X<x)
- x 1 - F X ( x )N−iค่าสูงกว่านี่มีความน่าจะเป็นx1−FX(x)
- 1 ค่าภายในช่วงเวลาเล็กน้อยที่มีนี่มีความน่าจะเป็นโดยที่คือ PDF ของตัวแปรสุ่มf X ( x ) d x f X ( x ) d x = d F X ( x ) = P r ( x < X < x + d x ) XxfX(x)dxfX(x)dx=dFX(x)=Pr(x<X<x+dx)X
มีวิธีในการเลือกนี้ดังนั้นเราจึงมี:(N1)(N−1i−1)
fi(xi)=N!(i−1)!(N−i)!fX(xi)[1−FX(xi)]N−i[FX(xi)]i−1dx
แก้ไข ในโพสต์ต้นฉบับของฉันฉันพยายามอย่างมากที่จะไปไกลจากจุดนี้และความคิดเห็นด้านล่างสะท้อนถึงสิ่งนี้ ฉันได้พยายามที่จะแก้ไขด้านล่างนี้
ถ้าเราหาค่าเฉลี่ยของ pdf นี้เราจะได้:
E(Xi)=∫∞−∞xifi(xi)dxi
และในอินทิกรัลนี้เราทำการเปลี่ยนแปลงตัวแปรต่อไปนี้ (ทำตามคำใบ้ของ @ henry) และอินทิกรัลกลายเป็น:pi=FX(xi)
E(Xi)=∫10F−1X(pi)Beta(pi|i,N−i+1)dpi=EBeta(pi|i,N−i+1)[F−1X(pi)]
ดังนั้นนี่คือค่าคาดหวังของ CDF ผกผันซึ่งสามารถประมาณค่าได้อย่างดีโดยใช้เมธอด delta เพื่อให้:
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[EBeta(pi|i,N−i+1)]=F−1X[iN+1]
เพื่อให้การประมาณดีขึ้นเราสามารถขยายไปยังลำดับที่ 2 (ไพรม์ denoting differentiation) และสังเกตว่าอนุพันธ์อันดับสองของอินเวอร์สคือ:
∂2∂a2F−1X(a)=−F′′X(F−1X(a))[F′X(F−1X(a))]3=−f′X(F−1X(a))[fX(F−1X(a))]3
ขอให้ขวา] จากนั้นเรามี:νi=F−1X[iN+1]
EBeta(pi|i,N−i+1)[F−1X(pi)]≈F−1X[νi]−VarBeta(pi|i,N−i+1)[pi]2f′X(νi)[fX(νi)]3
=νi−(iN+1)(1−iN+1)2(N+2)f′X(νi)[fX(νi)]3
ตอนนี้เชี่ยวชาญกรณีปกติเรามี
fX(x)=1σϕ(x−μσ)→f′X(x)=−x−μσ3ϕ(x−μσ)=−x−μσ2fX(x)
FX(x)=Φ(x−μσ)⟹F−1X(x)=μ+σΦ−1(x)
โปรดทราบว่าและความคาดหวังโดยประมาณจะกลายเป็น:fX(νi)=1σϕ[Φ−1(iN+1)]
E[xi]≈μ+σΦ−1(iN+1)+(iN+1)(1−iN+1)2(N+2)σΦ−1(iN+1)[ϕ[Φ−1(iN+1)]]2
และในที่สุดก็:
E[xi]≈μ+σΦ−1(iN+1)⎡⎣⎢⎢1+(iN+1)(1−iN+1)2(N+2)[ϕ[Φ−1(iN+1)]]2⎤⎦⎥⎥
แม้ว่าตามที่ @whuber ได้ระบุไว้สิ่งนี้จะไม่ถูกต้องในก้อย อันที่จริงฉันคิดว่ามันอาจจะแย่กว่านั้นเพราะความเบ้ของเบต้าที่มีพารามิเตอร์ต่างกัน