เกี่ยวกับวิธีปรับข้อมูลให้เหมาะกับการแจกแจงแบบเบ้ปกติคุณสามารถคำนวณตัวประมาณความเป็นไปได้สูงสุดจากหลักการแรก สิ่งแรกที่ทราบคือฟังก์ชันความหนาแน่นของความน่าจะเป็นสำหรับการแจกแจงแบบเบ้ปกติพร้อมพารามิเตอร์ตำแหน่ง , พารามิเตอร์สเกลωและพารามิเตอร์รูปร่างαคือξωα
2ωϕ ( x - ξω) Φ ( α ( x - ξ)ω) )
โดยที่คือฟังก์ชั่นความหนาแน่นปกติมาตรฐานและΦ ( ⋅ )คือ CDF ปกติมาตรฐาน โปรดทราบว่าความหนาแน่นนี้เป็นสมาชิกของชั้นเรียนที่อธิบายไว้ในคำตอบของฉันคำถามนี้ϕ ( ⋅ )Φ ( ⋅ )
บันทึกความน่าจะเป็นบนพื้นฐานของตัวอย่างของการสังเกตอิสระจากการแจกแจงนี้คือ:n
- n บันทึก( ω ) + ∑i = 1nเข้าสู่ระบบϕ ( x - ξω) +บันทึกΦ ( α ( x - ξ)ω) )
มันเป็นความจริงที่ว่าไม่มีวิธีแก้ปัญหาแบบปิดสำหรับ MLE นี้ แต่สามารถแก้ไขได้เป็นตัวเลข ตัวอย่างเช่นในR
คุณสามารถเขียนรหัสฟังก์ชั่นความน่าจะเป็นได้ (หมายเหตุฉันทำให้มันมีขนาดกะทัดรัด / มีประสิทธิภาพน้อยกว่าที่เป็นไปได้เพื่อให้มันโปร่งใสอย่างสมบูรณ์ว่าวิธีนี้คำนวณฟังก์ชันความน่าจะเป็นข้างบน):
set.seed(2345)
# generate standard normal data, which is a special case
n = 100
X = rnorm(n)
# Calculate (negative) log likelihood for minimization
# P[1] is omega, P[2] is xi and P[3] is alpha
L = function(P)
{
# positivity constraint on omega
if( P[1] <= 0 ) return(Inf)
S = 0
for(i in 1:n)
{
S = S - log( dnorm( (X[i] - P[2])/P[1] ) )
S = S - log( pnorm( P[3]*(X[i] - P[2])/P[1] ) )
}
return(S + n*log(P[1]))
}
ตอนนี้เราเพิ่งย่อขนาดฟังก์ชั่นนี้ (นั่นคือเพิ่มโอกาส) คุณสามารถทำเช่นนี้ได้โดยไม่ต้องสัญญาซื้อขายล่วงหน้าคำนวณโดยใช้วิธี Simplexซึ่งเป็นเริ่มต้นใช้งานในแพคเกจในoptim()
R
เกี่ยวกับวิธีการทดสอบเบ้:เราสามารถอย่างชัดเจนสำหรับการทดสอบลาดปกติเมื่อเทียบกับปกติ (ตั้งแต่ปกติเป็นรุ่นย่อย) โดย constraining และทำทดสอบอัตราส่วนความน่าจะเป็นα = 0
# log likelihood constraining alpha=0.
L2 = function(Q) L(c(Q[1],Q[2],0))
# log likelihood from the constrained model
-optim(c(1,1),L2)$value
[1] -202.8816
# log likelihood from the full model
-optim(c(1,1,1),L)$value
[1] -202.0064
# likelihood ratio test statistic
LRT = 2*(202.8816-202.0064)
# p-value under the null distribution (chi square 1)
1-pchisq(LRT,1)
[1] 0.1858265
ดังนั้นเราจึงไม่ปฏิเสธสมมติฐานว่างที่ (เช่นไม่เอียง)α = 0
ที่นี่การเปรียบเทียบนั้นง่ายเนื่องจากการแจกแจงแบบปกติเป็นแบบจำลองย่อย ในกรณีทั่วไปคุณสามารถเปรียบเทียบการแจกแจงการอ้างอิงแบบเอียงโดยทั่วไปตัวอย่างเช่นAIC s (ดังที่ทำไว้ที่นี่ ) หากคุณใช้การประมาณค่าความน่าจะเป็นสูงสุดในการแข่งขันทั้งหมด ตัวอย่างเช่นคุณสามารถใส่ข้อมูลโดยความเป็นไปได้สูงสุดภายใต้การแจกแจงแกมม่าและภายใต้ความเบ้ปกติและดูว่าโอกาสที่เพิ่มเข้ามานั้นแสดงให้เห็นถึงความซับซ้อนที่เพิ่มขึ้นของความเบ้ - ปกติ (3 พารามิเตอร์แทน 2) คุณสามารถลองใช้การทดสอบ Kolmogorov Smirnov หนึ่งตัวอย่างเพื่อเปรียบเทียบข้อมูลของคุณกับการประมาณค่าแบบกระชับที่ดีที่สุดจากตระกูลแบบปกติ