มันเป็นธรรมดาที่คำแนะนำของ Greg เป็นสิ่งแรกที่ต้องลอง: ปัวซองการถดถอยเป็นรูปแบบธรรมชาติในคอนกรีตจำนวนมาก สถานการณ์
อย่างไรก็ตามรูปแบบที่คุณกำลังบอกเป็นนัย ๆ สามารถเกิดขึ้นได้ตัวอย่างเช่นเมื่อคุณสังเกตข้อมูลกลม:
มีข้อผิดพลาดปกติ IID \
Yi=⌊axi+b+ϵi⌋,
ϵi
ฉันคิดว่านี่น่าสนใจที่จะดูว่าสามารถทำอะไรได้บ้าง ฉันเขียนโดย the cdf ของตัวแปรปกติมาตรฐาน ถ้าดังนั้น
โดยใช้สัญลักษณ์คอมพิวเตอร์ที่คุ้นเคยFϵ∼N(0,σ2)
P(⌊ax+b+ϵ⌋=k)=F(k−b+1−axσ)−F(k−b−axσ)=pnorm(k+1−ax−b,sd=σ)−pnorm(k−ax−b,sd=σ),
คุณสังเกตจุดข้อมูลy_i) บันทึกความเป็นไปได้ที่ได้รับจาก
สิ่งนี้ไม่เหมือนสี่เหลี่ยมจัตุรัสน้อยที่สุด คุณสามารถลองขยายให้ใหญ่สุดด้วยวิธีตัวเลข นี่คือภาพประกอบใน R:(xi,yi)
ℓ(a,b,σ)=∑ilog(F(yi−b+1−axiσ)−F(yi−b−axiσ)).
log_lik <- function(a,b,s,x,y)
sum(log(pnorm(y+1-a*x-b, sd=s) - pnorm(y-a*x-b, sd=s)));
x <- 0:20
y <- floor(x+3+rnorm(length(x), sd=3))
plot(x,y, pch=19)
optim(c(1,1,1), function(p) -log_lik(p[1], p[2], p[3], x, y)) -> r
abline(r$par[2], r$par[1], lty=2, col="red")
t <- seq(0,20,by=0.01)
lines(t, floor( r$par[1]*t+r$par[2]), col="green")
lm(y~x) -> r1
abline(r1, lty=2, col="blue");
ในสีแดงและสีน้ำเงินเส้นพบโดยการเพิ่มจำนวนสูงสุดของความน่าจะเป็นนี้และกำลังสองน้อยที่สุดตามลำดับ บันไดสีเขียวคือสำหรับพบจากความเป็นไปได้สูงสุด ... สิ่งนี้แนะนำว่าคุณสามารถใช้กำลังสองน้อยที่สุดได้มากถึงการแปล 0.5 และได้ผลลัพธ์เดียวกัน หรืออย่างน้อยสี่เหลี่ยมจัตุรัสพอดีกับโมเดล
ที่เป็นจำนวนเต็มที่ใกล้ที่สุด ข้อมูลที่ถูกปัดเศษมักพบว่าฉันแน่ใจว่าสิ่งนี้เป็นที่รู้จักและได้รับการศึกษาอย่างกว้างขวาง ...ax+b⌊ax+b⌋a,bb
Yi=[axi+b+ϵi],
[x]=⌊x+0.5⌋