มีวิธีในการรับคะแนนความเชื่อมั่น (เราสามารถเรียกได้ว่าเป็นค่าความเชื่อมั่นหรือความน่าจะเป็น) สำหรับแต่ละค่าที่คาดการณ์เมื่อใช้อัลกอริทึมเช่นการสุ่มป่าหรือการไล่ระดับสีมากขึ้น สมมติว่าคะแนนความเชื่อมั่นนี้จะอยู่ในช่วงตั้งแต่ 0 ถึง 1 และแสดงว่าฉันมีความมั่นใจเกี่ยวกับการทำนายโดยเฉพาะอย่างไร
จากสิ่งที่ฉันพบในอินเทอร์เน็ตเกี่ยวกับความมั่นใจมักจะวัดจากช่วงเวลา นี่คือตัวอย่างของช่วงความเชื่อมั่นที่คำนวณด้วยconfpred
ฟังก์ชันจากlava
ไลบรารี:
library(lava)
set.seed(123)
n <- 200
x <- seq(0,6,length.out=n)
delta <- 3
ss <- exp(-1+1.5*cos((x-delta)))
ee <- rnorm(n,sd=ss)
y <- (x-delta)+3*cos(x+4.5-delta)+ee
d <- data.frame(y=y,x=x)
newd <- data.frame(x=seq(0,6,length.out=50))
cc <- confpred(lm(y~poly(x,3),d),data=d,newdata=newd)
if (interactive()) { ##'
plot(y~x,pch=16,col=lava::Col("black"), ylim=c(-10,15),xlab="X",ylab="Y")
with(cc, lava::confband(newd$x, lwr, upr, fit, lwd=3, polygon=T,
col=Col("blue"), border=F))
}
เอาต์พุตโค้ดให้ช่วงความมั่นใจเท่านั้น:
นอกจากนี้ยังมีห้องสมุดconformal
แต่ฉันใช้สำหรับช่วงเวลาความเชื่อมั่นในการถดถอย: "มาตรฐานช่วยให้การคำนวณข้อผิดพลาดการทำนายในกรอบการทำนายตามมาตรฐาน: (i) p.values สำหรับการจำแนกและ (ii) ช่วงความเชื่อมั่นสำหรับการถดถอย "
ดังนั้นจึงมีวิธี:
เพื่อให้ได้ค่าความเชื่อมั่นสำหรับการทำนายในปัญหาการถดถอยใด ๆ
หากไม่มีวิธีมันจะมีความหมายที่จะใช้สำหรับการสังเกตแต่ละครั้งเป็นคะแนนความเชื่อมั่นนี้:
ระยะห่างระหว่างขอบเขตบนและล่างของช่วงความเชื่อมั่น (เช่นในตัวอย่างผลลัพธ์ด้านบน) ดังนั้นในกรณีนี้ความกว้างที่มากขึ้นคือช่วงความมั่นใจความไม่แน่นอนที่มากขึ้น (แต่สิ่งนี้ไม่ได้คำนึงถึงว่าในช่วงเวลาใดเป็นค่าจริง)
randomForestCI
แพ็คเกจโดย Stephan Wager และเอกสารที่เกี่ยวข้องกับ Susan Athey โปรดทราบว่ามี CIs เท่านั้น 'แต่คุณสามารถกำหนดช่วงการทำนายได้โดยคำนวณความแปรปรวนที่เหลือ