ฉันเข้าใจแนวคิดของการปรับเมทริกซ์ข้อมูลเพื่อใช้ในตัวแบบการถดถอยเชิงเส้น ตัวอย่างเช่นใน R คุณสามารถใช้:
scaled.data <- scale(data, scale=TRUE)
คำถามเดียวของฉันคือสำหรับการสังเกตใหม่ที่ฉันต้องการทำนายค่าผลลัพธ์พวกเขาจะปรับขนาดได้อย่างถูกต้องอย่างไร มันจะเป็นscaled.new <- (new - mean(data)) / std(data)
อย่างไร
ฉันไม่ต้องการให้ค่ากลับมาฉันต้องการทราบว่าอินสแตนซ์ใหม่สามารถปรับขนาดได้อย่างถูกต้องในวิธีเดียวกัน ฉันแก้ไขคำถามตามความคิดเห็นของคุณแล้ว
—
SamuelNLP
y = y_esc * sd(y) + mean(y)
แต่มันจะยุ่งกับคุณสมบัติของแบบจำลองฉันเดาดังนั้นฉันยังรอคำตอบทางเทคนิคมากขึ้นด้วย!