ฉันมีข้อมูลการขายสำหรับร้านค้าต่างๆและต้องการจัดหมวดหมู่พวกเขาตามรูปร่างของเส้นโค้งเมื่อเวลาผ่านไป ข้อมูลดูเหมือนประมาณนี้ (แต่เห็นได้ชัดว่าไม่ได้สุ่มและมีข้อมูลขาดหายไป):
n.quarters <- 100
n.stores <- 20
if (exists("test.data")){
rm(test.data)
}
for (i in 1:n.stores){
interval <- runif(1, 1, 200)
new.df <- data.frame(
var0 = interval + c(0, cumsum(runif(49, -5, 5))),
date = seq.Date(as.Date("1990-03-30"), by="3 month", length.out=n.quarters),
store = rep(paste("Store", i, sep=""), n.quarters))
if (exists("test.data")){
test.data <- rbind(test.data, new.df)
} else {
test.data <- new.df
}
}
test.data$store <- factor(test.data$store)
ฉันต้องการทราบว่าฉันสามารถจัดกลุ่มตามรูปร่างของส่วนโค้งในอาร์ฉันได้พิจารณาวิธีการต่อไปนี้:
- สร้างคอลัมน์ใหม่โดยแปลง var0 ของแต่ละร้านเป็นค่าระหว่าง 0.0 ถึง 1.0 สำหรับอนุกรมเวลาทั้งหมด
- จัดกลุ่มเส้นโค้งที่เปลี่ยนแปลงเหล่านี้โดยใช้
kml
แพ็กเกจใน R
ฉันมีสองคำถาม:
- นี่เป็นวิธีการสำรวจที่สมเหตุสมผลหรือไม่?
- ฉันจะแปลงข้อมูลเป็นรูปแบบข้อมูลระยะยาวที่
kml
จะเข้าใจได้อย่างไร ตัวอย่าง R ใด ๆ จะได้รับการชื่นชมมาก!
kml
ไหม