ความแตกต่างระหว่าง as.POSIXct / as.POSIXlt และ strptime สำหรับการแปลงเวกเตอร์อักขระเป็น POSIXct / POSIXlt


97

ฉันได้ติดตามคำถามมากมายที่นี่ซึ่งถามเกี่ยวกับวิธีการแปลงเวกเตอร์อักขระเป็นคลาสวันที่และเวลา ฉันมักจะเห็น 2 วิธีคือ strptime และ as.POSIXct / as.POSIXlt ฉันดู 2 ฟังก์ชั่น แต่ไม่ชัดเจนว่าความแตกต่างคืออะไร

strptime

function (x, format, tz = "") 
{
    y <- .Internal(strptime(as.character(x), format, tz))
    names(y$year) <- names(x)
    y
}
<bytecode: 0x045fcea8>
<environment: namespace:base>

as.POSIXct

function (x, tz = "", ...) 
UseMethod("as.POSIXct")
<bytecode: 0x069efeb8>
<environment: namespace:base>

เป็น POSIXlt

function (x, tz = "", ...) 
UseMethod("as.POSIXlt")
<bytecode: 0x03ac029c>
<environment: namespace:base>

ทำไมโครเบนช์มาร์กเพื่อดูว่ามีความแตกต่างของประสิทธิภาพหรือไม่:

library(microbenchmark)
Dates <- sample(c(dates = format(seq(ISOdate(2010,1,1), by='day', length=365), format='%d-%m-%Y')), 5000, replace = TRUE)
df <- microbenchmark(strptime(Dates, "%d-%m-%Y"), as.POSIXlt(Dates, format = "%d-%m-%Y"), times = 1000)

Unit: milliseconds
                                    expr      min       lq   median       uq      max
1 as.POSIXlt(Dates, format = "%d-%m-%Y") 32.38596 33.81324 34.78487 35.52183 61.80171
2            strptime(Dates, "%d-%m-%Y") 31.73224 33.22964 34.20407 34.88167 52.12422

strptime ดูเหมือนเร็วขึ้นเล็กน้อย แล้วอะไรให้? เหตุใดจึงมี 2 ฟังก์ชันที่คล้ายกันหรือมีความแตกต่างระหว่างฟังก์ชันที่ฉันพลาดไป


4
หากคุณต้องการดูว่ามีการเรียกรหัสใดเมื่อเรียกas.POSIXctและas.POSIXltบนเวกเตอร์อักขระให้ดูas.POSIXct.defaultและas.POSIXlt.characterตามลำดับ
Joshua Ulrich

คำตอบ:


156

ฟังก์ชั่นทำสิ่งที่แตกต่างกัน

ประการแรกมีการใช้งานวันที่ / เวลาภายในสองแบบ: POSIXctซึ่งเก็บวินาทีตั้งแต่สมัย UNIX (+ ข้อมูลอื่น ๆ ) และPOSIXltซึ่งเก็บรายการวันเดือนปีชั่วโมงนาทีวินาที ฯลฯ

strptimeเป็นฟังก์ชันในการแปลงเวกเตอร์อักขระโดยตรง (จากหลากหลายรูปแบบ) เป็นPOSIXltรูปแบบ

as.POSIXltPOSIXltแปลงความหลากหลายของประเภทข้อมูลไปยัง มันพยายามที่จะฉลาดและทำสิ่งที่เหมาะสม - strptimeในกรณีของตัวละครตัวนี้จะทำหน้าที่เป็นเสื้อคลุมไป

as.POSIXctPOSIXctแปลงความหลากหลายของประเภทข้อมูลไปยัง นอกจากนี้ยังพยายามที่จะฉลาดและทำสิ่งที่เหมาะสม - ในกรณีของตัวละครตัวนี้จะทำงานstrptimeก่อนแล้วจะแปลงจากไปPOSIXltPOSIXct

มันสมเหตุสมผลที่strptimeจะเร็วกว่าเพราะstrptimeจัดการเฉพาะการป้อนอักขระในขณะที่คนอื่นพยายามกำหนดวิธีการที่จะใช้จากประเภทอินพุต นอกจากนี้ควรจะปลอดภัยกว่าเล็กน้อยเนื่องจากการส่งข้อมูลที่ไม่คาดคิดจะทำให้เกิดข้อผิดพลาดแทนที่จะพยายามทำสิ่งที่ชาญฉลาดซึ่งอาจไม่ใช่สิ่งที่คุณต้องการ


คำตอบที่ดี มีความเห็นเป็นเอกฉันท์ว่าแนวทางปฏิบัติที่ดีที่สุดในการรวบรวมข้อมูลเพื่อวัตถุประสงค์ในการสร้างแบบจำลองหรือการแสดงข้อมูลแบบใด
dre

23

POSIXt มีสองประเภทคือ POSIXct และ POSIXlt "ct" สามารถยืนตามเวลาในปฏิทินโดยจะเก็บจำนวนวินาทีไว้ตั้งแต่ต้นกำเนิด "lt" หรือเวลาท้องถิ่นเก็บวันที่ไว้เป็นรายการแอตทริบิวต์เวลา (เช่น "ชั่วโมง" และ "จันทร์") ลองดูตัวอย่างเหล่านี้:

date.hour=strptime("2011-03-27 01:30:00", "%Y-%m-%d %H:%M:%S")

date=c("26/10/2016")

time=c("19:51:30")

day<-paste(date,"T", time)

day.time1=as.POSIXct(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time1

day.time1$year

day.time2=as.POSIXlt(day,format="%d/%m/%Y T %H:%M:%S",tz="Europe/Paris")

day.time2

day.time2$year
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.