ฉันจะแปลงคอลัมน์ DataFrame ของสตริง (ในรูปแบบdd / mm / yyyy ) เป็นชุดข้อมูลได้อย่างไร
ฉันจะแปลงคอลัมน์ DataFrame ของสตริง (ในรูปแบบdd / mm / yyyy ) เป็นชุดข้อมูลได้อย่างไร
คำตอบ:
วิธีที่ง่ายที่สุดคือใช้to_datetime
:
df['col'] = pd.to_datetime(df['col'])
นอกจากนี้ยังมีdayfirst
ข้อโต้แย้งสำหรับเวลาในยุโรป (แต่ระวังไม่เข้มงวด )
นี่คือการกระทำ:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
คุณสามารถผ่านรูปแบบเฉพาะ:
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
DatetimeIndex(df['col']).to_pydatetime()
ควรใช้งานได้
SettingWithCopyWarning
วัสดุให้เพียงพอ
หากคอลัมน์วันที่ของคุณเป็นสตริงของรูปแบบ '2017-01-01' คุณสามารถใช้ pandas astype เพื่อแปลงเป็นวันที่และเวลา
df['date'] = df['date'].astype('datetime64[ns]')
หรือใช้วันที่และเวลา 64 [D] ถ้าคุณต้องการความแม่นยำของวันและไม่ใช่นาโนวินาที
print(type(df_launath['date'].iloc[0]))
อัตราผลตอบแทน
<class 'pandas._libs.tslib.Timestamp'>
เช่นเดียวกับเมื่อคุณใช้ pandas.to_datetime
คุณสามารถลองกับรูปแบบอื่น ๆ ได้จากนั้น '% Y-% m-% d' แต่อย่างน้อยก็ใช้งานได้
คุณสามารถใช้สิ่งต่อไปนี้หากคุณต้องการระบุรูปแบบที่ซับซ้อน:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
รายละเอียดเพิ่มเติมเกี่ยวกับformat
ที่นี่:
หากคุณมีรูปแบบที่หลากหลายในวันที่ของคุณอย่าลืมตั้งค่าinfer_datetime_format=True
เพื่อให้ชีวิตง่ายขึ้น
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
ที่มา: pd.to_datetime
หรือถ้าคุณต้องการแนวทางที่กำหนดเอง:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)