แปลงเวลายูนิกซ์เป็นวันที่ที่อ่านได้ในดาต้าเฟรมของแพนด้า


113

ฉันมีดาต้าเฟรมที่มีเวลายูนิกซ์และราคาอยู่ในนั้น ฉันต้องการแปลงคอลัมน์ดัชนีเพื่อให้แสดงเป็นวันที่ที่มนุษย์อ่านได้

ดังนั้นสำหรับตัวอย่างเช่นผมมีdateเป็น1349633705ในคอลัมน์ดัชนี แต่ฉันต้องการให้แสดงเป็น10/07/2012(หรืออย่างน้อย10/07/2012 18:15)

สำหรับบริบทบางอย่างนี่คือรหัสที่ฉันใช้งานและสิ่งที่ฉันได้ลองแล้ว:

import json
import urllib2
from datetime import datetime
response = urllib2.urlopen('http://blockchain.info/charts/market-price?&format=json')
data = json.load(response)   
df = DataFrame(data['values'])
df.columns = ["date","price"]
#convert dates 
df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.index = df.date   

อย่างที่คุณเห็นฉันใช้ df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))ที่นี่ซึ่งใช้ไม่ได้เนื่องจากฉันทำงานกับจำนวนเต็มไม่ใช่สตริง ฉันคิดว่าฉันต้องใช้datetime.date.fromtimestampแต่ฉันไม่ค่อยแน่ใจว่าจะใช้สิ่งนี้กับทั้งหมดdf.dateได้อย่างไร

ขอบคุณ.

คำตอบ:


227

สิ่งเหล่านี้ดูเหมือนจะเป็นวินาทีนับตั้งแต่ยุค

In [20]: df = DataFrame(data['values'])

In [21]: df.columns = ["date","price"]

In [22]: df
Out[22]: 
<class 'pandas.core.frame.DataFrame'>
Int64Index: 358 entries, 0 to 357
Data columns (total 2 columns):
date     358  non-null values
price    358  non-null values
dtypes: float64(1), int64(1)

In [23]: df.head()
Out[23]: 
         date  price
0  1349720105  12.08
1  1349806505  12.35
2  1349892905  12.15
3  1349979305  12.19
4  1350065705  12.15
In [25]: df['date'] = pd.to_datetime(df['date'],unit='s')

In [26]: df.head()
Out[26]: 
                 date  price
0 2012-10-08 18:15:05  12.08
1 2012-10-09 18:15:05  12.35
2 2012-10-10 18:15:05  12.15
3 2012-10-11 18:15:05  12.19
4 2012-10-12 18:15:05  12.15

In [27]: df.dtypes
Out[27]: 
date     datetime64[ns]
price           float64
dtype: object

1
และใน 0.13 คุณจะสามารถใช้ date_unit เมื่อ read_json: D
Andy Hayden

เยี่ยมมาก! โซลูชันของคุณเหมาะสมอย่างยิ่ง นุ่น: การแปลงเป็นการประทับเวลาผ่านไปได้ด้วยดีตอนนี้ฉันรู้เรื่อง to_datetime แล้ว
WA Carnegie

เพียงแค่จุดอื่น สิ่งนี้ไม่ได้ผลสำหรับฉันใน 0.11 แต่ใช้ได้ดีใน 0.12+
WA Carnegie

1
OverflowError: Python int too large to convert to C longการแก้ปัญหานี้ให้ฉัน
ถ้า __name__ คือไม่มี

2
ไม่เป็นไรมีการประทับเวลามิลลิวินาทีเพิ่งมีการหรือlambda x: x/1000.0 unit='ms'
ถ้า __name__ เป็นไม่มี

50

หากคุณลองใช้:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],***unit='s'***))

และได้รับข้อผิดพลาด:

"pandas.tslib.OutOfBoundsDatetime: ไม่สามารถแปลงอินพุตด้วยหน่วย"

ซึ่งหมายความDATE_FIELDว่าไม่ได้ระบุเป็นวินาที

ในกรณีของฉันมันเป็นหนึ่งในพันวินาที EPOCH time-

การแปลงทำงานโดยใช้ด้านล่าง:

df[DATE_FIELD]=(pd.to_datetime(df[DATE_FIELD],unit='ms')) 


1

หรืออีกวิธีหนึ่งโดยการเปลี่ยนบรรทัดของรหัสด้านบน:

# df.date = df.date.apply(lambda d: datetime.strptime(d, "%Y-%m-%d"))
df.date = df.date.apply(lambda d: datetime.datetime.fromtimestamp(int(d)).strftime('%Y-%m-%d'))

นอกจากนี้ยังควรทำงาน

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.