ฉันโหลดข้อมูลการเรียนรู้ของเครื่องจากไฟล์ CSV 2 คอลัมน์แรกคือการสังเกตและคอลัมน์ที่เหลือเป็นคุณลักษณะ
ขณะนี้ฉันทำต่อไปนี้:
data = pandas.read_csv('mydata.csv')
ซึ่งให้บางสิ่งเช่น:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
ฉันต้องการที่จะหั่น dataframe นี้ในสอง dataframes หนึ่งที่มีคอลัมน์a
และb
และเป็นหนึ่งที่มีคอลัมน์c
, และd
e
ไม่สามารถเขียนบางอย่างเช่น
observations = data[:'c']
features = data['c':]
ฉันไม่แน่ใจว่าวิธีที่ดีที่สุดคืออะไร ฉันต้องมีpd.Panel
?
โดยวิธีการที่ฉันพบการจัดทำดัชนี dataframe สวยไม่สอดคล้อง: data['a']
ได้รับอนุญาต แต่data[0]
ไม่ใช่ ในอีกด้านหนึ่งdata['a':]
ไม่ได้รับอนุญาต แต่data[0:]
เป็น มีเหตุผลในทางปฏิบัติสำหรับสิ่งนี้หรือไม่? นี่จะทำให้สับสนถ้าคอลัมน์ถูกทำดัชนีโดย Intdata[0] != data[0:1]
df[5:10]
ถูกเพิ่มสำหรับการเลือกแถว ( pandas.pydata.org/pandas-docs/stable/ ...... )