ฉันโหลดข้อมูลการเรียนรู้ของเครื่องจากไฟล์ CSV 2 คอลัมน์แรกคือการสังเกตและคอลัมน์ที่เหลือเป็นคุณลักษณะ
ขณะนี้ฉันทำต่อไปนี้:
data = pandas.read_csv('mydata.csv')
ซึ่งให้บางสิ่งเช่น:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
ฉันต้องการที่จะหั่น dataframe นี้ในสอง dataframes หนึ่งที่มีคอลัมน์aและbและเป็นหนึ่งที่มีคอลัมน์c, และde
ไม่สามารถเขียนบางอย่างเช่น
observations = data[:'c']
features = data['c':]
ฉันไม่แน่ใจว่าวิธีที่ดีที่สุดคืออะไร ฉันต้องมีpd.Panel?
โดยวิธีการที่ฉันพบการจัดทำดัชนี dataframe สวยไม่สอดคล้อง: data['a']ได้รับอนุญาต แต่data[0]ไม่ใช่ ในอีกด้านหนึ่งdata['a':]ไม่ได้รับอนุญาต แต่data[0:]เป็น มีเหตุผลในทางปฏิบัติสำหรับสิ่งนี้หรือไม่? นี่จะทำให้สับสนถ้าคอลัมน์ถูกทำดัชนีโดย Intdata[0] != data[0:1]
df[5:10]ถูกเพิ่มสำหรับการเลือกแถว ( pandas.pydata.org/pandas-docs/stable/ ...... )