การเขียนโปรแกรม pandas

7

ฉันมีเอกสาร excel ซึ่งมีลักษณะเช่นนี้ .. cluster load_date budget actual fixed_price A 1/1/2014 1000 4000 Y A 2/1/2014 12000 10000 Y A 3/1/2014 36000 2000 Y B 4/1/2014 15000 10000 N B 4/1/2014 12000 11500 N B 4/1/2014 90000 11000 N C 7/1/2014 22000 18000 N C 8/1/2014 30000 28960 N C …

289 python list pandas

4

แปลงชนิดคอลัมน์ DataFrame จากสตริงเป็นวันที่และเวลารูปแบบ dd / mm / yyyy

ฉันจะแปลงคอลัมน์ DataFrame ของสตริง (ในรูปแบบdd / mm / yyyy ) เป็นชุดข้อมูลได้อย่างไร

284 python pandas dataframe datetime-format python-datetime

6

การสร้าง Pandas DataFrame จากอาร์เรย์ Numpy: ฉันจะระบุคอลัมน์ดัชนีและส่วนหัวของคอลัมน์ได้อย่างไร

ฉันมีอาร์เรย์ Numpy ซึ่งประกอบด้วยรายการหลายรายการซึ่งแสดงถึงอาร์เรย์สองมิติพร้อมป้ายชื่อแถวและชื่อคอลัมน์ตามที่แสดงด้านล่าง: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) ฉันต้องการให้ DataFrame ส่งผลให้มี Row1 และ Row2 เป็นค่าดัชนีและ Col1, Col2 เป็นค่าส่วนหัว ฉันสามารถระบุดัชนีได้ดังนี้: df = pd.DataFrame(data,index=data[:,0]), อย่างไรก็ตามฉันไม่แน่ใจว่าจะกำหนดส่วนหัวคอลัมน์ได้อย่างไร

281 python pandas numpy

8

รวมสองซีรี่ส์เข้ากับ DataFrame ในนุ่น

ฉันมีสองซีรี่ส์s1และs2มีดัชนีเดียวกัน (ไม่ต่อเนื่องกัน) ฉันจะรวมs1และs2เป็นสองคอลัมน์ใน DataFrame และเก็บหนึ่งในดัชนีเป็นคอลัมน์ที่สามได้อย่างไร

278 python pandas series dataframe

8

วิธีเลือกคอลัมน์ทั้งหมดยกเว้นหนึ่งคอลัมน์ในนุ่น

ฉันมีชื่อไฟล์ลักษณะเช่นนี้: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd')) df a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 ฉันจะรับคอลัมน์ทั้งหมดได้column bอย่างไร

278 python pandas

5

สร้าง Pandas DataFrame จากสตริง

เพื่อทดสอบการใช้งานบางอย่างฉันต้องการสร้างDataFrameจากสตริง สมมติว่าข้อมูลทดสอบของฉันดูเหมือนว่า: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ วิธีที่ง่ายที่สุดในการอ่านข้อมูลนั้นใน Pandas DataFrameคืออะไร?

276 python string pandas csv csv-import

6

Python Pandas: รับดัชนีแถวที่คอลัมน์ตรงกับค่าที่แน่นอน

รับ DataFrame พร้อมคอลัมน์ "BoolCol" เราต้องการหาดัชนีของ DataFrame ที่ค่าสำหรับ "BoolCol" == True ขณะนี้ฉันมีวิธีการทำซ้ำซึ่งทำงานได้อย่างสมบูรณ์แบบ: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] แต่นี่ไม่ใช่วิธีที่ถูกต้องในการทำแพนด้า หลังจากการวิจัยบางอย่างฉันกำลังใช้รหัสนี้: df[df['BoolCol'] == True].index.tolist() อันนี้ให้ดัชนีรายการของฉัน แต่พวกเขาไม่ตรงกันเมื่อฉันตรวจสอบพวกเขาโดยทำ: df.iloc[i]['BoolCol'] ผลที่ได้คือจริงเท็จ !! สิ่งใดจะเป็นวิธีที่ถูกต้องของนุ่นในการทำเช่นนี้?

276 python indexing pandas

11

จะจัดกลุ่มแถวข้อมูลลงในรายการใน pandas groupby ได้อย่างไร?

ฉันมีกรอบข้อมูลนุ่นdfเหมือน: a b A 1 A 2 B 5 B 5 B 4 C 6 ฉันต้องการจัดกลุ่มตามคอลัมน์แรกและรับคอลัมน์ที่สองเป็นรายการในแถว : A [1,2] B [5,5,4] C [6] เป็นไปได้ไหมที่จะทำสิ่งนี้โดยใช้นุ่นกลุ่ม

274 python pandas list aggregate pandas-groupby

3

วิธีตรวจสอบว่ามีคอลัมน์หนึ่งใน Pandas หรือไม่

มีวิธีการตรวจสอบว่าคอลัมน์มีอยู่ใน Pandas DataFrame หรือไม่? สมมติว่าฉันมี DataFrame ต่อไปนี้: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 …

274 python pandas dataframe

21

แกนในแพนด้าหมายถึงอะไร

นี่คือรหัสของฉันเพื่อสร้าง dataframe: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) จากนั้นฉันได้รับ dataframe: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ เมื่อฉันพิมพ์คำสั่ง: dff.mean(axis=1) ฉันได้ : 0 1.074821 dtype: float64 ตามการอ้างอิงของแพนด้าแกน = 1 หมายถึงคอลัมน์และฉันคาดว่าผลลัพธ์ของคำสั่งจะเป็น A 0.626386 B 1.523255 dtype: float64 ดังนั้นนี่คือคำถามของฉัน: แกนในแพนด้าหมายถึงอะไร

269 python pandas numpy dataframe

10

วิธีนำส่วนข้อมูลคอลัมน์มาเป็นชิ้นแพนด้า

ฉันโหลดข้อมูลการเรียนรู้ของเครื่องจากไฟล์ CSV 2 คอลัมน์แรกคือการสังเกตและคอลัมน์ที่เหลือเป็นคุณลักษณะ ขณะนี้ฉันทำต่อไปนี้: data = pandas.read_csv('mydata.csv') ซึ่งให้บางสิ่งเช่น: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) ฉันต้องการที่จะหั่น dataframe นี้ในสอง dataframes หนึ่งที่มีคอลัมน์aและbและเป็นหนึ่งที่มีคอลัมน์c, และde ไม่สามารถเขียนบางอย่างเช่น observations = data[:'c'] features = data['c':] ฉันไม่แน่ใจว่าวิธีที่ดีที่สุดคืออะไร ฉันต้องมีpd.Panel? โดยวิธีการที่ฉันพบการจัดทำดัชนี dataframe สวยไม่สอดคล้อง: data['a']ได้รับอนุญาต แต่data[0]ไม่ใช่ ในอีกด้านหนึ่งdata['a':]ไม่ได้รับอนุญาต แต่data[0:]เป็น มีเหตุผลในทางปฏิบัติสำหรับสิ่งนี้หรือไม่? นี่จะทำให้สับสนถ้าคอลัมน์ถูกทำดัชนีโดย Intdata[0] != data[0:1]

264 python pandas numpy dataframe slice

8

ฉันจะแปลงชุดแพนด้าหรือดัชนีเป็นอาร์เรย์ Numpy ได้อย่างไร

คุณรู้วิธีรับดัชนีหรือคอลัมน์ของ DataFrame เป็นรายการ NumPy หรือรายการหลามหรือไม่

264 python pandas

10

วิธีเพิ่มคอลัมน์ว่างใน dataframe

วิธีที่ง่ายที่สุดในการเพิ่มคอลัมน์ว่างลงในDataFrameวัตถุแพนด้าคืออะไร สิ่งที่ดีที่สุดที่ฉันเคยเจอคือสิ่งที่ชอบ df['foo'] = df.apply(lambda _: '', axis=1) มีวิธีที่ผิดปกติน้อยลงหรือไม่?

261 python pandas

6

วิธีเพิ่มข้อมูล pandas ไปยังไฟล์ csv ที่มีอยู่

ฉันต้องการทราบว่าเป็นไปได้หรือไม่ที่จะใช้to_csv()ฟังก์ชั่นแพนด้าเพื่อเพิ่มดาต้าเฟรมให้กับไฟล์ csv ที่มีอยู่ ไฟล์ csv มีโครงสร้างเดียวกันกับข้อมูลที่โหลด

259 python pandas csv dataframe

11

จะวางรายการแถวจากดาต้าดาต้าเฟรมได้อย่างไร?

ฉันมี dataframe df: >>> df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 จากนั้นฉันต้องการวางแถวด้วยหมายเลขลำดับที่ระบุไว้ในรายการสมมติว่าที่นี่[1,2,4],เหลืออยู่แล้ว: sales discount net_sales cogs STK_ID RPT_Date 600141 …

259 python pandas

คำถามติดแท็ก pandas