คำถามติดแท็ก pandas

Pandas เป็นห้องสมุด Python สำหรับการจัดการและวิเคราะห์ข้อมูลเช่น dataframes, อนุกรมเวลาหลายมิติและชุดข้อมูลแบบตัดขวางซึ่งมักพบในสถิติ, ผลการทดลองทางวิทยาศาสตร์, เศรษฐมิติหรือการเงิน Pandas เป็นหนึ่งในห้องสมุดวิทยาศาสตร์ข้อมูลที่สำคัญใน Python



6
การสร้าง Pandas DataFrame จากอาร์เรย์ Numpy: ฉันจะระบุคอลัมน์ดัชนีและส่วนหัวของคอลัมน์ได้อย่างไร
ฉันมีอาร์เรย์ Numpy ซึ่งประกอบด้วยรายการหลายรายการซึ่งแสดงถึงอาร์เรย์สองมิติพร้อมป้ายชื่อแถวและชื่อคอลัมน์ตามที่แสดงด้านล่าง: data = array([['','Col1','Col2'],['Row1',1,2],['Row2',3,4]]) ฉันต้องการให้ DataFrame ส่งผลให้มี Row1 และ Row2 เป็นค่าดัชนีและ Col1, Col2 เป็นค่าส่วนหัว ฉันสามารถระบุดัชนีได้ดังนี้: df = pd.DataFrame(data,index=data[:,0]), อย่างไรก็ตามฉันไม่แน่ใจว่าจะกำหนดส่วนหัวคอลัมน์ได้อย่างไร
281 python  pandas  numpy 

8
รวมสองซีรี่ส์เข้ากับ DataFrame ในนุ่น
ฉันมีสองซีรี่ส์s1และs2มีดัชนีเดียวกัน (ไม่ต่อเนื่องกัน) ฉันจะรวมs1และs2เป็นสองคอลัมน์ใน DataFrame และเก็บหนึ่งในดัชนีเป็นคอลัมน์ที่สามได้อย่างไร

8
วิธีเลือกคอลัมน์ทั้งหมดยกเว้นหนึ่งคอลัมน์ในนุ่น
ฉันมีชื่อไฟล์ลักษณะเช่นนี้: import pandas import numpy as np df = DataFrame(np.random.rand(4,4), columns = list('abcd')) df a b c d 0 0.418762 0.042369 0.869203 0.972314 1 0.991058 0.510228 0.594784 0.534366 2 0.407472 0.259811 0.396664 0.894202 3 0.726168 0.139531 0.324932 0.906575 ฉันจะรับคอลัมน์ทั้งหมดได้column bอย่างไร
278 python  pandas 

5
สร้าง Pandas DataFrame จากสตริง
เพื่อทดสอบการใช้งานบางอย่างฉันต้องการสร้างDataFrameจากสตริง สมมติว่าข้อมูลทดสอบของฉันดูเหมือนว่า: TESTDATA="""col1;col2;col3 1;4.4;99 2;4.5;200 3;4.7;65 4;3.2;140 """ วิธีที่ง่ายที่สุดในการอ่านข้อมูลนั้นใน Pandas DataFrameคืออะไร?

6
Python Pandas: รับดัชนีแถวที่คอลัมน์ตรงกับค่าที่แน่นอน
รับ DataFrame พร้อมคอลัมน์ "BoolCol" เราต้องการหาดัชนีของ DataFrame ที่ค่าสำหรับ "BoolCol" == True ขณะนี้ฉันมีวิธีการทำซ้ำซึ่งทำงานได้อย่างสมบูรณ์แบบ: for i in range(100,3000): if df.iloc[i]['BoolCol']== True: print i,df.iloc[i]['BoolCol'] แต่นี่ไม่ใช่วิธีที่ถูกต้องในการทำแพนด้า หลังจากการวิจัยบางอย่างฉันกำลังใช้รหัสนี้: df[df['BoolCol'] == True].index.tolist() อันนี้ให้ดัชนีรายการของฉัน แต่พวกเขาไม่ตรงกันเมื่อฉันตรวจสอบพวกเขาโดยทำ: df.iloc[i]['BoolCol'] ผลที่ได้คือจริงเท็จ !! สิ่งใดจะเป็นวิธีที่ถูกต้องของนุ่นในการทำเช่นนี้?
276 python  indexing  pandas 

11
จะจัดกลุ่มแถวข้อมูลลงในรายการใน pandas groupby ได้อย่างไร?
ฉันมีกรอบข้อมูลนุ่นdfเหมือน: a b A 1 A 2 B 5 B 5 B 4 C 6 ฉันต้องการจัดกลุ่มตามคอลัมน์แรกและรับคอลัมน์ที่สองเป็นรายการในแถว : A [1,2] B [5,5,4] C [6] เป็นไปได้ไหมที่จะทำสิ่งนี้โดยใช้นุ่นกลุ่ม

3
วิธีตรวจสอบว่ามีคอลัมน์หนึ่งใน Pandas หรือไม่
มีวิธีการตรวจสอบว่าคอลัมน์มีอยู่ใน Pandas DataFrame หรือไม่? สมมติว่าฉันมี DataFrame ต่อไปนี้: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) >>> df A B C 0 3 40 100 …
274 python  pandas  dataframe 

21
แกนในแพนด้าหมายถึงอะไร
นี่คือรหัสของฉันเพื่อสร้าง dataframe: import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(1,2),columns=list('AB')) จากนั้นฉันได้รับ dataframe: +------------+---------+--------+ | | A | B | +------------+---------+--------- | 0 | 0.626386| 1.52325| +------------+---------+--------+ เมื่อฉันพิมพ์คำสั่ง: dff.mean(axis=1) ฉันได้ : 0 1.074821 dtype: float64 ตามการอ้างอิงของแพนด้าแกน = 1 หมายถึงคอลัมน์และฉันคาดว่าผลลัพธ์ของคำสั่งจะเป็น A 0.626386 B 1.523255 dtype: float64 ดังนั้นนี่คือคำถามของฉัน: แกนในแพนด้าหมายถึงอะไร

10
วิธีนำส่วนข้อมูลคอลัมน์มาเป็นชิ้นแพนด้า
ฉันโหลดข้อมูลการเรียนรู้ของเครื่องจากไฟล์ CSV 2 คอลัมน์แรกคือการสังเกตและคอลัมน์ที่เหลือเป็นคุณลักษณะ ขณะนี้ฉันทำต่อไปนี้: data = pandas.read_csv('mydata.csv') ซึ่งให้บางสิ่งเช่น: data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) ฉันต้องการที่จะหั่น dataframe นี้ในสอง dataframes หนึ่งที่มีคอลัมน์aและbและเป็นหนึ่งที่มีคอลัมน์c, และde ไม่สามารถเขียนบางอย่างเช่น observations = data[:'c'] features = data['c':] ฉันไม่แน่ใจว่าวิธีที่ดีที่สุดคืออะไร ฉันต้องมีpd.Panel? โดยวิธีการที่ฉันพบการจัดทำดัชนี dataframe สวยไม่สอดคล้อง: data['a']ได้รับอนุญาต แต่data[0]ไม่ใช่ ในอีกด้านหนึ่งdata['a':]ไม่ได้รับอนุญาต แต่data[0:]เป็น มีเหตุผลในทางปฏิบัติสำหรับสิ่งนี้หรือไม่? นี่จะทำให้สับสนถ้าคอลัมน์ถูกทำดัชนีโดย Intdata[0] != data[0:1]


10
วิธีเพิ่มคอลัมน์ว่างใน dataframe
วิธีที่ง่ายที่สุดในการเพิ่มคอลัมน์ว่างลงในDataFrameวัตถุแพนด้าคืออะไร สิ่งที่ดีที่สุดที่ฉันเคยเจอคือสิ่งที่ชอบ df['foo'] = df.apply(lambda _: '', axis=1) มีวิธีที่ผิดปกติน้อยลงหรือไม่?
261 python  pandas 

6
วิธีเพิ่มข้อมูล pandas ไปยังไฟล์ csv ที่มีอยู่
ฉันต้องการทราบว่าเป็นไปได้หรือไม่ที่จะใช้to_csv()ฟังก์ชั่นแพนด้าเพื่อเพิ่มดาต้าเฟรมให้กับไฟล์ csv ที่มีอยู่ ไฟล์ csv มีโครงสร้างเดียวกันกับข้อมูลที่โหลด
259 python  pandas  csv  dataframe 

11
จะวางรายการแถวจากดาต้าดาต้าเฟรมได้อย่างไร?
ฉันมี dataframe df: >>> df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 จากนั้นฉันต้องการวางแถวด้วยหมายเลขลำดับที่ระบุไว้ในรายการสมมติว่าที่นี่[1,2,4],เหลืออยู่แล้ว: sales discount net_sales cogs STK_ID RPT_Date 600141 …
259 python  pandas 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.