การเขียนโปรแกรม pandas

10

พริตตี้พิมพ์ Pandas Series / DataFrame ทั้งหมด

ฉันทำงานกับ Series และ DataFrames บนเทอร์มินัลเป็นจำนวนมาก ค่าเริ่มต้น__repr__สำหรับซีรี่ส์จะส่งคืนตัวอย่างที่ลดลงโดยมีค่าส่วนหัวและส่วนท้าย แต่ส่วนที่เหลือหายไป มีวิธีการพิมพ์สวย ๆ ในซีรีส์ / DataFrame ทั้งหมดหรือไม่? จะเป็นการดีที่จะสนับสนุนการจัดตำแหน่งที่เหมาะสมอาจจะเส้นขอบระหว่างคอลัมน์และอาจเข้ารหัสสีสำหรับคอลัมน์ที่แตกต่างกัน

651 python pandas dataframe

3

iloc, ix และ loc แตกต่างกันอย่างไร?

มีใครบ้างที่สามารถอธิบายวิธีการหั่นทั้งสามวิธีนี้แตกต่างกัน ฉันเห็นเอกสารและฉันเห็นคำตอบเหล่านี้ แล้ว แต่ฉันก็ยังพบว่าตัวเองไม่สามารถอธิบายได้ว่าทั้งสามนั้นแตกต่างกันอย่างไร สำหรับฉันพวกเขาดูเหมือนจะเปลี่ยนได้ในส่วนใหญ่เพราะพวกเขาอยู่ในระดับที่ต่ำกว่าของการหั่น DataFrameตัวอย่างเช่นสมมติว่าเราต้องการที่จะได้รับห้าแถวแรกของ งานทั้งสามนี้เป็นอย่างไร df.loc[:5] df.ix[:5] df.iloc[:5] ใครบางคนสามารถนำเสนอสามกรณีที่ความแตกต่างในการใช้งานมีความชัดเจน?

636 python pandas indexing dataframe

15

จะจัดการกับ SettingWithCopyWarning ใน Pandas ได้อย่างไร?

พื้นหลัง ฉันเพิ่งอัพเกรด Pandas จาก 0.11 เป็น 0.13.0rc1 ตอนนี้แอปพลิเคชันกำลังเปิดตัวคำเตือนใหม่ ๆ มากมาย หนึ่งในนั้นเช่นนี้ E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE ฉันต้องการรู้ว่ามันแปลว่าอะไร? ฉันจำเป็นต้องเปลี่ยนบางสิ่งหรือไม่ ฉันควรจะระงับการเตือนถ้าผมยืนยันการใช้งานquote_df['TVol'] = quote_df['TVol']/TVOL_SCALE? ฟังก์ชั่นที่ให้ข้อผิดพลาด def _decode_stock_quote(list_of_150_stk_str): """decode the webpage and …

629 python pandas dataframe chained-assignment

16

ฉันจะขยายการแสดงผลลัพธ์เพื่อดูคอลัมน์เพิ่มเติมของ DataFrame แพนด้าได้อย่างไร

มีวิธีที่จะขยายการแสดงผลในโหมดโต้ตอบหรือการดำเนินการสคริปต์ทั้ง? โดยเฉพาะผมใช้ฟังก์ชั่นเกี่ยวกับหมีแพนด้าdescribe() DataFrameเมื่อDataFrameกว้าง 5 คอลัมน์ (ป้ายกำกับ) ฉันจะได้รับสถิติเชิงพรรณนาที่ฉันต้องการ อย่างไรก็ตามหากDataFrameมีคอลัมน์เพิ่มเติมสถิติจะถูกระงับและสิ่งนี้จะถูกส่งคืน: >> Index: 8 entries, count to max >> Data columns: >> x1 8 non-null values >> x2 8 non-null values >> x3 8 non-null values >> x4 8 non-null values >> x5 8 non-null values >> x6 8 non-null values >> x7 …

622 python pandas printing column-width

9

การลบแถว DataFrame ในนุ่นตามค่าคอลัมน์

ฉันมี DataFrame ต่อไปนี้: daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 67 1.000000 67.000000 2007-02-10 111 9 66 1.000000 66.000000 2007-01-13 139 10 83 0.880678 73.096278 2006-12-23 160 10 88 0.793033 69.786942 2006-11-09 204 9 52 0.636655 33.106077 2006-10-22 222 8 66 0.581946 …

510 python pandas

9

การแปลงเอาต์พุต Pandas GroupBy จาก Series เป็น DataFrame

ฉันเริ่มด้วยข้อมูลอินพุตแบบนี้ df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) ซึ่งเมื่อพิมพ์ปรากฏเป็นดังนี้: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory การจัดกลุ่มนั้นง่ายพอ: g1 = df1.groupby( …

495 python pandas dataframe pandas-groupby multi-index

22

รวมสองคอลัมน์ของข้อความใน dataframe ใน pandas / python

ฉันมี dataframe 20 x 4000 ใน Python โดยใช้แพนด้า สองคอลัมน์เหล่านี้จะถูกตั้งชื่อและYear quarterฉันต้องการที่จะสร้างตัวแปรที่เรียกว่าperiodทำให้Year = 2000และเข้าquarter= q22000q2 มีใครสามารถช่วยได้บ้าง

487 python pandas numpy dataframe

21

วิธีตรวจสอบว่าค่าใด ๆ เป็น NaN ใน Pandas DataFrame

ใน Python Pandas วิธีที่ดีที่สุดในการตรวจสอบว่า DataFrame มีหนึ่ง NaN มากกว่าหนึ่งค่าคืออะไร ฉันรู้เกี่ยวกับฟังก์ชั่นpd.isnanนี้ แต่คืนค่า DataFrame ของ booleans สำหรับแต่ละองค์ประกอบ โพสต์นี้ตรงนี้ไม่ตอบคำถามของฉันอย่างแน่นอน

483 python pandas dataframe nan

20

กำหนดค่าสำหรับเซลล์เฉพาะใน pandas DataFrame โดยใช้ดัชนี

ฉันสร้าง Panda DataFrame แล้ว df = DataFrame(index=['A','B','C'], columns=['x','y']) และได้สิ่งนี้ เซ็กซี่ A NaN NaN B NaN NaN C NaN NaN จากนั้นฉันต้องการกำหนดค่าให้กับเซลล์เฉพาะเช่นแถว 'C' และคอลัมน์ 'x' ฉันคาดว่าจะได้รับผลลัพธ์เช่นนี้: เซ็กซี่ A NaN NaN B NaN NaN C 10 น่าน ด้วยรหัสนี้: df.xs('C')['x'] = 10 แต่เนื้อหาของdfยังไม่ได้เปลี่ยน มันเป็นเพียงNaNใน DataFrame เท่านั้น ข้อเสนอแนะใด ๆ

478 python pandas dataframe

10

ความแตกต่างระหว่างแผนที่, Applymap และวิธีการใช้ใน Pandas

คุณสามารถบอกฉันได้เมื่อใดที่จะใช้วิธีการเวกเตอร์เหล่านี้กับตัวอย่างพื้นฐาน? ฉันเห็นว่าmapเป็นSeriesวิธีการในขณะที่ส่วนที่เหลือเป็นDataFrameวิธีการ ฉันสับสนapplyและapplymapวิธีการต่าง ๆ ทำไมเรามีสองวิธีในการใช้ฟังก์ชั่นกับ DataFrame อีกครั้งตัวอย่างง่ายๆที่แสดงการใช้งานจะยอดเยี่ยม!

465 python pandas dataframe vectorization

15

แปลง dataframe แพนด้าเป็นอาร์เรย์ NumPy

ฉันสนใจที่จะรู้วิธีการแปลงดาต้าดาต้าแพนด้าเป็นอาเรม NumPy dataframe: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': …

465 python arrays pandas numpy dataframe

5

สร้าง Pandas DataFrame ที่ว่างเปล่าแล้วกรอกข้อมูลหรือไม่

ฉันเริ่มต้นจากเอกสาร DataFrame ของแพนด้าที่นี่: http://pandas.pydata.org/pandas-docs/stable/dsintro.html ฉันต้องการเติม DataFrame ด้วยค่าในการคำนวณอนุกรมเวลาซ้ำ ๆ โดยพื้นฐานแล้วฉันต้องการเริ่มต้น DataFrame ด้วยคอลัมน์ A, B และแถวเวลาประทับทั้งหมด 0 หรือ NaN ทั้งหมด ฉันจะเพิ่มค่าเริ่มต้นและดูข้อมูลนี้จากการคำนวณแถวใหม่จากแถวก่อนพูดrow[A][t] = row[A][t-1]+1หรืออย่างนั้น ขณะนี้ฉันกำลังใช้รหัสด้านล่าง แต่ฉันรู้สึกว่ามันน่าเกลียดและต้องมีวิธีการทำเช่นนี้กับ DataFrame โดยตรงหรือเป็นวิธีที่ดีกว่าโดยทั่วไป หมายเหตุ: ฉันใช้ Python 2.7 import datetime as dt import pandas as pd import scipy as s if __name__ == '__main__': base = dt.datetime.today().date() dates = …

461 python dataframe pandas

12

ฉันจะแทนที่ค่า NaN ทั้งหมดด้วย Zeros ในคอลัมน์ของ pandas dataframe ได้อย่างไร

ฉันมีชื่อไฟล์ดังต่อไปนี้ itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 485 2012-09-30 00:00:00 113702 76 …

460 python pandas dataframe

24

วิธีการนับค่า NaN ในคอลัมน์ใน pandas DataFrame

ฉันมีข้อมูลที่ฉันต้องการค้นหาจำนวนNaNเพื่อที่ว่าถ้ามันน้อยกว่าขีด จำกัด บางอย่างฉันจะวางคอลัมน์นี้ ฉันดูแล้ว แต่ไม่พบฟังก์ชันใด ๆ สำหรับสิ่งนี้ มีvalue_countsแต่มันจะช้าสำหรับฉันเพราะค่าส่วนใหญ่แตกต่างกันและฉันต้องการนับNaNเท่านั้น

459 python pandas dataframe

7

วิธีแปลงดัชนีของดาต้าดาต้าแพนด้าให้เป็นคอลัมน์?

ดูเหมือนว่าจะค่อนข้างชัดเจน แต่ฉันไม่สามารถหาวิธีแปลงดัชนีของเฟรมข้อมูลเป็นคอลัมน์ได้ ตัวอย่างเช่น: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 ถึง, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596

456 python pandas dataframe

คำถามติดแท็ก pandas