คำถามติดแท็ก pandas

Pandas เป็นห้องสมุด Python สำหรับการจัดการและวิเคราะห์ข้อมูลเช่น dataframes, อนุกรมเวลาหลายมิติและชุดข้อมูลแบบตัดขวางซึ่งมักพบในสถิติ, ผลการทดลองทางวิทยาศาสตร์, เศรษฐมิติหรือการเงิน Pandas เป็นหนึ่งในห้องสมุดวิทยาศาสตร์ข้อมูลที่สำคัญใน Python

10
พริตตี้พิมพ์ Pandas Series / DataFrame ทั้งหมด
ฉันทำงานกับ Series และ DataFrames บนเทอร์มินัลเป็นจำนวนมาก ค่าเริ่มต้น__repr__สำหรับซีรี่ส์จะส่งคืนตัวอย่างที่ลดลงโดยมีค่าส่วนหัวและส่วนท้าย แต่ส่วนที่เหลือหายไป มีวิธีการพิมพ์สวย ๆ ในซีรีส์ / DataFrame ทั้งหมดหรือไม่? จะเป็นการดีที่จะสนับสนุนการจัดตำแหน่งที่เหมาะสมอาจจะเส้นขอบระหว่างคอลัมน์และอาจเข้ารหัสสีสำหรับคอลัมน์ที่แตกต่างกัน
651 python  pandas  dataframe 

3
iloc, ix และ loc แตกต่างกันอย่างไร?
มีใครบ้างที่สามารถอธิบายวิธีการหั่นทั้งสามวิธีนี้แตกต่างกัน ฉันเห็นเอกสารและฉันเห็นคำตอบเหล่านี้ แล้ว แต่ฉันก็ยังพบว่าตัวเองไม่สามารถอธิบายได้ว่าทั้งสามนั้นแตกต่างกันอย่างไร สำหรับฉันพวกเขาดูเหมือนจะเปลี่ยนได้ในส่วนใหญ่เพราะพวกเขาอยู่ในระดับที่ต่ำกว่าของการหั่น DataFrameตัวอย่างเช่นสมมติว่าเราต้องการที่จะได้รับห้าแถวแรกของ งานทั้งสามนี้เป็นอย่างไร df.loc[:5] df.ix[:5] df.iloc[:5] ใครบางคนสามารถนำเสนอสามกรณีที่ความแตกต่างในการใช้งานมีความชัดเจน?

15
จะจัดการกับ SettingWithCopyWarning ใน Pandas ได้อย่างไร?
พื้นหลัง ฉันเพิ่งอัพเกรด Pandas จาก 0.11 เป็น 0.13.0rc1 ตอนนี้แอปพลิเคชันกำลังเปิดตัวคำเตือนใหม่ ๆ มากมาย หนึ่งในนั้นเช่นนี้ E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_index,col_indexer] = value instead quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE ฉันต้องการรู้ว่ามันแปลว่าอะไร? ฉันจำเป็นต้องเปลี่ยนบางสิ่งหรือไม่ ฉันควรจะระงับการเตือนถ้าผมยืนยันการใช้งานquote_df['TVol'] = quote_df['TVol']/TVOL_SCALE? ฟังก์ชั่นที่ให้ข้อผิดพลาด def _decode_stock_quote(list_of_150_stk_str): """decode the webpage and …

16
ฉันจะขยายการแสดงผลลัพธ์เพื่อดูคอลัมน์เพิ่มเติมของ DataFrame แพนด้าได้อย่างไร
มีวิธีที่จะขยายการแสดงผลในโหมดโต้ตอบหรือการดำเนินการสคริปต์ทั้ง? โดยเฉพาะผมใช้ฟังก์ชั่นเกี่ยวกับหมีแพนด้าdescribe() DataFrameเมื่อDataFrameกว้าง 5 คอลัมน์ (ป้ายกำกับ) ฉันจะได้รับสถิติเชิงพรรณนาที่ฉันต้องการ อย่างไรก็ตามหากDataFrameมีคอลัมน์เพิ่มเติมสถิติจะถูกระงับและสิ่งนี้จะถูกส่งคืน: >> Index: 8 entries, count to max >> Data columns: >> x1 8 non-null values >> x2 8 non-null values >> x3 8 non-null values >> x4 8 non-null values >> x5 8 non-null values >> x6 8 non-null values >> x7 …


9
การแปลงเอาต์พุต Pandas GroupBy จาก Series เป็น DataFrame
ฉันเริ่มด้วยข้อมูลอินพุตแบบนี้ df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } ) ซึ่งเมื่อพิมพ์ปรากฏเป็นดังนี้: City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory การจัดกลุ่มนั้นง่ายพอ: g1 = df1.groupby( …

22
รวมสองคอลัมน์ของข้อความใน dataframe ใน pandas / python
ฉันมี dataframe 20 x 4000 ใน Python โดยใช้แพนด้า สองคอลัมน์เหล่านี้จะถูกตั้งชื่อและYear quarterฉันต้องการที่จะสร้างตัวแปรที่เรียกว่าperiodทำให้Year = 2000และเข้าquarter= q22000q2 มีใครสามารถช่วยได้บ้าง

21
วิธีตรวจสอบว่าค่าใด ๆ เป็น NaN ใน Pandas DataFrame
ใน Python Pandas วิธีที่ดีที่สุดในการตรวจสอบว่า DataFrame มีหนึ่ง NaN มากกว่าหนึ่งค่าคืออะไร ฉันรู้เกี่ยวกับฟังก์ชั่นpd.isnanนี้ แต่คืนค่า DataFrame ของ booleans สำหรับแต่ละองค์ประกอบ โพสต์นี้ตรงนี้ไม่ตอบคำถามของฉันอย่างแน่นอน
483 python  pandas  dataframe  nan 

20
กำหนดค่าสำหรับเซลล์เฉพาะใน pandas DataFrame โดยใช้ดัชนี
ฉันสร้าง Panda DataFrame แล้ว df = DataFrame(index=['A','B','C'], columns=['x','y']) และได้สิ่งนี้ เซ็กซี่ A NaN NaN B NaN NaN C NaN NaN จากนั้นฉันต้องการกำหนดค่าให้กับเซลล์เฉพาะเช่นแถว 'C' และคอลัมน์ 'x' ฉันคาดว่าจะได้รับผลลัพธ์เช่นนี้: เซ็กซี่ A NaN NaN B NaN NaN C 10 น่าน ด้วยรหัสนี้: df.xs('C')['x'] = 10 แต่เนื้อหาของdfยังไม่ได้เปลี่ยน มันเป็นเพียงNaNใน DataFrame เท่านั้น ข้อเสนอแนะใด ๆ
478 python  pandas  dataframe 

10
ความแตกต่างระหว่างแผนที่, Applymap และวิธีการใช้ใน Pandas
คุณสามารถบอกฉันได้เมื่อใดที่จะใช้วิธีการเวกเตอร์เหล่านี้กับตัวอย่างพื้นฐาน? ฉันเห็นว่าmapเป็นSeriesวิธีการในขณะที่ส่วนที่เหลือเป็นDataFrameวิธีการ ฉันสับสนapplyและapplymapวิธีการต่าง ๆ ทำไมเรามีสองวิธีในการใช้ฟังก์ชั่นกับ DataFrame อีกครั้งตัวอย่างง่ายๆที่แสดงการใช้งานจะยอดเยี่ยม!

15
แปลง dataframe แพนด้าเป็นอาร์เรย์ NumPy
ฉันสนใจที่จะรู้วิธีการแปลงดาต้าดาต้าแพนด้าเป็นอาเรม NumPy dataframe: import numpy as np import pandas as pd index = [1, 2, 3, 4, 5, 6, 7] a = [np.nan, np.nan, np.nan, 0.1, 0.1, 0.1, 0.1] b = [0.2, np.nan, 0.2, 0.2, 0.2, np.nan, np.nan] c = [np.nan, 0.5, 0.5, np.nan, 0.5, 0.5, np.nan] df = pd.DataFrame({'A': …

5
สร้าง Pandas DataFrame ที่ว่างเปล่าแล้วกรอกข้อมูลหรือไม่
ฉันเริ่มต้นจากเอกสาร DataFrame ของแพนด้าที่นี่: http://pandas.pydata.org/pandas-docs/stable/dsintro.html ฉันต้องการเติม DataFrame ด้วยค่าในการคำนวณอนุกรมเวลาซ้ำ ๆ โดยพื้นฐานแล้วฉันต้องการเริ่มต้น DataFrame ด้วยคอลัมน์ A, B และแถวเวลาประทับทั้งหมด 0 หรือ NaN ทั้งหมด ฉันจะเพิ่มค่าเริ่มต้นและดูข้อมูลนี้จากการคำนวณแถวใหม่จากแถวก่อนพูดrow[A][t] = row[A][t-1]+1หรืออย่างนั้น ขณะนี้ฉันกำลังใช้รหัสด้านล่าง แต่ฉันรู้สึกว่ามันน่าเกลียดและต้องมีวิธีการทำเช่นนี้กับ DataFrame โดยตรงหรือเป็นวิธีที่ดีกว่าโดยทั่วไป หมายเหตุ: ฉันใช้ Python 2.7 import datetime as dt import pandas as pd import scipy as s if __name__ == '__main__': base = dt.datetime.today().date() dates = …
461 python  dataframe  pandas 

12
ฉันจะแทนที่ค่า NaN ทั้งหมดด้วย Zeros ในคอลัมน์ของ pandas dataframe ได้อย่างไร
ฉันมีชื่อไฟล์ดังต่อไปนี้ itm Date Amount 67 420 2012-09-30 00:00:00 65211 68 421 2012-09-09 00:00:00 29424 69 421 2012-09-16 00:00:00 29877 70 421 2012-09-23 00:00:00 30990 71 421 2012-09-30 00:00:00 61303 72 485 2012-09-09 00:00:00 71781 73 485 2012-09-16 00:00:00 NaN 74 485 2012-09-23 00:00:00 11072 75 485 2012-09-30 00:00:00 113702 76 …
460 python  pandas  dataframe 

24
วิธีการนับค่า NaN ในคอลัมน์ใน pandas DataFrame
ฉันมีข้อมูลที่ฉันต้องการค้นหาจำนวนNaNเพื่อที่ว่าถ้ามันน้อยกว่าขีด จำกัด บางอย่างฉันจะวางคอลัมน์นี้ ฉันดูแล้ว แต่ไม่พบฟังก์ชันใด ๆ สำหรับสิ่งนี้ มีvalue_countsแต่มันจะช้าสำหรับฉันเพราะค่าส่วนใหญ่แตกต่างกันและฉันต้องการนับNaNเท่านั้น
459 python  pandas  dataframe 

7
วิธีแปลงดัชนีของดาต้าดาต้าแพนด้าให้เป็นคอลัมน์?
ดูเหมือนว่าจะค่อนข้างชัดเจน แต่ฉันไม่สามารถหาวิธีแปลงดัชนีของเฟรมข้อมูลเป็นคอลัมน์ได้ ตัวอย่างเช่น: df= gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 ถึง, df= index1 gi ptt_loc 0 0 384444683 593 1 1 384444684 594 2 2 384444686 596
456 python  pandas  dataframe 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.