การเขียนโปรแกรม pandas

10

สิ่งที่ฉันพยายามจะทำคือดึงข้อมูลระดับความสูงจาก google maps API ไปตามเส้นทางที่ระบุโดยพิกัดละติจูดและลองจิจูดดังนี้: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() สิ่งนี้ทำให้ฉันมีข้อมูลที่มีลักษณะเช่นนี้: elevations.splitlines() ['{', ' "results" : [', ' {', ' "elevation" : 243.3462677001953,', ' "location" : {', ' "lat" : 42.974049,', ' "lng" : -81.205203', ' },', ' …

144 python json google-maps pandas

5

การแก้ไขเซ็ตย่อยของแถวใน pafas dataframe

สมมติว่าฉันมี DataFrame นุ่นที่มีสองคอลัมน์ A และ B ฉันต้องการแก้ไข DataFrame นี้ (หรือสร้างสำเนา) เพื่อที่ B จะเป็น NaN ทุกครั้งที่ A คือ 0 ฉันจะทำสิ่งนั้นได้อย่างไร ฉันพยายามต่อไปนี้ df['A'==0]['B'] = np.nan และ df['A'==0]['B'].values.fill(np.nan) ปราศจากความสำเร็จ.

143 python pandas

6

วิธีรับคอลัมน์แรกของ DataFrame แพนด้าเป็น Series

ฉันเหนื่อย: x=pandas.DataFrame(...) s = x.take([0], axis=1) และsรับ DataFrame ไม่ใช่ Series

143 python dataframe pandas series

13

จะแสดงชื่อคอลัมน์ทั้งหมดบนแพนด้าดาต้าเฟรมได้อย่างไร

ฉันมีดาต้าเฟรมที่ประกอบด้วยคอลัมน์หลายร้อยคอลัมน์และฉันต้องการดูชื่อคอลัมน์ทั้งหมด ฉันทำอะไรไป: In[37]: data_all2.columns ผลลัพธ์คือ: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) ฉันจะแสดงคอลัมน์ทั้งหมดแทนรายการที่ถูกตัดทอนได้อย่างไร

142 python pandas dataframe show

11

การแทนที่ค่าคอลัมน์ใน pandas DataFrame

ฉันพยายามแทนที่ค่าในหนึ่งคอลัมน์ของ dataframe คอลัมน์ ('หญิง') มีเฉพาะค่า 'หญิง' และ 'ชาย' ฉันได้ลองทำสิ่งต่อไปนี้แล้ว: w['female']['female']='1' w['female']['male']='0' แต่รับสำเนาผลลัพธ์เดียวกันก่อนหน้านี้ทุกประการ ฉันต้องการที่จะรับเอาท์พุทที่คล้ายกับองค์ประกอบวนรอบต่อไปนี้ if w['female'] =='female': w['female'] = '1'; else: w['female'] = '0'; ฉันดูเอกสาร gotchas ( http://pandas.pydata.org/pandas-docs/stable/gotchas.html ) แต่ไม่สามารถเข้าใจได้ว่าทำไมไม่มีอะไรเกิดขึ้น ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม.

141 python pandas

6

ตรวจสอบว่ามีค่าอยู่ในดัชนี dataframe ของแพนด้า

ฉันแน่ใจว่ามีวิธีที่ชัดเจนในการทำเช่นนี้ แต่ไม่สามารถคิดถึงสิ่งที่ลื่นไหลได้ในตอนนี้ โดยทั่วไปแทนที่จะยกข้อยกเว้นฉันต้องการได้รับTrueหรือFalseดูว่ามีค่าอยู่ในdfดัชนีแพนด้า import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) สิ่งที่ฉันทำงานตอนนี้มีดังต่อไปนี้ sum(df.index == 'g')

139 python pandas ipython

6

คอลัมน์ดาต้าเฟรมแพนด้าปรับขนาดด้วย sklearn

ฉันมีดาต้าเฟรมแพนด้าที่มีคอลัมน์ประเภทผสมและฉันต้องการใช้ min_max_scaler ของ sklearn กับบางคอลัมน์ ตามหลักการแล้วฉันต้องการทำการเปลี่ยนแปลงเหล่านี้ในสถานที่ แต่ยังไม่ได้หาวิธีที่จะทำ ฉันได้เขียนโค้ดต่อไปนี้ที่ใช้งานได้: import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','small']}) min_max_scaler = preprocessing.MinMaxScaler() def scaleColumns(df, cols_to_scale): for col in cols_to_scale: df[col] = pd.DataFrame(min_max_scaler.fit_transform(pd.DataFrame(dfTest[col])),columns=[col]) return df dfTest A B C 0 14.00 103.02 big …

138 python pandas scikit-learn dataframe

6

แพนด้า: ฉันจะแยกข้อความในคอลัมน์ออกเป็นหลายแถวได้อย่างไร

ฉันกำลังทำงานกับไฟล์ csv ขนาดใหญ่และถัดจากคอลัมน์สุดท้ายมีสตริงข้อความที่ฉันต้องการแยกด้วยตัวคั่นเฉพาะ ฉันสงสัยว่ามีวิธีง่ายๆในการทำเช่นนี้โดยใช้แพนด้าหรืองูหลามหรือไม่? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 ฉันต้องการแบ่งตามช่องว่าง(' ')และเครื่องหมายทวิภาค(':')ในSeatblocksคอลัมน์ แต่แต่ละเซลล์จะทำให้จำนวนคอลัมน์ต่างกัน ฉันมีฟังก์ชั่นจัดเรียงคอลัมน์ใหม่ให้Seatblocksคอลัมน์อยู่ท้ายแผ่นงาน แต่ฉันไม่แน่ใจว่าต้องทำอะไรจากตรงนั้น ฉันสามารถทำได้ใน excel ด้วยtext-to-columnsฟังก์ชันในตัวและมาโครด่วน แต่ชุดข้อมูลของฉันมีระเบียนมากเกินไปสำหรับ excel ที่จะจัดการ ในที่สุดฉันต้องการบันทึกเช่นของ John Lennon และสร้างหลายบรรทัดโดยมีข้อมูลจากชุดที่นั่งแต่ละชุดแยกกัน

137 python pandas dataframe

4

วิธีใดที่มีประสิทธิภาพที่สุดในการสร้างพจนานุกรมของ Dataframe แพนด้าสองคอลัมน์

วิธีใดที่มีประสิทธิภาพที่สุดในการจัดระเบียบ Dataframe แพนด้าต่อไปนี้: ข้อมูล = Position Letter 1 a 2 b 3 c 4 d 5 e ลงในพจนานุกรมเช่นalphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

137 python dictionary pandas dataframe

6

วิธีโหลดไฟล์ tsv ไปยัง Pandas DataFrame

ฉันยังใหม่กับงูหลามและหมีแพนด้า ฉันพยายามที่จะได้รับไฟล์โหลดลงในหมีแพนด้า tsvDataFrame นี่คือสิ่งที่ฉันพยายามและข้อผิดพลาดที่ฉันได้รับ: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') PandasError: DataFrame constructor not properly called!

136 python pandas csv

8

แพนด้าค่าที่ไม่ซ้ำกันหลายคอลัมน์

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) วิธีใดที่ดีที่สุดในการคืนค่าเฉพาะของ 'Col1' และ 'Col2' ผลลัพธ์ที่ต้องการคือ 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

136 python pandas dataframe unique

4

ปัญหาการเข้าร่วมของ Pandas: คอลัมน์ทับซ้อนกัน แต่ไม่ได้ระบุคำต่อท้าย

ฉันมีกรอบข้อมูล 2 รายการต่อไปนี้: df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 7 เมื่อฉันพยายามเข้าร่วม 2 dataframes …

136 python join pandas

6

ฉันจะแมป True / False กับ 1/0 ใน Pandas DataFrame ได้อย่างไร

ฉันมีคอลัมน์ใน DataFrame ของ python pandas ที่มีค่าบูลีน True / False แต่สำหรับการคำนวณเพิ่มเติมฉันต้องการการแสดง 1/0 มีวิธีทำแบบนี้หรือไม่?

136 python numpy pandas

8

แพนด้าแยกคอลัมน์ของรายการออกเป็นหลายคอลัมน์

ฉันมี DataFrame แพนด้าที่มีคอลัมน์เดียว: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) เอาท์พุท: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, …

136 python pandas

3

แพนด้า: หลายเงื่อนไขในขณะที่สร้างดัชนีกรอบข้อมูล - พฤติกรรมที่ไม่คาดคิด

ฉันกำลังกรองแถวในดาต้าเฟรมตามค่าในสองคอลัมน์ ด้วยเหตุผลบางประการตัวดำเนินการ OR มีพฤติกรรมเหมือนที่ฉันคาดหวังให้ตัวดำเนินการ AND ทำงานและในทางกลับกัน รหัสทดสอบของฉัน: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values df['a'][1] = -1 df['b'][1] = -1 df['a'][3] = -1 df['b'][4] = -1 df1 = df[(df.a != -1) & (df.b != -1)] df2 = df[(df.a != -1) …

135 python pandas boolean-logic

คำถามติดแท็ก pandas