คำถามติดแท็ก pandas

Pandas เป็นห้องสมุด Python สำหรับการจัดการและวิเคราะห์ข้อมูลเช่น dataframes, อนุกรมเวลาหลายมิติและชุดข้อมูลแบบตัดขวางซึ่งมักพบในสถิติ, ผลการทดลองทางวิทยาศาสตร์, เศรษฐมิติหรือการเงิน Pandas เป็นหนึ่งในห้องสมุดวิทยาศาสตร์ข้อมูลที่สำคัญใน Python

10
JSON เป็นแพนด้า DataFrame
สิ่งที่ฉันพยายามจะทำคือดึงข้อมูลระดับความสูงจาก google maps API ไปตามเส้นทางที่ระบุโดยพิกัดละติจูดและลองจิจูดดังนี้: from urllib2 import Request, urlopen import json path1 = '42.974049,-81.205203|42.974298,-81.195755' request=Request('http://maps.googleapis.com/maps/api/elevation/json?locations='+path1+'&sensor=false') response = urlopen(request) elevations = response.read() สิ่งนี้ทำให้ฉันมีข้อมูลที่มีลักษณะเช่นนี้: elevations.splitlines() ['{', ' "results" : [', ' {', ' "elevation" : 243.3462677001953,', ' "location" : {', ' "lat" : 42.974049,', ' "lng" : -81.205203', ' },', ' …

5
การแก้ไขเซ็ตย่อยของแถวใน pafas dataframe
สมมติว่าฉันมี DataFrame นุ่นที่มีสองคอลัมน์ A และ B ฉันต้องการแก้ไข DataFrame นี้ (หรือสร้างสำเนา) เพื่อที่ B จะเป็น NaN ทุกครั้งที่ A คือ 0 ฉันจะทำสิ่งนั้นได้อย่างไร ฉันพยายามต่อไปนี้ df['A'==0]['B'] = np.nan และ df['A'==0]['B'].values.fill(np.nan) ปราศจากความสำเร็จ.
143 python  pandas 


13
จะแสดงชื่อคอลัมน์ทั้งหมดบนแพนด้าดาต้าเฟรมได้อย่างไร
ฉันมีดาต้าเฟรมที่ประกอบด้วยคอลัมน์หลายร้อยคอลัมน์และฉันต้องการดูชื่อคอลัมน์ทั้งหมด ฉันทำอะไรไป: In[37]: data_all2.columns ผลลัพธ์คือ: Out[37]: Index(['customer_id', 'incoming', 'outgoing', 'awan', 'bank', 'family', 'food', 'government', 'internet', 'isipulsa', ... 'overdue_3months_feature78', 'overdue_3months_feature79', 'overdue_3months_feature80', 'overdue_3months_feature81', 'overdue_3months_feature82', 'overdue_3months_feature83', 'overdue_3months_feature84', 'overdue_3months_feature85', 'overdue_3months_feature86', 'loan_overdue_3months_total_y'], dtype='object', length=102) ฉันจะแสดงคอลัมน์ทั้งหมดแทนรายการที่ถูกตัดทอนได้อย่างไร
142 python  pandas  dataframe  show 

11
การแทนที่ค่าคอลัมน์ใน pandas DataFrame
ฉันพยายามแทนที่ค่าในหนึ่งคอลัมน์ของ dataframe คอลัมน์ ('หญิง') มีเฉพาะค่า 'หญิง' และ 'ชาย' ฉันได้ลองทำสิ่งต่อไปนี้แล้ว: w['female']['female']='1' w['female']['male']='0' แต่รับสำเนาผลลัพธ์เดียวกันก่อนหน้านี้ทุกประการ ฉันต้องการที่จะรับเอาท์พุทที่คล้ายกับองค์ประกอบวนรอบต่อไปนี้ if w['female'] =='female': w['female'] = '1'; else: w['female'] = '0'; ฉันดูเอกสาร gotchas ( http://pandas.pydata.org/pandas-docs/stable/gotchas.html ) แต่ไม่สามารถเข้าใจได้ว่าทำไมไม่มีอะไรเกิดขึ้น ความช่วยเหลือใด ๆ ที่จะได้รับการชื่นชม.
141 python  pandas 

6
ตรวจสอบว่ามีค่าอยู่ในดัชนี dataframe ของแพนด้า
ฉันแน่ใจว่ามีวิธีที่ชัดเจนในการทำเช่นนี้ แต่ไม่สามารถคิดถึงสิ่งที่ลื่นไหลได้ในตอนนี้ โดยทั่วไปแทนที่จะยกข้อยกเว้นฉันต้องการได้รับTrueหรือFalseดูว่ามีค่าอยู่ในdfดัชนีแพนด้า import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # (should give False) สิ่งที่ฉันทำงานตอนนี้มีดังต่อไปนี้ sum(df.index == 'g')
139 python  pandas  ipython 

6
คอลัมน์ดาต้าเฟรมแพนด้าปรับขนาดด้วย sklearn
ฉันมีดาต้าเฟรมแพนด้าที่มีคอลัมน์ประเภทผสมและฉันต้องการใช้ min_max_scaler ของ sklearn กับบางคอลัมน์ ตามหลักการแล้วฉันต้องการทำการเปลี่ยนแปลงเหล่านี้ในสถานที่ แต่ยังไม่ได้หาวิธีที่จะทำ ฉันได้เขียนโค้ดต่อไปนี้ที่ใช้งานได้: import pandas as pd import numpy as np from sklearn import preprocessing scaler = preprocessing.MinMaxScaler() dfTest = pd.DataFrame({'A':[14.00,90.20,90.95,96.27,91.21],'B':[103.02,107.26,110.35,114.23,114.68], 'C':['big','small','big','small','small']}) min_max_scaler = preprocessing.MinMaxScaler() def scaleColumns(df, cols_to_scale): for col in cols_to_scale: df[col] = pd.DataFrame(min_max_scaler.fit_transform(pd.DataFrame(dfTest[col])),columns=[col]) return df dfTest A B C 0 14.00 103.02 big …

6
แพนด้า: ฉันจะแยกข้อความในคอลัมน์ออกเป็นหลายแถวได้อย่างไร
ฉันกำลังทำงานกับไฟล์ csv ขนาดใหญ่และถัดจากคอลัมน์สุดท้ายมีสตริงข้อความที่ฉันต้องการแยกด้วยตัวคั่นเฉพาะ ฉันสงสัยว่ามีวิธีง่ายๆในการทำเช่นนี้โดยใช้แพนด้าหรืองูหลามหรือไม่? CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 60 31316 Lennon, John 25 F01 1:13:36:1,12 1:13:37:1,13 300 ฉันต้องการแบ่งตามช่องว่าง(' ')และเครื่องหมายทวิภาค(':')ในSeatblocksคอลัมน์ แต่แต่ละเซลล์จะทำให้จำนวนคอลัมน์ต่างกัน ฉันมีฟังก์ชั่นจัดเรียงคอลัมน์ใหม่ให้Seatblocksคอลัมน์อยู่ท้ายแผ่นงาน แต่ฉันไม่แน่ใจว่าต้องทำอะไรจากตรงนั้น ฉันสามารถทำได้ใน excel ด้วยtext-to-columnsฟังก์ชันในตัวและมาโครด่วน แต่ชุดข้อมูลของฉันมีระเบียนมากเกินไปสำหรับ excel ที่จะจัดการ ในที่สุดฉันต้องการบันทึกเช่นของ John Lennon และสร้างหลายบรรทัดโดยมีข้อมูลจากชุดที่นั่งแต่ละชุดแยกกัน
137 python  pandas  dataframe 

4
วิธีใดที่มีประสิทธิภาพที่สุดในการสร้างพจนานุกรมของ Dataframe แพนด้าสองคอลัมน์
วิธีใดที่มีประสิทธิภาพที่สุดในการจัดระเบียบ Dataframe แพนด้าต่อไปนี้: ข้อมูล = Position Letter 1 a 2 b 3 c 4 d 5 e ลงในพจนานุกรมเช่นalphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

6
วิธีโหลดไฟล์ tsv ไปยัง Pandas DataFrame
ฉันยังใหม่กับงูหลามและหมีแพนด้า ฉันพยายามที่จะได้รับไฟล์โหลดลงในหมีแพนด้า tsvDataFrame นี่คือสิ่งที่ฉันพยายามและข้อผิดพลาดที่ฉันได้รับ: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__ raise PandasError('DataFrame constructor not properly called!') PandasError: DataFrame constructor not properly called!
136 python  pandas  csv 

8
แพนด้าค่าที่ไม่ซ้ำกันหลายคอลัมน์
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) วิธีใดที่ดีที่สุดในการคืนค่าเฉพาะของ 'Col1' และ 'Col2' ผลลัพธ์ที่ต้องการคือ 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

4
ปัญหาการเข้าร่วมของ Pandas: คอลัมน์ทับซ้อนกัน แต่ไม่ได้ระบุคำต่อท้าย
ฉันมีกรอบข้อมูล 2 รายการต่อไปนี้: df_a = mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 df_b = mukey niccdcd 0 190236 4 1 190237 6 2 190238 7 3 190239 4 4 190240 7 เมื่อฉันพยายามเข้าร่วม 2 dataframes …
136 python  join  pandas 


8
แพนด้าแยกคอลัมน์ของรายการออกเป็นหลายคอลัมน์
ฉันมี DataFrame แพนด้าที่มีคอลัมน์เดียว: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) เอาท์พุท: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG] 5 [SF, …
136 python  pandas 

3
แพนด้า: หลายเงื่อนไขในขณะที่สร้างดัชนีกรอบข้อมูล - พฤติกรรมที่ไม่คาดคิด
ฉันกำลังกรองแถวในดาต้าเฟรมตามค่าในสองคอลัมน์ ด้วยเหตุผลบางประการตัวดำเนินการ OR มีพฤติกรรมเหมือนที่ฉันคาดหวังให้ตัวดำเนินการ AND ทำงานและในทางกลับกัน รหัสทดสอบของฉัน: import pandas as pd df = pd.DataFrame({'a': range(5), 'b': range(5) }) # let's insert some -1 values df['a'][1] = -1 df['b'][1] = -1 df['a'][3] = -1 df['b'][4] = -1 df1 = df[(df.a != -1) & (df.b != -1)] df2 = df[(df.a != -1) …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.