คำถามติดแท็ก dataframe

กรอบข้อมูลเป็นโครงสร้างข้อมูลแบบตาราง โดยทั่วไปจะมีข้อมูลที่แถวคือการสังเกตและคอลัมน์เป็นตัวแปรประเภทต่างๆ ในขณะที่ "data frame" หรือ "dataframe" เป็นคำที่ใช้สำหรับแนวคิดนี้ในหลายภาษา (R, Apache Spark, deedle, Maple, pandas library ใน Python และ DataFrames library ใน Julia) "table" เป็นคำที่ใช้ใน MATLAB และ SQL

6
แปลงกรอบข้อมูลแพนด้าเป็นอนุกรม
ฉันค่อนข้างใหม่กับแพนด้า ฉันมีกรอบข้อมูลแพนด้าที่มี 1 แถวคูณ 23 คอลัมน์ ฉันต้องการแปลงเป็นซีรีส์หรือไม่ ฉันสงสัยว่าวิธีที่ยิ่งใหญ่ที่สุดในการทำเช่นนี้คืออะไร? ฉันได้พยายามแต่ก็บ่นpd.Series(myResults) ValueError: cannot copy sequence with size 23 to array axis with dimension 1มันไม่ฉลาดพอที่จะรู้ว่ามันยังคงเป็น "เวกเตอร์" ในแง่คณิตศาสตร์ ขอบคุณ!

4
วิธีการลงจุดสองคอลัมน์ของกรอบข้อมูลแพนด้าโดยใช้จุด?
ฉันมีกรอบข้อมูลแพนด้าและต้องการพล็อตค่าจากคอลัมน์หนึ่งเทียบกับค่าจากคอลัมน์อื่น โชคดีที่มีplotวิธีการที่เกี่ยวข้องกับ data-frames ที่ดูเหมือนจะทำในสิ่งที่ฉันต้องการ: df.plot(x='col_name_1', y='col_name_2') น่าเสียดายที่ดูเหมือนว่าในรูปแบบพล็อต (แสดงรายการที่นี่หลังkindพารามิเตอร์) จะไม่มีคะแนน ฉันสามารถใช้เส้นหรือแท่งหรือแม้กระทั่งความหนาแน่น แต่ไม่ใช่จุด มีวิธีแก้ไขที่สามารถช่วยแก้ปัญหานี้ได้หรือไม่

9
นำเข้าไฟล์ CSV เป็น DataFrame แพนด้า
วิธี Python ในการอ่านไฟล์ CSV ในDataFrame ของแพนด้าคืออะไร (ซึ่งฉันสามารถใช้สำหรับการดำเนินการทางสถิติสามารถมีคอลัมน์ที่พิมพ์ต่างกันได้ ฯลฯ ) ไฟล์ CSV ของฉัน"value.txt"มีเนื้อหาดังต่อไปนี้: Date,"price","factor_1","factor_2" 2012-06-11,1600.20,1.255,1.548 2012-06-12,1610.02,1.258,1.554 2012-06-13,1618.07,1.249,1.552 2012-06-14,1624.40,1.253,1.556 2012-06-15,1626.15,1.258,1.552 2012-06-16,1626.15,1.263,1.558 2012-06-17,1626.15,1.264,1.572 ใน R เราจะอ่านไฟล์นี้โดยใช้: price <- read.csv("value.txt") และจะส่งคืน R data.frame: > price <- read.csv("value.txt") > price Date price factor_1 factor_2 1 2012-06-11 1600.20 1.255 1.548 2 2012-06-12 1610.02 1.258 1.554 3 …
98 python  pandas  csv  dataframe 

5
เพิ่มคอลัมน์ในดาต้าเฟรมจากรายการ
ฉันมี dataframe ที่มีบางคอลัมน์ดังนี้: A B C 0 4 5 6 7 7 6 5 ช่วงเป็นไปได้ของค่าในมีเพียง 0-7 นอกจากนี้ฉันมีรายการองค์ประกอบ 8 รายการดังนี้: List=[2,5,6,8,12,16,26,32] //There are only 8 elements in this list ถ้าองค์ประกอบในคอลัมน์ A เป็นnฉันต้องแทรกองค์ประกอบที่nจากรายการในคอลัมน์ใหม่โดยพูดว่า 'D' ฉันจะทำสิ่งนี้ในคราวเดียวโดยไม่วนซ้ำทั้งดาต้าเฟรมได้อย่างไร ดาต้าเฟรมที่ได้จะมีลักษณะดังนี้: A B C D 0 2 4 12 5 16 6 26 7 32 7 32 …

3
Python Pandas แทนที่ NaN ในคอลัมน์เดียวด้วยค่าจากแถวที่สองของคอลัมน์ที่เกี่ยวข้อง
ฉันกำลังทำงานกับ Pandas DataFrame นี้ใน Python File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA 19 N/A 2 NoT 106 77 2 …

9
ย้ายคอลัมน์ตามชื่อไปด้านหน้าตารางในแพนด้า
นี่คือ df ของฉัน: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4 78 Once a week 1% 1.63% -0.40% 6 65 ฉันจะย้ายคอลัมน์โดยใช้ชื่อ ( "Mid") ไปที่ด้านหน้าของตารางดัชนี 0 …

6
ชุดย่อยของแถวที่มีค่า NA (ไม่มี) ในคอลัมน์ที่เลือกของกรอบข้อมูล
เรามีกรอบข้อมูลจากไฟล์ CSV กรอบข้อมูลDFมีคอลัมน์ที่มีค่าที่สังเกตได้และคอลัมน์ ( VaR2) ที่มีวันที่ที่ทำการวัด หากไม่ได้บันทึกวันที่ไว้ไฟล์ CSV จะมีค่าNAสำหรับข้อมูลที่ขาดหายไป Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 เราต้องการใช้คำสั่งย่อยเพื่อกำหนดกรอบข้อมูลใหม่new_DFเพื่อให้มีเฉพาะแถวที่มีNA'ค่าจากคอลัมน์ ( VaR2) ในตัวอย่างที่ระบุจะมีเฉพาะแถวที่ 2 DFเท่านั้น คำสั่ง new_DF<-subset(DF,DF$Var2=="NA") ไม่ทำงานเฟรมข้อมูลผลลัพธ์ไม่มีรายการแถว หากในไฟล์ CSV เดิมราคาNAจะมีการแลกเปลี่ยนกับ คำสั่งเดียวกันผลิตผลลัพธ์ที่ต้องการ:NULLnew_DF<-subset(DF,DF$Var2=="NULL") ฉันจะทำให้วิธีนี้ใช้งานได้อย่างไรหากสำหรับสตริงอักขระมีการระบุค่าNAไว้ในไฟล์ CSV ดั้งเดิม
97 r  csv  dataframe  subset  na 

11
วิธีการระเบิดรายการภายในเซลล์ Dataframe เป็นแถวแยกกัน
ฉันต้องการเปลี่ยนเซลล์แพนด้าที่มีรายการเป็นแถวสำหรับแต่ละค่าเหล่านั้น ดังนั้นใช้สิ่งนี้: หากฉันต้องการคลายแพ็กและซ้อนค่าในnearest_neighborsคอลัมน์เพื่อให้แต่ละค่าเป็นแถวภายในopponentดัชนีแต่ละรายการฉันจะทำอย่างไรดีที่สุด มีวิธีการของแพนด้าที่มีไว้สำหรับการดำเนินการเช่นนี้หรือไม่?

1
เอกสารเกี่ยวกับแท็ก 'Freq' ของ Pandas อยู่ที่ไหน [ปิด]
ปิด. คำถามนี้ไม่เป็นไปตามหลักเกณฑ์กองมากเกิน ขณะนี้ยังไม่ยอมรับคำตอบ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Stack Overflow ปิดให้บริการใน3 ปีที่ผ่านมา ปรับปรุงคำถามนี้ date_rangeฉันใหม่เพื่อนุ่นและกำลังพยายามที่จะใช้ ฉันเจอสิ่งดีๆทุกประเภทสำหรับfreqเช่นBMEและBMSฉันต้องการที่จะสามารถค้นหาสตริงที่เหมาะสมได้อย่างรวดเร็วเพื่อให้ได้สิ่งที่ฉันต้องการ เมื่อวานนี้ฉันพบตารางที่มีรูปแบบสวยงามอยู่ที่ไหนสักแห่งในเอกสาร แต่ชื่อของตารางนั้นผิดเพี้ยนมากจนฉันไม่สามารถใช้การค้นหาเพื่อค้นหาได้อีกในวันนี้

5
แทนที่ค่าเฉพาะทั้งหมดในกรอบข้อมูล
มีกรอบข้อมูลฉันจะเปลี่ยนค่าเฉพาะทั้งหมดในแถวและคอลัมน์ทั้งหมดได้อย่างไร ตัวอย่างเช่นฉันต้องการแทนที่ระเบียนว่างทั้งหมดด้วยNA's (โดยไม่ต้องพิมพ์ตำแหน่ง): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 ผลลัพธ์ที่คาดหวัง: A B 1 NA 12 2 xyz NA 3 jkl 100
95 r  dataframe  replace 

16
วิธีเลือกแถวที่มีค่าสูงสุดในแต่ละกลุ่ม
ในชุดข้อมูลที่มีการสังเกตหลายครั้งสำหรับแต่ละเรื่องฉันต้องการใช้ชุดย่อยที่มีค่าข้อมูลสูงสุดสำหรับแต่ละระเบียนเท่านั้น ตัวอย่างเช่นชุดข้อมูลต่อไปนี้: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) Subject 1, 2, และ 3 มีค่า pt มากที่สุดคือ 5, 17 และ 5 ตามลำดับ ฉันจะหาค่า pt ที่ใหญ่ที่สุดสำหรับแต่ละเรื่องได้อย่างไรจากนั้นจึงใส่ข้อสังเกตนี้ในกรอบข้อมูลอื่น กรอบข้อมูลผลลัพธ์ควรมีค่า pt ที่ใหญ่ที่สุดสำหรับแต่ละเรื่องเท่านั้น
94 r  dataframe  r-faq 

6
มีวิธีใน Pandas ที่จะใช้ค่าแถวก่อนหน้าใน dataframe.apply เมื่อคำนวณค่าก่อนหน้าในการนำไปใช้ด้วยหรือไม่
ฉันมี dataframe ต่อไปนี้: Index_Date A B C D =============================== 2015-01-31 10 10 Nan 10 2015-02-01 2 3 Nan 22 2015-02-02 10 60 Nan 280 2015-02-03 10 100 Nan 250 จำเป็นต้อง: Index_Date A B C D =============================== 2015-01-31 10 10 10 10 2015-02-01 2 3 23 22 2015-02-02 10 60 290 …

3
คอลัมน์ดาต้าเฟรมของ python pandas แปลงเป็นคีย์และค่า dict
ฉันมีกรอบข้อมูลแพนด้าที่มีหลายคอลัมน์และฉันต้องการสร้าง dict จากสองคอลัมน์: อันหนึ่งเป็นคีย์ของ dict และอีกอันเป็นค่าของ dict ฉันจะทำเช่นนั้นได้อย่างไร? ดาต้าเฟรม: area count co tp DE Lake 10 7 Forest 20 5 FR Lake 30 2 Forest 40 3 ฉันต้องการกำหนดพื้นที่เป็นคีย์นับเป็นค่าในคำสั่ง ขอบคุณล่วงหน้า.

3
ใส่คำอธิบายประกอบแท่งที่มีค่าบนแผนภาพของ Pandas
ฉันกำลังมองหาวิธีใส่คำอธิบายประกอบแท่งของฉันในพล็อตแท่ง Pandas ด้วยค่าตัวเลขที่โค้งมนจาก DataFrame ของฉัน >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 ฉันต้องการได้รับสิ่งนี้: ฉันลองใช้ตัวอย่างโค้ดนี้แล้ว แต่คำอธิบายประกอบจะอยู่กึ่งกลางของขีด x: >>> ax = df.plot(kind='bar') >>> for idx, label in enumerate(list(df.index)): for acc in df.columns: value = np.round(df.ix[idx][acc],decimals=2) ax.annotate(value, (idx, value), xytext=(0, 15), textcoords='offset points')

3
Python: รับการนับความถี่ตามสองคอลัมน์ (ตัวแปร) ในแพนด้าดาต้าเฟรมบางแถว
สวัสดีฉันมี dataframe ต่อไปนี้ Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large ฉันต้องการนับความถี่ของจำนวนครั้งที่แถวเดียวกันปรากฏในดาต้าเฟรม Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.