การเขียนโปรแกรม group-by

3

Python: รับการนับความถี่ตามสองคอลัมน์ (ตัวแปร) ในแพนด้าดาต้าเฟรมบางแถว

สวัสดีฉันมี dataframe ต่อไปนี้ Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large ฉันต้องการนับความถี่ของจำนวนครั้งที่แถวเดียวกันปรากฏในดาต้าเฟรม Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

93 python pandas group-by dataframe

2

Python Pandas: จัดกลุ่มตามกลุ่มและค่าเฉลี่ย?

ฉันมี dataframe แบบนี้: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 ฉันต้องการคำนวณเวลาเฉลี่ยต่อองค์กรต่อคลัสเตอร์ ผลลัพธ์ที่คาดหวัง: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 ไม่รู้จะทำยังไงในนุ่นมีใครช่วยได้บ้าง

93 python pandas group-by mean

6

จะจัดกลุ่มตามสัปดาห์ใน MySQL ได้อย่างไร?

เซิร์ฟเวอร์ตารางของ Oracle มีฟังก์ชันในตัว, TRUNC(timestamp,'DY'). ฟังก์ชันนี้จะแปลงการประทับเวลาเป็นเที่ยงคืนของวันอาทิตย์ก่อนหน้า วิธีที่ดีที่สุดในการทำสิ่งนี้ใน MySQL คืออะไร? Oracle ยังเสนอTRUNC(timestamp,'MM')ให้แปลงการประทับเวลาเป็นเที่ยงคืนในวันแรกของเดือนที่เกิดขึ้น ใน MySQL สิ่งนี้ตรงไปตรงมา: TIMESTAMP(DATE_FORMAT(timestamp, '%Y-%m-01')) แต่DATE_FORMATเคล็ดลับนี้ใช้ไม่ได้เป็นเวลาหลายสัปดาห์ ฉันทราบถึงWEEK(timestamp)ฟังก์ชันนี้ แต่ฉันไม่ต้องการหมายเลขสัปดาห์ภายในปี สิ่งนี้มีไว้สำหรับการทำงานหลายปี

92 mysql datetime group-by data-migration dayofweek

2

Pandas Group โดย Range of Values

มีวิธีง่ายๆในการเรียกใช้groupbyช่วงของค่าที่เพิ่มขึ้นหรือไม่? ตัวอย่างเช่นตัวอย่างด้านล่างฉันสามารถ bin และคอลัมน์กลุ่มBด้วยการ0.155เพิ่มขึ้นเพื่อให้ตัวอย่างเช่นสองกลุ่มแรกในคอลัมน์Bถูกแบ่งออกเป็นช่วงระหว่าง '0 - 0.155, 0.155 - 0.31 ... import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) A B 0 0.383493 0.250785 1 0.572949 0.139555 2 0.652391 0.401983 3 0.214145 0.696935 4 0.848551 0.516692 หรืออีกวิธีหนึ่งฉันสามารถจัดหมวดหมู่ข้อมูลโดยการเพิ่มขึ้นเหล่านั้นลงในคอลัมน์ใหม่ก่อนแล้วจึงใช้groupbyเพื่อกำหนดสถิติที่เกี่ยวข้องที่อาจใช้ได้ในคอลัมน์A?

92 python group-by pandas

3

Pandas รวมตาม groupby แต่ไม่รวมบางคอลัมน์

วิธีใดเป็นวิธีที่ดีที่สุดในการทำ groupby บนดาต้าเฟรมของ Pandas แต่ไม่รวมคอลัมน์บางคอลัมน์จาก groupby นั้น เช่นฉันมี dataframe ต่อไปนี้: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4 Angola 15 Wheat 7312 Ha 30 40 50 4 Angola 25 Maize …

89 python pandas group-by aggregate

5

SQL Server GROUP BY datetime ละเว้นชั่วโมงนาทีและเลือกด้วยวันที่และค่าผลรวม

ฉันมีตารางที่มีสองช่อง - datetimeและint. ฉันต้องการทำกลุ่มในวันที่datetimeเดียวโดยไม่สนใจชั่วโมงและนาที SELECTงบควรจะกลับวันที่แมผลรวมของ int ของวันเดียวได้

86 sql-server datetime select group-by

5

ลำดับของคอลัมน์มีความสำคัญในกลุ่มตามข้อหรือไม่?

ถ้าฉันมีสองคอลัมน์คอลัมน์หนึ่งมีคาร์ดินาลลิตี้สูงมากและอีกคอลัมน์หนึ่งมีคาร์ดินาลลิตี้ต่ำมาก (# ของค่าที่ไม่ซ้ำกัน) จะมีความสำคัญในลำดับใดที่ฉันจัดกลุ่มตาม? นี่คือตัวอย่าง: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey = d.dimensionKey group by d.dimensionName, -- large number of unique values d.dimensionCategory -- small number of unique values มีสถานการณ์ที่สำคัญหรือไม่?

85 sql sql-server group-by

คำถามติดแท็ก group-by