คำถามติดแท็ก group-by

GROUP BY เป็นคำสั่งในมาตรฐานฐานข้อมูลเชิงสัมพันธ์ของ SQL สำหรับการยุบกลุ่มของแถวที่ใช้ค่าฟิลด์ร่วมกันในแถวเดียว ฟังก์ชันการรวมสามารถดำเนินการกับเขตข้อมูลอื่นในกลุ่มเช่น SUM () หรือ AVG () เพื่อเปรียบเทียบข้อมูลที่เกี่ยวข้องเป็นค่าเดียว

3
Python: รับการนับความถี่ตามสองคอลัมน์ (ตัวแปร) ในแพนด้าดาต้าเฟรมบางแถว
สวัสดีฉันมี dataframe ต่อไปนี้ Group Size Short Small Short Small Moderate Medium Moderate Small Tall Large ฉันต้องการนับความถี่ของจำนวนครั้งที่แถวเดียวกันปรากฏในดาต้าเฟรม Group Size Time Short Small 2 Moderate Medium 1 Moderate Small 1 Tall Large 1

2
Python Pandas: จัดกลุ่มตามกลุ่มและค่าเฉลี่ย?
ฉันมี dataframe แบบนี้: cluster org time 1 a 8 1 a 6 2 h 34 1 c 23 2 d 74 3 w 6 ฉันต้องการคำนวณเวลาเฉลี่ยต่อองค์กรต่อคลัสเตอร์ ผลลัพธ์ที่คาดหวัง: cluster mean(time) 1 15 ((8+6)/2+23)/2 2 54 (74+34)/2 3 6 ไม่รู้จะทำยังไงในนุ่นมีใครช่วยได้บ้าง
93 python  pandas  group-by  mean 

6
จะจัดกลุ่มตามสัปดาห์ใน MySQL ได้อย่างไร?
เซิร์ฟเวอร์ตารางของ Oracle มีฟังก์ชันในตัว, TRUNC(timestamp,'DY'). ฟังก์ชันนี้จะแปลงการประทับเวลาเป็นเที่ยงคืนของวันอาทิตย์ก่อนหน้า วิธีที่ดีที่สุดในการทำสิ่งนี้ใน MySQL คืออะไร? Oracle ยังเสนอTRUNC(timestamp,'MM')ให้แปลงการประทับเวลาเป็นเที่ยงคืนในวันแรกของเดือนที่เกิดขึ้น ใน MySQL สิ่งนี้ตรงไปตรงมา: TIMESTAMP(DATE_FORMAT(timestamp, '%Y-%m-01')) แต่DATE_FORMATเคล็ดลับนี้ใช้ไม่ได้เป็นเวลาหลายสัปดาห์ ฉันทราบถึงWEEK(timestamp)ฟังก์ชันนี้ แต่ฉันไม่ต้องการหมายเลขสัปดาห์ภายในปี สิ่งนี้มีไว้สำหรับการทำงานหลายปี

2
Pandas Group โดย Range of Values
มีวิธีง่ายๆในการเรียกใช้groupbyช่วงของค่าที่เพิ่มขึ้นหรือไม่? ตัวอย่างเช่นตัวอย่างด้านล่างฉันสามารถ bin และคอลัมน์กลุ่มBด้วยการ0.155เพิ่มขึ้นเพื่อให้ตัวอย่างเช่นสองกลุ่มแรกในคอลัมน์Bถูกแบ่งออกเป็นช่วงระหว่าง '0 - 0.155, 0.155 - 0.31 ... import numpy as np import pandas as pd df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)}) A B 0 0.383493 0.250785 1 0.572949 0.139555 2 0.652391 0.401983 3 0.214145 0.696935 4 0.848551 0.516692 หรืออีกวิธีหนึ่งฉันสามารถจัดหมวดหมู่ข้อมูลโดยการเพิ่มขึ้นเหล่านั้นลงในคอลัมน์ใหม่ก่อนแล้วจึงใช้groupbyเพื่อกำหนดสถิติที่เกี่ยวข้องที่อาจใช้ได้ในคอลัมน์A?

3
Pandas รวมตาม groupby แต่ไม่รวมบางคอลัมน์
วิธีใดเป็นวิธีที่ดีที่สุดในการทำ groupby บนดาต้าเฟรมของ Pandas แต่ไม่รวมคอลัมน์บางคอลัมน์จาก groupby นั้น เช่นฉันมี dataframe ต่อไปนี้: Code Country Item_Code Item Ele_Code Unit Y1961 Y1962 Y1963 2 Afghanistan 15 Wheat 5312 Ha 10 20 30 2 Afghanistan 25 Maize 5312 Ha 10 20 30 4 Angola 15 Wheat 7312 Ha 30 40 50 4 Angola 25 Maize …

5
SQL Server GROUP BY datetime ละเว้นชั่วโมงนาทีและเลือกด้วยวันที่และค่าผลรวม
ฉันมีตารางที่มีสองช่อง - datetimeและint. ฉันต้องการทำกลุ่มในวันที่datetimeเดียวโดยไม่สนใจชั่วโมงและนาที SELECTงบควรจะกลับวันที่แมผลรวมของ int ของวันเดียวได้

5
ลำดับของคอลัมน์มีความสำคัญในกลุ่มตามข้อหรือไม่?
ถ้าฉันมีสองคอลัมน์คอลัมน์หนึ่งมีคาร์ดินาลลิตี้สูงมากและอีกคอลัมน์หนึ่งมีคาร์ดินาลลิตี้ต่ำมาก (# ของค่าที่ไม่ซ้ำกัน) จะมีความสำคัญในลำดับใดที่ฉันจัดกลุ่มตาม? นี่คือตัวอย่าง: select dimensionName, dimensionCategory, sum(someFact) from SomeFact f join SomeDim d on f.dimensionKey = d.dimensionKey group by d.dimensionName, -- large number of unique values d.dimensionCategory -- small number of unique values มีสถานการณ์ที่สำคัญหรือไม่?
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.