ฉันใช้แพนด้าเป็นตัวแทนที่ฐานข้อมูลเนื่องจากมีหลายฐานข้อมูล (oracle, mssql และอื่น ๆ ) และฉันไม่สามารถสร้างลำดับของคำสั่งให้เทียบเท่ากับ SQL ได้
ฉันมีตารางที่โหลดใน DataFrame ด้วยบางคอลัมน์:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
ใน SQL เพื่อนับจำนวนลูกค้าที่แตกต่างกันต่อปีจะเป็น:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
และผลก็จะเป็น
201301 5000
201302 13245
ฉันจะทำเช่นนั้นในหมีแพนด้าได้อย่างไร
value_counts
อาจเป็นคำตอบที่คุณต้องการ: pandas.pydata.org/pandas-docs/stable/generated/…