ฉันกำลังมองหาวิธีทำเทียบเท่ากับ SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
การเปรียบเทียบ sql ของแพนด้าไม่มีอะไรเกี่ยวกับdistinct
.
.unique()
ใช้ได้กับคอลัมน์เดียวเท่านั้นดังนั้นฉันคิดว่าฉันสามารถต่อคอลัมน์หรือวางไว้ในรายการ / ทูเพิลและเปรียบเทียบแบบนั้น แต่ดูเหมือนว่าแพนด้าควรทำในลักษณะที่เป็นธรรมชาติมากกว่า
ฉันพลาดอะไรบางอย่างที่ชัดเจนหรือไม่มีทางทำเช่นนี้?
df.apply(pd.Series.unique)
นี้ แต่จะไม่ได้ผลหากจำนวนของค่าที่ไม่ซ้ำกันแตกต่างกันไปในแต่ละคอลัมน์ดังนั้นคุณต้องสร้างคำสั่งของชื่อคอลัมน์เป็นคีย์และค่าที่ไม่ซ้ำกันเป็นค่า