ฉันกำลังพยายามผสานระหว่างสองกรอบข้อมูล แต่ละกรอบข้อมูลมีดัชนีสองระดับ (วันที่, cusip) ในคอลัมน์บางคอลัมน์จะจับคู่ระหว่างสอง (currency, adj date) เช่น
วิธีใดเป็นวิธีที่ดีที่สุดในการรวมสิ่งเหล่านี้ด้วยดัชนี แต่อย่าใช้สำเนาสกุลเงินสองชุดและวันที่แก้ไข
แต่ละเฟรมข้อมูลมี 90 คอลัมน์ดังนั้นฉันจึงพยายามหลีกเลี่ยงการเขียนทุกอย่างด้วยมือ
df: currency adj_date data_col1 ...
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45
...
df2: currency adj_date data_col2 ...
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45
...
ถ้าฉันทำ:
dfNew = merge(df, df2, left_index=True, right_index=True, how='outer')
ฉันเข้าใจ
dfNew: currency_x adj_date_x data_col2 ... currency_y adj_date_y
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45 USD 2012-01-03
ขอบคุณ! ...