วิธีใดที่ง่ายที่สุดในการลบคอลัมน์ที่ซ้ำกันออกจากดาต้าเฟรม
ฉันกำลังอ่านไฟล์ข้อความที่มีคอลัมน์ซ้ำกันผ่าน:
import pandas as pd
df=pd.read_table(fname)
ชื่อคอลัมน์คือ:
Time, Time Relative, N2, Time, Time Relative, H2, etc...
คอลัมน์เวลาและเวลาที่สัมพันธ์กันทั้งหมดมีข้อมูลเดียวกัน ฉันต้องการ:
Time, Time Relative, N2, H2
ความพยายามทั้งหมดของฉันในการทิ้งลบ ฯลฯ เช่น:
df=df.T.drop_duplicates().T
ผลลัพธ์ของข้อผิดพลาดดัชนีที่ไม่ซ้ำกัน:
Reindexing only valid with uniquely valued index objects
ขอโทษที่เป็นนุ่น noob ข้อเสนอแนะใด ๆ จะได้รับการชื่นชม
รายละเอียดเพิ่มเติม
เวอร์ชัน Pandas: 0.9.0
เวอร์ชัน Python: 2.7.3
Windows 7
(ติดตั้งผ่าน Pythonxy 2.7.3.0)
ไฟล์ข้อมูล (หมายเหตุ: ในไฟล์จริงคอลัมน์จะถูกคั่นด้วยแท็บโดยที่นี่จะคั่นด้วยช่องว่าง 4 ช่อง):
Time Time Relative [s] N2[%] Time Time Relative [s] H2[ppm]
2/12/2013 9:20:55 AM 6.177 9.99268e+001 2/12/2013 9:20:55 AM 6.177 3.216293e-005
2/12/2013 9:21:06 AM 17.689 9.99296e+001 2/12/2013 9:21:06 AM 17.689 3.841667e-005
2/12/2013 9:21:18 AM 29.186 9.992954e+001 2/12/2013 9:21:18 AM 29.186 3.880365e-005
... etc ...
2/12/2013 2:12:44 PM 17515.269 9.991756+001 2/12/2013 2:12:44 PM 17515.269 2.800279e-005
2/12/2013 2:12:55 PM 17526.769 9.991754e+001 2/12/2013 2:12:55 PM 17526.769 2.880386e-005
2/12/2013 2:13:07 PM 17538.273 9.991797e+001 2/12/2013 2:13:07 PM 17538.273 3.131447e-005
read_table
สำหรับตัวอย่างที่ฉันสร้างขึ้น
import pandas as pd; pd.__version__
)