ฉันต้องการอ่านไฟล์ csv หลายไฟล์จากไดเร็กตอรี่ไปเป็นนุ่นและเชื่อมต่อกันเป็น DataFrame ขนาดใหญ่ ฉันไม่สามารถเข้าใจมันได้ นี่คือสิ่งที่ฉันมีจนถึงตอนนี้:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
ฉันเดาว่าฉันต้องการความช่วยเหลือในการวนรอบ ???
big_frame = pd.concat(dfs, ignore_index=True)
ใช่หรือไม่อย่างไรก็ตามเมื่อคุณมีรายการของไฟล์ข้อมูลคุณจะต้องวนซ้ำรายการและต่อไปbig_frame
dfs
ขณะนี้ดังนั้นบางสิ่งเช่นfor df in dfs: big_frame.concat(df, ignore_index=True)
ควรทำงานได้คุณสามารถลองappend
แทนได้concat
เช่นกัน
concat
ควรจัดการรายการ DataFrames ได้ดีเหมือนที่คุณทำ ฉันคิดว่านี่เป็นวิธีการที่ดีมาก
dfs
รายการคุณไม่ต้องการที่จะเปลี่ยนสายกับdata = pd.read_csv(filename)
dfs.append(pd.read_csv(filename)
จากนั้นคุณจะต้องห่วงกว่ารายการและconcat
ผมไม่คิดว่าconcat
การทำงานจะอยู่ในรายชื่อของdf
s