ฉันต้องการอ่านไฟล์ csv หลายไฟล์จากไดเร็กตอรี่ไปเป็นนุ่นและเชื่อมต่อกันเป็น DataFrame ขนาดใหญ่ ฉันไม่สามารถเข้าใจมันได้ นี่คือสิ่งที่ฉันมีจนถึงตอนนี้:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
ฉันเดาว่าฉันต้องการความช่วยเหลือในการวนรอบ ???
big_frame = pd.concat(dfs, ignore_index=True)ใช่หรือไม่อย่างไรก็ตามเมื่อคุณมีรายการของไฟล์ข้อมูลคุณจะต้องวนซ้ำรายการและต่อไปbig_frame
dfsขณะนี้ดังนั้นบางสิ่งเช่นfor df in dfs: big_frame.concat(df, ignore_index=True)ควรทำงานได้คุณสามารถลองappendแทนได้concatเช่นกัน
concatควรจัดการรายการ DataFrames ได้ดีเหมือนที่คุณทำ ฉันคิดว่านี่เป็นวิธีการที่ดีมาก
dfsรายการคุณไม่ต้องการที่จะเปลี่ยนสายกับdata = pd.read_csv(filename)dfs.append(pd.read_csv(filename)จากนั้นคุณจะต้องห่วงกว่ารายการและconcatผมไม่คิดว่าconcatการทำงานจะอยู่ในรายชื่อของdfs