สร้างไฟล์. csv ด้วยค่าจากรายการ Python


182

ฉันกำลังพยายามสร้างไฟล์. csv พร้อมค่าจากรายการ Python เมื่อฉันพิมพ์ค่าในรายการพวกเขาทั้งหมดเป็น Unicode (?) คือพวกเขามีลักษณะเช่นนี้

[u'value 1', u'value 2', ...]

ถ้าฉันวนซ้ำค่าในรายการนั่นคือfor v in mylist: print vพวกเขาดูเหมือนจะเป็นข้อความธรรมดา

และฉันสามารถใส่,ระหว่างกันด้วยprint ','.join(mylist)

และฉันสามารถส่งออกไปยังไฟล์เช่น

myfile = open(...)
print >>myfile, ','.join(mylist)

แต่ฉันต้องการส่งออกเป็น CSV และมีตัวคั่นรอบค่าในรายการเช่น

"value 1", "value 2", ... 

ฉันไม่พบวิธีง่ายๆในการรวมตัวคั่นในการจัดรูปแบบเช่นฉันลองผ่านjoinคำสั่งแล้ว ฉันจะทำสิ่งนี้ได้อย่างไร


ขอบคุณทุกคนฉันได้รวบรวมแนวคิดจากคำตอบสองสามข้อเพื่อแก้ไขคำถามของฉัน :) ตอนนี้ฉันใช้โมดูล csv เพื่อเขียนข้อมูล [... ] ลงในไฟล์ที่นำเข้าข้อมูล csv data = [... ] myfile = open ( ... , 'wb') out = csv.writer (open ("myfile.csv", "w"), delimiter = ',', quoting = csv.QUOTE_ALL) out.writerow (ข้อมูล) ทำงานได้ดีฉันสร้าง ข้อมูลของฉัน [] โดยการดึงข้อมูลบางส่วนออกจากสเปรดชีตโดยใช้ xlrd และโมดูล csv เขียนออกไปยังไฟล์ที่มีตัวคั่นที่ถูกต้องดีทั้งหมด :) ดีทั้งหมดอีกครั้ง
Fortilan

วิธีการใหม่ล่าสุดที่สามารถใช้หมีแพนด้าได้
Richard

ผู้ใช้ Python 3.4 ซึ่งทำงานได้ดีที่สุดสำหรับฉัน: stackoverflow.com/questions/25022677/…
Leigh

คำตอบ:


254
import csv

with open(..., 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

แก้ไข: ใช้งานได้กับ python 2.x เท่านั้น

เพื่อให้ทำงานกับ python 3.x แทนที่wbด้วยw( ดูคำตอบ SO นี้ )

with open(..., 'w', newline='') as myfile:
     wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
     wr.writerow(mylist)

11
โปรดทราบว่าcsvโมดูลใน 2.x ทำงานไม่ถูกต้องกับ Unicode; ดูเอกสารประกอบโมดูลสำหรับตัวอย่างเกี่ยวกับวิธีจัดการกับสิ่งนี้ docs.python.org/library/csv.html
Ignacio Vazquez-Abrams

14
คุณยังสามารถใช้ wr.writerows (รายการ)
tovmeod

4
Writerows ดูเหมือนจะแยกแต่ละองค์ประกอบในรายการออกเป็นคอลัมน์ถ้าแต่ละองค์ประกอบเป็นรายการเช่นกัน มันค่อนข้างมีประโยชน์สำหรับการแสดงผลตาราง
whatnick

6
ไม่สามารถใช้กับ python 3.4 ได้ TypeError: 'str' does not support the buffer interfaceฉันได้รับ
botchniaque

1
สำหรับ Python 2 ให้ใช้'w'ที่นี่: stackoverflow.com/questions/34283178/…
banan3'14

106

นี่เป็นรุ่นที่ปลอดภัยของ Alex Martelli:

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

3
บวก 1 สำหรับการใช้withตรวจสอบให้แน่ใจว่าไฟล์ถูกปิดเมื่อเสร็จสิ้น
BoltzmannBrain

หากฉันกำลังใช้สิ่งนี้ภายในวง for for, ทั้งหมดที่มี block ควรอยู่ภายใต้ for loop หรือไม่? หรือมันจะมีประสิทธิภาพมากกว่าที่จะมีwr.writerow(my_list)ในวงเท่านั้น?
crypdick

1
@crypdick คุณไม่ควรใส่ทั้งบล็อกลงในลูป เปิดไฟล์จากนั้นเขียนแต่ละแถวในลูป ไม่จำเป็นต้องเปิดไฟล์ n ครั้งเพื่อเขียน n แถว
Greg Kaleka

หากคุณกำลังเขียนวัตถุสตริงลงในไฟล์ขอแนะนำให้ใช้ 'wt' ในขณะที่เปิดไฟล์เพื่อหลีกเลี่ยง TypeError: จำเป็นต้องใช้วัตถุที่มีลักษณะคล้ายไบต์ไม่ใช่ 'str'
don_Gunner94

41

สำหรับวิธีอื่นคุณสามารถใช้DataFrameในpandas : และมันสามารถถ่ายโอนข้อมูลไปยัง csv ได้อย่างง่ายดายเหมือนกับโค้ดด้านล่าง:

import pandas
df = pandas.DataFrame(data={"col1": list_1, "col2": list_2})
df.to_csv("./file.csv", sep=',',index=False)

1
ขอบคุณสำหรับข้อมูลโค้ดนี้ซึ่งอาจให้ความช่วยเหลือได้ทันที คำอธิบายที่เหมาะสมจะช่วยเพิ่มมูลค่าทางการศึกษาอย่างมากโดยแสดงให้เห็นว่าทำไมนี่จึงเป็นทางออกที่ดีสำหรับปัญหาและจะทำให้มีประโยชน์มากขึ้นสำหรับผู้อ่านในอนาคตที่มีคำถามคล้ายกัน แต่ไม่เหมือนกัน โปรดแก้ไขคำตอบของคุณเพื่อเพิ่มคำอธิบายและระบุข้อ จำกัด และสมมติฐานที่ใช้
Toby Speight

5
นอกจากนี้เพื่อให้การทำงานรายการต้องมีความยาวเท่ากันมิฉะนั้นคุณจะได้รับ ValueError (pandas v 0.22.0)
cheevahagadog

32

ตัวเลือกที่ดีที่สุดที่ฉันพบคือใช้savetxtจากnumpyโมดูล :

import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)

ในกรณีที่คุณมีหลายรายการที่ต้องถูกซ้อนกัน

np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)

8
สิ่งนี้ดีสำหรับงานที่เป็นตัวเลข แต่จะไม่ทำงานเมื่อมีสตริงในรายการ
Ricardo Cruz

12

ใช้csvโมดูลของ python สำหรับการอ่านและการเขียนไฟล์คอมม่าหรือคั่นด้วยแท็บ โมดูล csv เป็นที่ต้องการเพราะมันช่วยให้คุณสามารถควบคุมข้อความ

ตัวอย่างเช่นนี่คือตัวอย่างการทำงานสำหรับคุณ:

import csv
data = ["value %d" % i for i in range(1,4)]

out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)

ผลิต:

"value 1","value 2","value 3"

4
สร้างไฟล์ว่างเปล่าสำหรับฉัน
caspii

การรันครั้งแรกนั้นว่างเปล่าและคุณไม่สามารถลบมันได้เพราะมันถูกเปิดในไพ ธ อน การทำงานครั้งที่สอง (หรือแม่นยำยิ่งขึ้น: out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL))เติมข้อมูลไม่ว่าคุณจะใส่open("myfile.csv","w")หรือไฟล์ใหม่open("myfile2.csv","w")ดูเหมือนว่าวัตถุที่ไม่สามารถจัดการกับวัตถุไฟล์ที่สร้างขึ้นในการทำงาน แต่เก็บกระบวนการส่งออกเป็นสิ่งที่ต้องทำใน otherwords: อ็อบเจ็กต์ out เก็บอ็อบเจ็กต์ไฟล์ในการรันครั้งแรก แต่เขียนเฉพาะเมื่ออ็อบเจ็กต์ไฟล์มีอยู่แล้วดูวิธีการแก้ปัญหาด้านล่าง @Saurabh Adhikary
Lorenz

7

คุณสามารถใช้วิธีการ string.join ในกรณีนี้

แยกสองสามบรรทัดเพื่อความชัดเจน - นี่คือเซสชันแบบโต้ตอบ

>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"

หรือว่าเป็นเส้นเดี่ยว

>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"

อย่างไรก็ตามคุณอาจมีปัญหาคือสายอักขระของคุณมีเครื่องหมายคำพูดฝังอยู่ หากเป็นกรณีนี้คุณจะต้องตัดสินใจว่าจะหลบหนีอย่างไร

โมดูล CSVสามารถดูแลทั้งหมดนี้สำหรับคุณช่วยให้คุณสามารถเลือกระหว่างตัวเลือกข้อความต่างๆ (ทุกสาขาเฉพาะเขตข้อมูลด้วยคำพูดและ seperators เพียงช่องตัวเลขบุหรี่, ฯลฯ ) และวิธีการ charecters ควบคุม esacpe (ราคาคู่หรือ สตริงที่ใช้ Escape) หากค่าของคุณเป็นแบบง่าย string.join อาจจะโอเค แต่ถ้าคุณต้องจัดการกับจำนวนเคสที่มีจำนวนมากให้ใช้โมดูลที่มีอยู่


3

วิธีแก้ปัญหานี้ฟังดูบ้า แต่ทำงานราบรื่นเหมือนน้ำผึ้ง

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
    wr.writerow(mylist)

ไฟล์กำลังถูกเขียนโดย csvwriter ดังนั้นคุณสมบัติของ csv จะคงอยู่เช่นคั่นด้วยเครื่องหมายจุลภาค ตัวคั่นช่วยในส่วนหลักโดยการย้ายรายการไปยังบรรทัดถัดไปในแต่ละครั้ง


1
เล็กและรวดเร็วมาก
เอียนแซมซ์

1
ทำงานได้และหากคุณมีรายการซ้อนอยู่ให้ขยายตัวอย่างของ @ vy32 คุณมี:data = [["value %d" % i, "value %d" % (i+1)] for i in range(1,4)] with open("myfile.txt","w") as f: out = csv.writer(f, quoting=csv.QUOTE_ALL, delimiter='\n') out.writerow([';'.join(x) for x in data])
Lorenz

มันฟังดูบ้าจริงเหรอ? ฉันคิดว่ามันฟังดูดีมาก
สเตฟานีโอเว่น

3

เพื่อสร้างและเขียนลงในไฟล์ csv

ตัวอย่างด้านล่างแสดงให้เห็นถึงการสร้างและการเขียนไฟล์ csv เพื่อให้เขียนไฟล์แบบไดนามิกเราจำเป็นต้องนำเข้าแพคเกจนำเข้า csvแล้วต้องสร้างตัวอย่างของไฟล์ที่มีการอ้างอิงไฟล์ Ex: - กับเปิด ("D: \ sample.csv", "w", newline = "" ) เป็น file_writer

ที่นี่หากไฟล์ไม่มีอยู่ในไดเรกทอรีไฟล์ที่กล่าวถึงแล้วไพ ธ อนจะสร้างไฟล์เดียวกันในไดเรกทอรีที่ระบุและ "w" หมายถึงการเขียนถ้าคุณต้องการอ่านไฟล์จากนั้นแทนที่ "w" ด้วย "r" หรือต่อท้าย ไปที่ไฟล์ที่มีอยู่แล้ว "a" newline = "" ระบุว่าจะลบแถวว่างพิเศษสำหรับทุกครั้งที่คุณสร้างแถวเพื่อกำจัดแถวว่างที่เราใช้ newline = "" สร้างชื่อฟิลด์บางชื่อ (ชื่อคอลัมน์) โดยใช้รายการเช่นfields = ["ชื่อ", "อายุ "," Class "]จากนั้นนำไปใช้กับอินสแตนซ์ของนักเขียนเช่น writer = csv.DictWriter (file_writer, fieldnames = field) ที่นี่โดยใช้พจนานุกรมตัวเขียนและกำหนดชื่อคอลัมน์เพื่อเขียนชื่อคอลัมน์ให้กับ csv ที่เราใช้ตัวเขียน ในขณะที่การเขียนค่าไฟล์จะต้องส่งผ่านโดยใช้วิธีพจนานุกรมที่นี่ที่สำคัญคือชื่อคอลัมน์และความคุ้มค่าเป็นค่าคีย์ของคุณที่เกี่ยวข้อง

import csv 

with open("D:\\sample.csv","w",newline="") as file_writer:

   fields=["Names","Age","Class"]

   writer=csv.DictWriter(file_writer,fieldnames=fields)

   writer.writeheader()

   writer.writerow({"Names":"John","Age":21,"Class":"12A"})

2

สมุดบันทึก Jupyter

ให้บอกว่ารายการของคุณคือ A

จากนั้นคุณสามารถโค้ดโฆษณาต่อไปนี้คุณจะได้เป็นไฟล์ csv (คอลัมน์เท่านั้น!)

R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()

1

คุณควรใช้โมดูล CSV แน่นอน แต่มีโอกาสที่คุณจะต้องเขียน Unicode สำหรับผู้ที่ต้องการเขียน unicode นี่คือคลาสจากหน้าตัวอย่างที่คุณสามารถใช้เป็นโมดูล util:

import csv, codecs, cStringIO

class UTF8Recoder:
    """
    Iterator that reads an encoded stream and reencodes the input to UTF-8
    """
    def __init__(self, f, encoding):
        self.reader = codecs.getreader(encoding)(f)

def __iter__(self):
    return self

def next(self):
    return self.reader.next().encode("utf-8")

class UnicodeReader:
    """
    A CSV reader which will iterate over lines in the CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    f = UTF8Recoder(f, encoding)
    self.reader = csv.reader(f, dialect=dialect, **kwds)

def next(self):
    row = self.reader.next()
    return [unicode(s, "utf-8") for s in row]

def __iter__(self):
    return self

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
"""

def __init__(self, f, dialect=csv.excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)

1

นี่เป็นอีกวิธีการหนึ่งที่ไม่ต้องใช้csvโมดูล

print ', '.join(['"'+i+'"' for i in myList])

ตัวอย่าง:

>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"

อย่างไรก็ตามหากรายการเริ่มต้นมีบางรายการ "พวกเขาจะไม่รอดพ้นหากจำเป็นก็เป็นไปได้ที่จะเรียกใช้ฟังก์ชั่นเพื่อหลบหนีแบบนั้น:

print ', '.join(['"'+myFunction(i)+'"' for i in myList])
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.