ฉันต้องนับจำนวนไฟล์ในไดเรกทอรีโดยใช้ Python
ฉันเดาว่าวิธีที่ง่ายที่สุดคือlen(glob.glob('*'))
แต่นั่นก็นับไดเรกทอรีเองเป็นไฟล์
มีวิธีการนับเฉพาะไฟล์ในไดเรกทอรีหรือไม่?
ฉันต้องนับจำนวนไฟล์ในไดเรกทอรีโดยใช้ Python
ฉันเดาว่าวิธีที่ง่ายที่สุดคือlen(glob.glob('*'))
แต่นั่นก็นับไดเรกทอรีเองเป็นไฟล์
มีวิธีการนับเฉพาะไฟล์ในไดเรกทอรีหรือไม่?
คำตอบ:
os.listdir()
จะมีประสิทธิภาพมากกว่าการใช้glob.glob
เล็กน้อย ในการทดสอบว่าชื่อไฟล์เป็นไฟล์ธรรมดา (หรือไม่ใช่ไดเรกทอรีหรือเอนทิตีอื่น ๆ ) ให้ใช้os.path.isfile()
:
import os, os.path
# simple version for working with CWD
print len([name for name in os.listdir('.') if os.path.isfile(name)])
# path joining version for other paths
DIR = '/tmp'
print len([name for name in os.listdir(DIR) if os.path.isfile(os.path.join(DIR, name))])
folder_path
ข้างในos.path.filename(name)
ถ้าคุณไม่ได้อยู่ใน cwd stackoverflow.com/questions/17893542/…
os.path.join(DIR, name)
เกินDIR + '/' + name
คืออะไร? หลังสั้นกว่าและ IMO ชัดเจนกว่าแบบเดิม อาจมีระบบปฏิบัติการบ้างไหม: ระบบปฏิบัติการใดบ้างที่จะล้มเหลว?
import os
path, dirs, files = next(os.walk("/usr/lib"))
file_count = len(files)
สำหรับไฟล์ทุกประเภทไดเรกทอรีย่อยรวม:
import os
list = os.listdir(dir) # dir is your directory path
number_files = len(list)
print number_files
ไฟล์เท่านั้น (หลีกเลี่ยงไดเรกทอรีย่อย):
import os
onlyfiles = next(os.walk(dir))[2] #dir is your directory path as string
print len(onlyfiles)
นี่คือที่ fnmatch มีประโยชน์มาก:
import fnmatch
print len(fnmatch.filter(os.listdir(dirpath), '*.txt'))
รายละเอียดเพิ่มเติม: http://docs.python.org/2/library/fnmatch.html
os.path.isfile()
คำตอบที่ยอมรับ glob.glob()
อย่างมีนัยสำคัญได้เร็วกว่า
หากคุณต้องการนับไฟล์ทั้งหมดในไดเรกทอรี - รวมถึงไฟล์ในไดเรกทอรีย่อยวิธี pythonic ที่ดีที่สุดคือ:
import os
file_count = sum(len(files) for _, _, files in os.walk(r'C:\Dropbox'))
print(file_count)
เราใช้ผลรวมที่เร็วกว่าการเพิ่มจำนวนไฟล์อย่างชัดเจน (รอการกำหนดเวลา)
_
ในfor
วงวน os.walk
ฉันก็รู้เช่นกัน แต่ไม่แน่ใจว่าเกิดอะไรขึ้นกับขีดล่างในsum
ฟังก์ชั่นคุณช่วยอธิบายได้ไหม ขอบคุณ!
import os
print len(os.listdir(os.getcwd()))
def directory(path,extension):
list_dir = []
list_dir = os.listdir(path)
count = 0
for file in list_dir:
if file.endswith(extension): # eg: '.txt'
count += 1
return count
ฉันประหลาดใจที่ไม่มีใครพูดถึงos.scandir
:
def count_files(dir):
return len([1 for x in list(os.scandir(dir)) if x.is_file()])
สิ่งนี้ใช้os.listdir
และทำงานกับไดเรกทอรีใด ๆ :
import os
directory = 'mydirpath'
number_of_files = len([item for item in os.listdir(directory) if os.path.isfile(os.path.join(directory, item))])
สิ่งนี้สามารถทำให้ง่ายขึ้นด้วยเครื่องกำเนิดไฟฟ้าและทำให้เร็วขึ้นเล็กน้อยด้วย:
import os
isfile = os.path.isfile
join = os.path.join
directory = 'mydirpath'
number_of_files = sum(1 for item in os.listdir(directory) if isfile(join(directory, item)))
def count_em(valid_path):
x = 0
for root, dirs, files in os.walk(valid_path):
for f in files:
x = x+1
print "There are", x, "files in this directory."
return x
files
เป็นรายการ 2. OP ไม่ได้มองหาการเรียกซ้ำ
import os
def count_files(in_directory):
joiner= (in_directory + os.path.sep).__add__
return sum(
os.path.isfile(filename)
for filename
in map(joiner, os.listdir(in_directory))
)
>>> count_files("/usr/lib")
1797
>>> len(os.listdir("/usr/lib"))
2049
รหัสฟอร์แมตของลุค
import os
print len(os.walk('/usr/lib').next()[2])
นี่เป็นคำสั่งแบบบรรทัดเดียวที่ฉันพบว่ามีประโยชน์:
print int(os.popen("ls | wc -l").read())
ls
frowned โดยทั่วไป (อาจทำให้เกิดปัญหาได้บ่อย) แม้ว่านี่จะไม่ใช่วิธี "ที่รวดเร็วและสกปรก" ที่เชลล์ คุณควรใช้ls -1
อย่างไรก็ตามมันรับประกันหนึ่งบรรทัดต่อไฟล์
ในขณะที่ฉันเห็นด้วยกับคำตอบของ @DanielStutzbach: os.listdir()
จะมีประสิทธิภาพมากกว่าการใช้เล็กน้อยglob.glob
เล็กน้อย
len(glob.glob())
อย่างไรก็ตามความแม่นยำเป็นพิเศษถ้าคุณไม่ต้องการที่จะนับจำนวนเฉพาะไฟล์ในโฟลเดอร์ที่คุณต้องการใช้ ตัวอย่างเช่นหากคุณนับ PDF ทั้งหมดในโฟลเดอร์ที่คุณต้องการใช้:
pdfCounter = len(glob.glob1(myPath,"*.pdf"))
มันง่าย:
print(len([iq for iq in os.scandir('PATH')]))
มันเพียงนับจำนวนไฟล์ในไดเรกทอรีฉันได้ใช้เทคนิคความเข้าใจในรายการเพื่อย้ำผ่านไดเรกทอรีเฉพาะที่ส่งคืนไฟล์ทั้งหมดในคืน "len (รายการที่ส่งคืน)" ส่งคืนจำนวนไฟล์
import os
total_con=os.listdir('<directory path>')
files=[]
for f_n in total_con:
if os.path.isfile(f_n):
files.append(f_n)
print len(files)
หากคุณใช้เชลล์มาตรฐานของระบบปฏิบัติการคุณจะได้รับผลลัพธ์เร็วกว่าการใช้วิธี pythonic ล้วนๆ
ตัวอย่างสำหรับ Windows:
import os
import subprocess
def get_num_files(path):
cmd = 'DIR \"%s\" /A-D /B /S | FIND /C /V ""' % path
return int(subprocess.check_output(cmd, shell=True))
ฉันพบคำตอบอื่นซึ่งอาจถูกต้องตามคำตอบที่ยอมรับได้
for root, dirs, files in os.walk(input_path):
for name in files:
if os.path.splitext(name)[1] == '.TXT' or os.path.splitext(name)[1] == '.txt':
datafiles.append(os.path.join(root,name))
print len(files)
ฉันใช้glob.iglob
โครงสร้างไดเรกทอรีคล้ายกับ
data
└───train
│ └───subfolder1
│ | │ file111.png
│ | │ file112.png
│ | │ ...
│ |
│ └───subfolder2
│ │ file121.png
│ │ file122.png
│ │ ...
└───test
│ file221.png
│ file222.png
ตัวเลือกทั้งสองต่อไปนี้คืนค่า 4 (ตามที่คาดไว้นั่นคือไม่นับโฟลเดอร์ย่อยด้วยตนเอง )
len(list(glob.iglob("data/train/*/*.png", recursive=True)))
sum(1 for i in glob.iglob("data/train/*/*.png"))
ฉันทำสิ่งนี้และส่งคืนจำนวนไฟล์ในโฟลเดอร์ (Attack_Data) ... มันใช้งานได้ดี
import os
def fcount(path):
#Counts the number of files in a directory
count = 0
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
count += 1
return count
path = r"C:\Users\EE EKORO\Desktop\Attack_Data" #Read files in folder
print (fcount(path))