ฉันจะรับรายการไฟล์ทั้งหมด (และไดเรกทอรี) ในไดเรกทอรีที่กำหนดใน Python ได้อย่างไร
ฉันจะรับรายการไฟล์ทั้งหมด (และไดเรกทอรี) ในไดเรกทอรีที่กำหนดใน Python ได้อย่างไร
คำตอบ:
นี่เป็นวิธีการสำรวจทุก ๆ ไฟล์และไดเรกทอรีในแผนผังไดเรกทอรี:
import os
for dirname, dirnames, filenames in os.walk('.'):
# print path to all subdirectories first.
for subdirname in dirnames:
print(os.path.join(dirname, subdirname))
# print path to all filenames.
for filename in filenames:
print(os.path.join(dirname, filename))
# Advanced usage:
# editing the 'dirnames' list will stop os.walk() from recursing into there.
if '.git' in dirnames:
# don't go into any .git directories.
dirnames.remove('.git')
for subdirname in dirnames: if subdirname != '.git'
คุณสามารถใช้ได้
os.listdir(path)
สำหรับการอ้างอิงและฟังก์ชั่นระบบปฏิบัติการอื่น ๆ ดูที่นี่:
os.scandir
แทนอย่างไรก็ตามเนื่องจากในหลาย ๆ กรณีจะช่วยให้คุณสามารถป้องกันการโทรของระบบทำให้เพิ่มความเร็วได้ฟรี (ทั้ง IPC และ IO ช้า)
os.path.isdir
หรือ
นี่คือฟังก์ชั่นตัวช่วยที่ฉันใช้บ่อย:
import os
def listdir_fullpath(d):
return [os.path.join(d, f) for f in os.listdir(d)]
import os
for filename in os.listdir("C:\\temp"):
print filename
r'C:\temp'
มีความชัดเจนและเป็นที่ต้องการสำหรับ"C:\\temp"
Rawstrings ดีกว่าในการหลบหลีกแบ็กสแลช
หากคุณต้องการความสามารถในการเสริมกำลังมีโมดูลสำหรับสิ่งนั้นเช่นกัน ตัวอย่างเช่น:
import glob
glob.glob('./[0-9].*')
จะคืนบางสิ่งเช่น:
['./1.gif', './2.txt']
ลองสิ่งนี้:
import os
for top, dirs, files in os.walk('./'):
for nm in files:
print os.path.join(top, nm)
สำหรับไฟล์ในไดเรกทอรีการทำงานปัจจุบันโดยไม่ระบุพา ธ
Python 2.7:
import os
os.listdir(os.getcwd())
Python 3.x:
import os
os.listdir()
ขอบคุณ Stam Kaly สำหรับความคิดเห็นใน python 3.x
os.listdir()
รายการองค์ประกอบในไดเรกทอรีปัจจุบันโดยค่าเริ่มต้น! ไม่จำเป็นต้องos.getcwd()
:)
การใช้งานแบบเรียกซ้ำ
import os
def scan_dir(dir):
for name in os.listdir(dir):
path = os.path.join(dir, name)
if os.path.isfile(path):
print path
else:
scan_dir(path)
ฉันเขียนเวอร์ชันยาวโดยมีตัวเลือกทั้งหมดที่ฉันต้องการ: http://sam.nipl.net/code/python/find.py
ฉันเดาว่ามันจะพอดีกับที่นี่ด้วย:
#!/usr/bin/env python
import os
import sys
def ls(dir, hidden=False, relative=True):
nodes = []
for nm in os.listdir(dir):
if not hidden and nm.startswith('.'):
continue
if not relative:
nm = os.path.join(dir, nm)
nodes.append(nm)
nodes.sort()
return nodes
def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
root = os.path.join(root, '') # add slash if not there
for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
if relative:
parent = parent[len(root):]
if dirs and parent:
yield os.path.join(parent, '')
if not hidden:
lfiles = [nm for nm in lfiles if not nm.startswith('.')]
ldirs[:] = [nm for nm in ldirs if not nm.startswith('.')] # in place
if files:
lfiles.sort()
for nm in lfiles:
nm = os.path.join(parent, nm)
yield nm
def test(root):
print "* directory listing, with hidden files:"
print ls(root, hidden=True)
print
print "* recursive listing, with dirs, but no hidden files:"
for f in find(root, dirs=True):
print f
print
if __name__ == "__main__":
test(*sys.argv[1:])
นี่คือตัวเลือกอื่น
os.scandir(path='.')
มันจะส่งคืนตัววนซ้ำของวัตถุ os.DirEntry ที่สอดคล้องกับรายการ (พร้อมกับข้อมูลแอตทริบิวต์ของไฟล์) ในไดเรกทอรีที่กำหนดโดยเส้นทาง
ตัวอย่าง:
with os.scandir(path) as it:
for entry in it:
if not entry.name.startswith('.'):
print(entry.name)
การใช้ scandir () แทนที่จะเป็น listdir () สามารถเพิ่มประสิทธิภาพของรหัสได้อย่างมากซึ่งต้องการประเภทของไฟล์หรือข้อมูลแอตทริบิวต์ของไฟล์มากเนื่องจากวัตถุ os.DirEntry จะเปิดเผยข้อมูลนี้หากระบบปฏิบัติการจัดเตรียมไว้เมื่อสแกนไดเรกทอรี เมธอด os.DirEntry ทั้งหมดอาจทำการเรียกระบบ แต่ is_dir () และ is_file () มักจะต้องการการเรียกใช้ระบบสำหรับลิงก์สัญลักษณ์เท่านั้น os.DirEntry.stat () ต้องมีการเรียกระบบบนยูนิกซ์เสมอ แต่ต้องการเพียงหนึ่งสำหรับลิงก์สัญลักษณ์บน Windows
ในขณะที่os.listdir()
ใช้ได้สำหรับการสร้างรายชื่อไฟล์และชื่อ dir บ่อยครั้งที่คุณต้องการทำมากขึ้นเมื่อคุณมีชื่อเหล่านั้น - และใน Python3, pathlibทำให้เหลือเกินอื่น ๆ ที่ง่าย ลองมาดูกันว่าคุณชอบมันมากที่สุด
หากต้องการแสดงเนื้อหา dir ให้สร้างออบเจกต์ Path และคว้าตัววนซ้ำ:
In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>
หากเราต้องการเพียงรายชื่อสิ่งต่าง ๆ :
In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
'ntp-restrict.conf',
'periodic',
ถ้าคุณต้องการแค่ dirs:
In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
'periodic',
'mach_init.d',
หากคุณต้องการชื่อของไฟล์ conf ทั้งหมดในทรีนั้น:
In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
'dnsextd.conf',
'syslog.conf',
หากคุณต้องการรายการไฟล์ conf ในแผนผัง> = 1K:
In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
'pf.conf',
'autofs.conf',
การแก้ไขเส้นทางสัมพัทธ์กลายเป็นเรื่องง่าย:
In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')
การนำทางด้วยเส้นทางค่อนข้างชัดเจน (แม้ว่าจะไม่คาดคิด):
In [10]: p = Path('.')
In [11]: core = p / 'web' / 'core'
In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
PosixPath('web/core/services.py'),
PosixPath('web/core/querysets.py'),
ซับในที่ดีเพื่อแสดงเฉพาะไฟล์ที่วนซ้ำ ฉันใช้สิ่งนี้ในคำสั่ง setup.py package_data ของฉัน:
import os
[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]
ฉันรู้ว่ามันไม่ใช่คำตอบสำหรับคำถาม แต่อาจมีประโยชน์
#!/bin/python2
import os
def scan_dir(path):
print map(os.path.abspath, os.listdir(pwd))
สำหรับตัวกรองและแผนที่คุณจำเป็นต้องล้อมด้วยรายการ ()
#!/bin/python3
import os
def scan_dir(path):
print(list(map(os.path.abspath, os.listdir(pwd))))
คำแนะนำตอนนี้คือคุณแทนที่การใช้แผนที่และตัวกรองด้วยนิพจน์กำเนิดหรือความเข้าใจในรายการ:
#!/bin/python
import os
def scan_dir(path):
print([os.path.abspath(f) for f in os.listdir(path)])
นี่คือเวอร์ชั่น Pythonic หนึ่งบรรทัด:
import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]
รหัสนี้แสดงเส้นทางแบบเต็มของไฟล์และไดเรกทอรีทั้งหมดในชื่อไดเรกทอรีที่กำหนด
ฉันรู้ว่านี่เป็นคำถามเก่า นี่เป็นวิธีที่เรียบร้อยฉันเจอถ้าคุณอยู่ในเครื่อง liunx
import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))
#import modules
import os
_CURRENT_DIR = '.'
def rec_tree_traverse(curr_dir, indent):
"recurcive function to traverse the directory"
#print "[traverse_tree]"
try :
dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
except:
print "wrong path name/directory name"
return
for file_or_dir in dfList:
if os.path.isdir(file_or_dir):
#print "dir : ",
print indent, file_or_dir,"\\"
rec_tree_traverse(file_or_dir, indent*2)
if os.path.isfile(file_or_dir):
#print "file : ",
print indent, file_or_dir
#end if for loop
#end of traverse_tree()
def main():
base_dir = _CURRENT_DIR
rec_tree_traverse(base_dir," ")
raw_input("enter any key to exit....")
#end of main()
if __name__ == '__main__':
main()
FYI เพิ่มตัวกรองการขยายหรือขยายการนำเข้าไฟล์ระบบปฏิบัติการ
path = '.'
for dirname, dirnames, filenames in os.walk(path):
# print path to all filenames with extension py.
for filename in filenames:
fname_path = os.path.join(dirname, filename)
fext = os.path.splitext(fname_path)[1]
if fext == '.py':
print fname_path
else:
continue
หากคิดว่าฉันจะโยนสิ่งนี้มาวิธีที่ง่ายและสกปรกในการค้นหาไวด์การ์ด
import re
import os
[a for a in os.listdir(".") if re.search("^.*\.py$",a)]
รหัสด้านล่างจะแสดงรายการไดเรกทอรีและไฟล์ภายใน dir
def print_directory_contents(sPath):
import os
for sChild in os.listdir(sPath):
sChildPath = os.path.join(sPath,sChild)
if os.path.isdir(sChildPath):
print_directory_contents(sChildPath)
else:
print(sChildPath)
คนที่ทำงานกับฉันเป็นรุ่นดัดแปลงจากคำตอบของ Saleh ด้านบน
รหัสดังต่อไปนี้:
"dir = 'given_directory_name' filenames = [os.path.abspath (os.path.join (dir, i)) สำหรับ i ใน os.listdir (dir)]"