ฉันจะแสดงรายการไฟล์ทั้งหมดของไดเรกทอรีใน Python และเพิ่มลงใน a ได้list
อย่างไร?
ฉันจะแสดงรายการไฟล์ทั้งหมดของไดเรกทอรีใน Python และเพิ่มลงใน a ได้list
อย่างไร?
คำตอบ:
os.listdir()
คุณจะได้รับทุกอย่างที่อยู่ในไดเรกทอรี - ไฟล์และไดเรกทอรี
หากคุณต้องการเพียงแค่ไฟล์คุณสามารถกรองสิ่งนี้ลงโดยใช้os.path
:
from os import listdir
from os.path import isfile, join
onlyfiles = [f for f in listdir(mypath) if isfile(join(mypath, f))]
หรือคุณสามารถใช้os.walk()
ซึ่งจะให้สองรายการสำหรับแต่ละไดเรกทอรีที่เข้าชม - แยกไฟล์และdirsสำหรับคุณ หากคุณต้องการเฉพาะไดเรกทอรีอันดับต้น ๆ คุณสามารถแบ่งได้เป็นครั้งแรกที่ไดเรกทอรีนั้นให้
from os import walk
f = []
for (dirpath, dirnames, filenames) in walk(mypath):
f.extend(filenames)
break
(_, _, filenames) = walk(mypath).next()
(หากคุณมั่นใจว่าการเดินจะกลับมาอย่างน้อยหนึ่งค่าซึ่งควรทำ)
f.extend(filenames)
f = f + filenames
ไม่จริงเทียบเท่ากับ extend
จะแก้ไขf
แบบแทนที่การเพิ่มจะสร้างรายการใหม่ในตำแหน่งหน่วยความจำใหม่ วิธีการextend
นี้โดยทั่วไปมีประสิทธิภาพมากกว่า+
แต่บางครั้งอาจนำไปสู่ความสับสนหากวัตถุหลายรายการมีการอ้างอิงถึงรายการ สุดท้ายก็เป็นที่น่าสังเกตว่าf += filenames
เทียบเท่ากับf.extend(filenames)
, ไม่ f = f + filenames
_, _, filenames = next(walk(mypath), (None, None, []))
(_, _, filenames) = next(os.walk(mypath))
ฉันชอบที่จะใช้glob
โมดูลเพราะมันจะจับคู่รูปแบบและขยาย
import glob
print(glob.glob("/home/adam/*.txt"))
มันจะส่งคืนรายการที่มีไฟล์สอบถาม:
['/home/adam/file1.txt', '/home/adam/file2.txt', .... ]
/home/user/foo/bar/hello.txt
แล้วถ้าทำงานในไดเรกทอรีfoo
ที่จะกลับมาglob("bar/*.txt")
bar/hello.txt
มีหลายกรณีที่คุณทำในความเป็นจริงต้องการเส้นทางแบบเต็ม (เช่นสัมบูรณ์); สำหรับกรณีเหล่านี้โปรดดูstackoverflow.com/questions/51520/…
glob.glob("*")
หากว่า
x=glob.glob("../train/*.png")
จะให้เส้นทางมากมายแก่ฉันตราบใดที่ฉันรู้ชื่อของโฟลเดอร์ เจ๋ง!
รับรายการไฟล์ด้วย Python 2 และ 3
os.listdir()
วิธีรับไฟล์ทั้งหมด (และไดเรกทอรี) ในไดเรกทอรีปัจจุบัน (Python 3)
ต่อไปนี้เป็นวิธีการง่าย ๆ ในการดึงข้อมูลเฉพาะไฟล์ในไดเรกทอรีปัจจุบันการใช้os
และlistdir()
ฟังก์ชั่นใน Python 3 การสำรวจเพิ่มเติมจะสาธิตวิธีการส่งคืนโฟลเดอร์ในไดเรกทอรี แต่คุณจะไม่มีไฟล์ในไดเรกทอรีย่อยสำหรับคุณ สามารถใช้การเดิน - กล่าวถึงในภายหลัง)
import os
arr = os.listdir()
print(arr)
>>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
glob
ฉันพบว่า glob ง่ายต่อการเลือกไฟล์ประเภทเดียวกันหรือมีบางอย่างที่เหมือนกัน ดูตัวอย่างต่อไปนี้:
import glob
txtfiles = []
for file in glob.glob("*.txt"):
txtfiles.append(file)
glob
ด้วยความเข้าใจในรายการ
import glob
mylist = [f for f in glob.glob("*.txt")]
glob
ด้วยฟังก์ชั่น
ฟังก์ชันส่งคืนรายการส่วนขยายที่กำหนด (.txt, .docx ecc.) ในอาร์กิวเมนต์
import glob
def filebrowser(ext=""):
"Returns files with an extension"
return [f for f in glob.glob(f"*{ext}")]
x = filebrowser(".txt")
print(x)
>>> ['example.txt', 'fb.txt', 'intro.txt', 'help.txt']
glob
การขยายรหัสก่อนหน้า
ตอนนี้ฟังก์ชั่นจะคืนค่ารายการไฟล์ที่ตรงกับสตริงที่คุณส่งเป็นอาร์กิวเมนต์
import glob
def filesearch(word=""):
"""Returns a list with all files with the word/extension in it"""
file = []
for f in glob.glob("*"):
if word[0] == ".":
if f.endswith(word):
file.append(f)
return file
elif word in f:
file.append(f)
return file
return file
lookfor = "example", ".py"
for w in lookfor:
print(f"{w:10} found => {filesearch(w)}")
เอาท์พุต
example found => []
.py found => ['search.py']
รับชื่อพา ธ เต็มด้วย
os.path.abspath
ดังที่คุณสังเกตเห็นว่าคุณไม่มีเส้นทางแบบเต็มของไฟล์ในรหัสด้านบน หากคุณจำเป็นต้องมีพา ธ สัมบูรณ์คุณสามารถใช้ฟังก์ชันอื่นของos.path
โมดูลที่เรียกใช้_getfullpathname
โดยวางไฟล์ที่คุณได้รับจากos.listdir()
อาร์กิวเมนต์ มีวิธีอื่นในการมีเส้นทางแบบเต็มเนื่องจากเราจะตรวจสอบในภายหลัง (ฉันแทนที่ตามที่แนะนำโดย mexmex, _getfullpathname ด้วยabspath
)
import os
files_path = [os.path.abspath(x) for x in os.listdir()]
print(files_path)
>>> ['F:\\documenti\applications.txt', 'F:\\documenti\collections.txt']
รับชื่อพา ธ เต็มของประเภทไฟล์ลงในไดเรกทอรีย่อยทั้งหมดด้วย
walk
ฉันพบสิ่งนี้มีประโยชน์มากในการค้นหาสิ่งต่าง ๆ ในหลาย ๆ ไดเรกทอรีและช่วยฉันค้นหาแฟ้มที่ฉันจำชื่อไม่ได้:
import os
# Getting the current work directory (cwd)
thisdir = os.getcwd()
# r=root, d=directories, f = files
for r, d, f in os.walk(thisdir):
for file in f:
if file.endswith(".docx"):
print(os.path.join(r, file))
os.listdir()
: รับไฟล์ในไดเรกทอรีปัจจุบัน (Python 2)
ใน Python 2 หากคุณต้องการรายชื่อไฟล์ในไดเรกทอรีปัจจุบันคุณจะต้องให้อาร์กิวเมนต์เป็น '.' หรือ os.getcwd () ในวิธีการ os.listdir
import os
arr = os.listdir('.')
print(arr)
>>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
ที่จะขึ้นไปในไดเรกทอรีต้นไม้
# Method 1
x = os.listdir('..')
# Method 2
x= os.listdir('/')
รับไฟล์:
os.listdir()
ในไดเรกทอรีเฉพาะ (Python 2 และ 3)
import os
arr = os.listdir('F:\\python')
print(arr)
>>> ['$RECYCLE.BIN', 'work.txt', '3ebooks.txt', 'documents']
รับไฟล์ของไดเรกทอรีย่อยหนึ่ง ๆ ด้วย
os.listdir()
import os
x = os.listdir("./content")
os.walk('.')
- ไดเรกทอรีปัจจุบัน
import os
arr = next(os.walk('.'))[2]
print(arr)
>>> ['5bs_Turismo1.pdf', '5bs_Turismo1.pptx', 'esperienza.txt']
next(os.walk('.'))
และos.path.join('dir', 'file')
import os
arr = []
for d,r,f in next(os.walk("F:\\_python")):
for file in f:
arr.append(os.path.join(r,file))
for f in arr:
print(files)
>>> F:\\_python\\dict_class.py
>>> F:\\_python\\programmi.txt
next(os.walk('F:\\')
- รับเส้นทางแบบเต็ม - รายการความเข้าใจ
[os.path.join(r,file) for r,d,f in next(os.walk("F:\\_python")) for file in f]
>>> ['F:\\_python\\dict_class.py', 'F:\\_python\\programmi.txt']
os.walk
- รับเส้นทางแบบเต็ม - ไฟล์ทั้งหมดใน dirs ย่อย
x = [os.path.join(r,file) for r,d,f in os.walk("F:\\_python") for file in f]
print(x)
>>> ['F:\\_python\\dict.py', 'F:\\_python\\progr.txt', 'F:\\_python\\readl.py']
os.listdir()
- รับไฟล์ txt เท่านั้น
arr_txt = [x for x in os.listdir() if x.endswith(".txt")]
print(arr_txt)
>>> ['work.txt', '3ebooks.txt']
ใช้
glob
เพื่อรับเส้นทางแบบเต็มของไฟล์
หากฉันต้องการเส้นทางที่แน่นอนของไฟล์:
from path import path
from glob import glob
x = [path(f).abspath() for f in glob("F:\\*.txt")]
for f in x:
print(f)
>>> F:\acquistionline.txt
>>> F:\acquisti_2018.txt
>>> F:\bootstrap_jquery_ecc.txt
การใช้
os.path.isfile
เพื่อหลีกเลี่ยงไดเรกทอรีในรายการ
import os.path
listOfFiles = [f for f in os.listdir() if os.path.isfile(f)]
print(listOfFiles)
>>> ['a simple game.py', 'data.txt', 'decorator.py']
ใช้
pathlib
จาก Python 3.4
import pathlib
flist = []
for p in pathlib.Path('.').iterdir():
if p.is_file():
print(p)
flist.append(p)
>>> error.PNG
>>> exemaker.bat
>>> guiprova.mp3
>>> setup.py
>>> speak_gui2.py
>>> thumb.PNG
ด้วยlist comprehension
:
flist = [p for p in pathlib.Path('.').iterdir() if p.is_file()]
หรือใช้pathlib.Path()
แทนpathlib.Path(".")
ใช้วิธี glob ใน pathlib.Path ()
import pathlib
py = pathlib.Path().glob("*.py")
for file in py:
print(file)
>>> stack_overflow_list.py
>>> stack_overflow_list_tkinter.py
รับไฟล์ทั้งหมดด้วย os.walk
import os
x = [i[2] for i in os.walk('.')]
y=[]
for t in x:
for f in t:
y.append(f)
print(y)
>>> ['append_to_list.py', 'data.txt', 'data1.txt', 'data2.txt', 'data_180617', 'os_walk.py', 'READ2.py', 'read_data.py', 'somma_defaltdic.py', 'substitute_words.py', 'sum_data.py', 'data.txt', 'data1.txt', 'data_180617']
รับเฉพาะไฟล์ที่มีไฟล์ถัดไปแล้วเดินไปในไดเรกทอรี
import os
x = next(os.walk('F://python'))[2]
print(x)
>>> ['calculator.bat','calculator.py']
รับเฉพาะไดเรกทอรีที่มีรายการถัดไปและเดินไปในไดเรกทอรี
import os
next(os.walk('F://python'))[1] # for the current dir use ('.')
>>> ['python3','others']
รับชื่อย่อยทั้งหมดด้วย
walk
for r,d,f in os.walk("F:\\_python"):
for dirs in d:
print(dirs)
>>> .vscode
>>> pyexcel
>>> pyschool.py
>>> subtitles
>>> _metaprogramming
>>> .ipynb_checkpoints
os.scandir()
จาก Python 3.5 และสูงกว่า
import os
x = [f.name for f in os.scandir() if f.is_file()]
print(x)
>>> ['calculator.bat','calculator.py']
# Another example with scandir (a little variation from docs.python.org)
# This one is more efficient than os.listdir.
# In this case, it shows the files only in the current directory
# where the script is executed.
import os
with os.scandir() as i:
for entry in i:
if entry.is_file():
print(entry.name)
>>> ebookmaker.py
>>> error.PNG
>>> exemaker.bat
>>> guiprova.mp3
>>> setup.py
>>> speakgui4.py
>>> speak_gui2.py
>>> speak_gui3.py
>>> thumb.PNG
ตัวอย่าง:
อดีต 1: มีกี่ไฟล์ในไดเรกทอรีย่อย?
ในตัวอย่างนี้เราจะค้นหาจำนวนไฟล์ที่รวมอยู่ในไดเรกทอรีทั้งหมดและไดเรกทอรีย่อย
import os
def count(dir, counter=0):
"returns number of files in dir and subdirs"
for pack in os.walk(dir):
for f in pack[2]:
counter += 1
return dir + " : " + str(counter) + "files"
print(count("F:\\python"))
>>> 'F:\\\python' : 12057 files'
Ex.2: วิธีการคัดลอกไฟล์ทั้งหมดจากไดเรกทอรีไปยังอีก?
สคริปต์เพื่อให้คอมพิวเตอร์ของคุณค้นหาไฟล์ทุกประเภท (ค่าเริ่มต้น: pptx) และคัดลอกไฟล์เหล่านั้นในโฟลเดอร์ใหม่
import os
import shutil
from path import path
destination = "F:\\file_copied"
# os.makedirs(destination)
def copyfile(dir, filetype='pptx', counter=0):
"Searches for pptx (or other - pptx is the default) files and copies them"
for pack in os.walk(dir):
for f in pack[2]:
if f.endswith(filetype):
fullpath = pack[0] + "\\" + f
print(fullpath)
shutil.copy(fullpath, destination)
counter += 1
if counter > 0:
print('-' * 30)
print("\t==> Found in: `" + dir + "` : " + str(counter) + " files\n")
for dir in os.listdir():
"searches for folders that starts with `_`"
if dir[0] == '_':
# copyfile(dir, filetype='pdf')
copyfile(dir, filetype='txt')
>>> _compiti18\Compito Contabilità 1\conti.txt
>>> _compiti18\Compito Contabilità 1\modula4.txt
>>> _compiti18\Compito Contabilità 1\moduloa4.txt
>>> ------------------------
>>> ==> Found in: `_compiti18` : 3 files
อดีต 3: วิธีรับไฟล์ทั้งหมดในไฟล์ txt
ในกรณีที่คุณต้องการสร้างไฟล์ txt ด้วยชื่อไฟล์ทั้งหมด:
import os
mylist = ""
with open("filelist.txt", "w", encoding="utf-8") as file:
for eachfile in os.listdir():
mylist += eachfile + "\n"
file.write(mylist)
ตัวอย่าง: txt พร้อมไฟล์ทั้งหมดของฮาร์ดไดรฟ์
"""
We are going to save a txt file with all the files in your directory.
We will use the function walk()
"""
import os
# see all the methods of os
# print(*dir(os), sep=", ")
listafile = []
percorso = []
with open("lista_file.txt", "w", encoding='utf-8') as testo:
for root, dirs, files in os.walk("D:\\"):
for file in files:
listafile.append(file)
percorso.append(root + "\\" + file)
testo.write(file + "\n")
listafile.sort()
print("N. of files", len(listafile))
with open("lista_file_ordinata.txt", "w", encoding="utf-8") as testo_ordinato:
for file in listafile:
testo_ordinato.write(file + "\n")
with open("percorso.txt", "w", encoding="utf-8") as file_percorso:
for file in percorso:
file_percorso.write(file + "\n")
os.system("lista_file.txt")
os.system("lista_file_ordinata.txt")
os.system("percorso.txt")
ไฟล์ทั้งหมดของ C: \ ในไฟล์ข้อความเดียว
นี่เป็นรหัสที่สั้นกว่าของเวอร์ชั่นก่อนหน้า เปลี่ยนโฟลเดอร์ที่จะเริ่มค้นหาไฟล์หากคุณต้องการเริ่มจากตำแหน่งอื่น รหัสนี้จะสร้างไฟล์ข้อความขนาด 50 mb บนคอมพิวเตอร์ของฉันโดยมีค่าน้อยกว่า 500,000 บรรทัดที่มีไฟล์พร้อมเส้นทางที่สมบูรณ์
import os
with open("file.txt", "w", encoding="utf-8") as filewrite:
for r, d, f in os.walk("C:\\"):
for file in f:
filewrite.write(f"{r + file}\n")
วิธีเขียนไฟล์ที่มีพา ธ ทั้งหมดในโฟลเดอร์ประเภท
ด้วยฟังก์ชั่นนี้คุณสามารถสร้างไฟล์ txt ที่จะมีชื่อประเภทไฟล์ที่คุณค้นหา (เช่น pngfile.txt) ด้วยพา ธ แบบเต็มของไฟล์ทั้งหมดของประเภทนั้น ฉันคิดว่ามันมีประโยชน์ในบางครั้ง
import os
def searchfiles(extension='.ttf', folder='H:\\'):
"Create a txt file with all the file of a type"
with open(extension[1:] + "file.txt", "w", encoding="utf-8") as filewrite:
for r, d, f in os.walk(folder):
for file in f:
if file.endswith(extension):
filewrite.write(f"{r + file}\n")
# looking for png file (fonts) in the hard disk H:\
searchfiles('.png', 'H:\\')
>>> H:\4bs_18\Dolphins5.png
>>> H:\4bs_18\Dolphins6.png
>>> H:\4bs_18\Dolphins7.png
>>> H:\5_18\marketing html\assets\imageslogo2.png
>>> H:\7z001.png
>>> H:\7z002.png
(ใหม่) ค้นหาไฟล์ทั้งหมดและเปิดด้วย tkinter GUI
ฉันแค่ต้องการเพิ่มแอพเล็ก ๆ ในปี 2019 เพื่อค้นหาไฟล์ทั้งหมดใน dir และสามารถเปิดได้โดยดับเบิลคลิกที่ชื่อของไฟล์ในรายการ
import tkinter as tk
import os
def searchfiles(extension='.txt', folder='H:\\'):
"insert all files in the listbox"
for r, d, f in os.walk(folder):
for file in f:
if file.endswith(extension):
lb.insert(0, r + "\\" + file)
def open_file():
os.startfile(lb.get(lb.curselection()[0]))
root = tk.Tk()
root.geometry("400x400")
bt = tk.Button(root, text="Search", command=lambda:searchfiles('.png', 'H:\\'))
bt.pack()
lb = tk.Listbox(root)
lb.pack(fill="both", expand=1)
lb.bind("<Double-Button>", lambda x: open_file())
root.mainloop()
import os
os.listdir("somedirectory")
จะส่งคืนรายการไฟล์และไดเรกทอรีทั้งหมดใน "somedirectory"
glob.glob
os.listdir()
ส่งคืนเฉพาะชื่อไฟล์เท่านั้น (ไม่ใช่เส้นทางที่สัมพันธ์กัน) สิ่งที่glob.glob()
ส่งคืนจะถูกขับเคลื่อนโดยรูปแบบพา ธ ของรูปแบบการป้อนข้อมูล
โซลูชันบรรทัดเดียวเพื่อรับรายการไฟล์เท่านั้น (ไม่มีไดเรกทอรีย่อย):
filenames = next(os.walk(path))[2]
หรือชื่อพา ธ สัมบูรณ์:
paths = [os.path.join(path, fn) for fn in next(os.walk(path))[2]]
import os
เพียงหนึ่งซับถ้าคุณได้แล้ว ดูเหมือนว่ากระชับน้อยกว่าglob()
ฉัน
glob()
จะถือว่าเป็นไฟล์ วิธีการของคุณจะถือว่าเป็นไดเรกทอรี
การรับเส้นทางไฟล์แบบเต็มจากไดเรกทอรีและไดเรกทอรีย่อยทั้งหมด
import os
def get_filepaths(directory):
"""
This function will generate the file names in a directory
tree by walking the tree either top-down or bottom-up. For each
directory in the tree rooted at directory top (including top itself),
it yields a 3-tuple (dirpath, dirnames, filenames).
"""
file_paths = [] # List which will store all of the full filepaths.
# Walk the tree.
for root, directories, files in os.walk(directory):
for filename in files:
# Join the two strings in order to form the full filepath.
filepath = os.path.join(root, filename)
file_paths.append(filepath) # Add it to the list.
return file_paths # Self-explanatory.
# Run the above function and store its results in a variable.
full_file_paths = get_filepaths("/Users/johnny/Desktop/TEST")
print full_file_paths
ซึ่งจะพิมพ์รายการ:
['/Users/johnny/Desktop/TEST/file1.txt', '/Users/johnny/Desktop/TEST/file2.txt', '/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat']
หากคุณต้องการคุณสามารถเปิดและอ่านเนื้อหาหรือเน้นเฉพาะไฟล์ที่มีนามสกุล ".dat" เช่นในรหัสด้านล่าง:
for f in full_file_paths:
if f.endswith(".dat"):
print f
/Users/johnny/Desktop/TEST/SUBFOLDER/file3.dat
ตั้งแต่เวอร์ชั่น 3.4 มีตัวสร้างซ้ำสำหรับสิ่งนี้ซึ่งมีประสิทธิภาพมากกว่าos.listdir()
:
pathlib
: ใหม่ในเวอร์ชัน 3.4
>>> import pathlib
>>> [p for p in pathlib.Path('.').iterdir() if p.is_file()]
ตามPEP 428จุดประสงค์ของpathlib
ไลบรารีคือการจัดลำดับชั้นอย่างง่าย ๆ ของคลาสเพื่อจัดการกับเส้นทางของระบบไฟล์
os.scandir()
: ใหม่ในเวอร์ชัน 3.5
>>> import os
>>> [entry for entry in os.scandir('.') if entry.is_file()]
โปรดทราบว่าos.walk()
ใช้os.scandir()
แทนos.listdir()
เวอร์ชัน 3.5 และความเร็วเพิ่มขึ้น 2-20 เท่าตามPEP 471471
ผมขอแนะนำให้อ่านความคิดเห็นของ ShadowRanger ด้านล่าง
list
ฉันคิดว่ามันเป็นเพียงการแก้ปัญหาไม่ได้กลับมาโดยตรง สามารถใช้p.name
แทนตัวแรกp
หรือเลือกได้หากต้องการ
pathlib.Path()
อินสแตนซ์เนื่องจากพวกเขามีวิธีการที่มีประโยชน์มากมายฉันไม่อยากเสียขยะ นอกจากนี้คุณยังสามารถโทรหาstr(p)
พวกเขาเพื่อหาชื่อพา ธ
os.scandir
โซลูชันจะมีประสิทธิภาพมากกว่าos.listdir
การos.path.is_file
ตรวจสอบหรือสิ่งที่คล้ายกันแม้ว่าคุณจะต้องการlist
(ดังนั้นคุณจึงไม่ได้รับประโยชน์จากการทำซ้ำแบบขี้เกียจ) เนื่องจากos.scandir
ใช้ OS ที่ให้บริการ API ที่ให้is_file
ข้อมูลฟรีแก่คุณไม่มีการต่อไฟล์เดินทางไปรอบดิสก์เพื่อstat
ให้พวกเขาที่ทุกคน (บน Windows ที่DirEntry
s ได้รับคุณสมบูรณ์stat
ข้อมูลฟรีบนระบบ NIX * จะต้องมีstat
ข้อมูลเกินis_file
, is_dir
ฯลฯ แต่DirEntry
แคชแรกstat
เพื่อความสะดวก)
entry.name
เพื่อรับเฉพาะชื่อไฟล์หรือentry.path
เพื่อรับเส้นทางแบบเต็ม ไม่มี os.path.join () อีกต่อไปทั่วทุกที่
เมื่อถามคำถามฉันคิดว่าPython 2เป็นรุ่นLTSแต่ตัวอย่างโค้ดจะถูกเรียกใช้โดยPython 3 ( .5 ) (ฉันจะให้มันเป็นไปตามPython 2ที่สุดเท่าที่จะเป็นไปได้เช่นกันรหัสใด ๆ ที่เป็นของPythonที่ฉันจะโพสต์นั้นมาจากv3.5.4 - เว้นแต่จะระบุไว้เป็นอย่างอื่น) ที่มีผลกระทบที่เกี่ยวข้องกับคำหลักอื่นในคำถาม: " เพิ่มลงในรายการ ":
>>> import sys >>> sys.version '2.7.10 (default, Mar 8 2016, 15:02:46) [MSC v.1600 64 bit (AMD64)]' >>> m = map(lambda x: x, [1, 2, 3]) # Just a dummy lambda function >>> m, type(m) ([1, 2, 3], <type 'list'>) >>> len(m) 3
>>> import sys >>> sys.version '3.5.4 (v3.5.4:3f56838, Aug 8 2017, 02:17:05) [MSC v.1900 64 bit (AMD64)]' >>> m = map(lambda x: x, [1, 2, 3]) >>> m, type(m) (<map object at 0x000001B4257342B0>, <class 'map'>) >>> len(m) Traceback (most recent call last): File "<stdin>", line 1, in <module> TypeError: object of type 'map' has no len() >>> lm0 = list(m) # Build a list from the generator >>> lm0, type(lm0) ([1, 2, 3], <class 'list'>) >>> >>> lm1 = list(m) # Build a list from the same generator >>> lm1, type(lm1) # Empty list now - generator already consumed ([], <class 'list'>)
ตัวอย่างจะเป็นไปตามไดเรกทอรีที่เรียกว่าroot_dirด้วยโครงสร้างต่อไปนี้ (ตัวอย่างนี้สำหรับWinแต่ฉันใช้ต้นไม้เดียวกันบนLnxด้วย):
E:\Work\Dev\StackOverflow\q003207219>tree /f "root_dir" Folder PATH listing for volume Work Volume serial number is 00000029 3655:6FED E:\WORK\DEV\STACKOVERFLOW\Q003207219\ROOT_DIR ¦ file0 ¦ file1 ¦ +---dir0 ¦ +---dir00 ¦ ¦ ¦ file000 ¦ ¦ ¦ ¦ ¦ +---dir000 ¦ ¦ file0000 ¦ ¦ ¦ +---dir01 ¦ ¦ file010 ¦ ¦ file011 ¦ ¦ ¦ +---dir02 ¦ +---dir020 ¦ +---dir0200 +---dir1 ¦ file10 ¦ file11 ¦ file12 ¦ +---dir2 ¦ ¦ file20 ¦ ¦ ¦ +---dir20 ¦ file200 ¦ +---dir3
[Python 3]: ระบบปฏิบัติการ listdir ( path = '.' )
ส่งคืนรายการที่มีชื่อของรายการในไดเรกทอรีที่กำหนดโดยเส้นทาง รายการอยู่ในลำดับโดยพลการและไม่รวมรายการพิเศษ
'.'
และ'..'
...
>>> import os >>> root_dir = "root_dir" # Path relative to current dir (os.getcwd()) >>> >>> os.listdir(root_dir) # List all the items in root_dir ['dir0', 'dir1', 'dir2', 'dir3', 'file0', 'file1'] >>> >>> [item for item in os.listdir(root_dir) if os.path.isfile(os.path.join(root_dir, item))] # Filter items and only keep files (strip out directories) ['file0', 'file1']
ตัวอย่างที่ซับซ้อนมากขึ้น ( code_os_listdir.py ):
import os
from pprint import pformat
def _get_dir_content(path, include_folders, recursive):
entries = os.listdir(path)
for entry in entries:
entry_with_path = os.path.join(path, entry)
if os.path.isdir(entry_with_path):
if include_folders:
yield entry_with_path
if recursive:
for sub_entry in _get_dir_content(entry_with_path, include_folders, recursive):
yield sub_entry
else:
yield entry_with_path
def get_dir_content(path, include_folders=True, recursive=True, prepend_folder_name=True):
path_len = len(path) + len(os.path.sep)
for item in _get_dir_content(path, include_folders, recursive):
yield item if prepend_folder_name else item[path_len:]
def _get_dir_content_old(path, include_folders, recursive):
entries = os.listdir(path)
ret = list()
for entry in entries:
entry_with_path = os.path.join(path, entry)
if os.path.isdir(entry_with_path):
if include_folders:
ret.append(entry_with_path)
if recursive:
ret.extend(_get_dir_content_old(entry_with_path, include_folders, recursive))
else:
ret.append(entry_with_path)
return ret
def get_dir_content_old(path, include_folders=True, recursive=True, prepend_folder_name=True):
path_len = len(path) + len(os.path.sep)
return [item if prepend_folder_name else item[path_len:] for item in _get_dir_content_old(path, include_folders, recursive)]
def main():
root_dir = "root_dir"
ret0 = get_dir_content(root_dir, include_folders=True, recursive=True, prepend_folder_name=True)
lret0 = list(ret0)
print(ret0, len(lret0), pformat(lret0))
ret1 = get_dir_content_old(root_dir, include_folders=False, recursive=True, prepend_folder_name=False)
print(len(ret1), pformat(ret1))
if __name__ == "__main__":
main()
หมายเหตุ :
ผลผลิต :
(py35x64_test) E:\Work\Dev\StackOverflow\q003207219>"e:\Work\Dev\VEnvs\py35x64_test\Scripts\python.exe" "code_os_listdir.py" <generator object get_dir_content at 0x000001BDDBB3DF10> 22 ['root_dir\\dir0', 'root_dir\\dir0\\dir00', 'root_dir\\dir0\\dir00\\dir000', 'root_dir\\dir0\\dir00\\dir000\\file0000', 'root_dir\\dir0\\dir00\\file000', 'root_dir\\dir0\\dir01', 'root_dir\\dir0\\dir01\\file010', 'root_dir\\dir0\\dir01\\file011', 'root_dir\\dir0\\dir02', 'root_dir\\dir0\\dir02\\dir020', 'root_dir\\dir0\\dir02\\dir020\\dir0200', 'root_dir\\dir1', 'root_dir\\dir1\\file10', 'root_dir\\dir1\\file11', 'root_dir\\dir1\\file12', 'root_dir\\dir2', 'root_dir\\dir2\\dir20', 'root_dir\\dir2\\dir20\\file200', 'root_dir\\dir2\\file20', 'root_dir\\dir3', 'root_dir\\file0', 'root_dir\\file1'] 11 ['dir0\\dir00\\dir000\\file0000', 'dir0\\dir00\\file000', 'dir0\\dir01\\file010', 'dir0\\dir01\\file011', 'dir1\\file10', 'dir1\\file11', 'dir1\\file12', 'dir2\\dir20\\file200', 'dir2\\file20', 'file0', 'file1']
[Python 3]: ระบบปฏิบัติการ scandir ( path = '.' ) ( Python 3.5 +, backport: [PyPI]: scandir )
กลับ iterator ของos.DirEntryวัตถุที่สอดคล้องกับรายการในไดเรกทอรีที่กำหนดโดยเส้นทาง รายการที่จะให้ผลในคำสั่งโดยพลการและรายการพิเศษ
'.'
และ'..'
ไม่รวมการใช้scandir ()แทนที่จะเป็นlistdir ()สามารถเพิ่มประสิทธิภาพของโค้ดที่ต้องการข้อมูลประเภทไฟล์หรือข้อมูลแอตทริบิวต์ไฟล์ได้อย่างมีนัยสำคัญเนื่องจากอ็อบเจ็กต์ os.DirEntryจะเปิดเผยข้อมูลนี้หากระบบปฏิบัติการจัดเตรียมไว้เมื่อสแกนไดเรกทอรี เมธอด os.DirEntryทั้งหมดอาจทำการเรียกระบบ แต่is_dir ()และis_file ()มักจะต้องการการเรียกใช้ระบบสำหรับลิงก์สัญลักษณ์เท่านั้น os.DirEntry.stat ()ต้องมีการเรียกระบบบน Unix เสมอ แต่ต้องการเพียงหนึ่งสำหรับลิงก์สัญลักษณ์บน Windows
>>> import os >>> root_dir = os.path.join(".", "root_dir") # Explicitly prepending current directory >>> root_dir '.\\root_dir' >>> >>> scandir_iterator = os.scandir(root_dir) >>> scandir_iterator <nt.ScandirIterator object at 0x00000268CF4BC140> >>> [item.path for item in scandir_iterator] ['.\\root_dir\\dir0', '.\\root_dir\\dir1', '.\\root_dir\\dir2', '.\\root_dir\\dir3', '.\\root_dir\\file0', '.\\root_dir\\file1'] >>> >>> [item.path for item in scandir_iterator] # Will yield an empty list as it was consumed by previous iteration (automatically performed by the list comprehension) [] >>> >>> scandir_iterator = os.scandir(root_dir) # Reinitialize the generator >>> for item in scandir_iterator : ... if os.path.isfile(item.path): ... print(item.name) ... file0 file1
หมายเหตุ :
os.listdir
[Python 3]: ระบบปฏิบัติการ walk ( top, topdown = True, onerror = None, followlinks = False )
สร้างชื่อไฟล์ในแผนผังไดเรกทอรีโดยการเดินทรีจากบนลงล่างหรือจากล่างขึ้นบน ไดเรกทอรีในต้นไม้ที่หยั่งรากในแต่ละไดเรกทอรีด้านบน (รวมถึงด้านบนของตัวเอง) ก็มีผลเป็น 3 tuple (
dirpath
,dirnames
,filenames
)
>>> import os >>> root_dir = os.path.join(os.getcwd(), "root_dir") # Specify the full path >>> root_dir 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir' >>> >>> walk_generator = os.walk(root_dir) >>> root_dir_entry = next(walk_generator) # First entry corresponds to the root dir (passed as an argument) >>> root_dir_entry ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir', ['dir0', 'dir1', 'dir2', 'dir3'], ['file0', 'file1']) >>> >>> root_dir_entry[1] + root_dir_entry[2] # Display dirs and files (direct descendants) in a single list ['dir0', 'dir1', 'dir2', 'dir3', 'file0', 'file1'] >>> >>> [os.path.join(root_dir_entry[0], item) for item in root_dir_entry[1] + root_dir_entry[2]] # Display all the entries in the previous list by their full path ['E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0', 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir1', 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir2', 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir3', 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\file0', 'E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\file1'] >>> >>> for entry in walk_generator: # Display the rest of the elements (corresponding to every subdir) ... print(entry) ... ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0', ['dir00', 'dir01', 'dir02'], []) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir00', ['dir000'], ['file000']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir00\\dir000', [], ['file0000']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir01', [], ['file010', 'file011']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir02', ['dir020'], []) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir02\\dir020', ['dir0200'], []) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir0\\dir02\\dir020\\dir0200', [], []) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir1', [], ['file10', 'file11', 'file12']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir2', ['dir20'], ['file20']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir2\\dir20', [], ['file200']) ('E:\\Work\\Dev\\StackOverflow\\q003207219\\root_dir\\dir3', [], [])
หมายเหตุ :
os.scandir
( os.listdir
ในรุ่นที่เก่ากว่า)[Python 3]: glob glob ( ชื่อพา ธ , *, เรียกซ้ำ = เท็จ ) ( [Python 3]: glob. iglob ( ชื่อพา ธ , *, เรียกซ้ำ = เท็จ ) )
ส่งคืนรายการชื่อพา ธ ที่อาจว่างเปล่าซึ่งตรงกับชื่อพา ธซึ่งต้องเป็นสตริงที่มีข้อมูลจำเพาะของพา ธ ชื่อพา ธอาจเป็นแบบสัมบูรณ์ (ชอบ
/usr/src/Python-1.5/Makefile
) หรือสัมพัทธ์ (เหมือน../../Tools/*/*.gif
) และสามารถมีอักขระตัวแทนแบบเชลล์ symlink ที่ใช้งานไม่ได้จะรวมอยู่ในผลลัพธ์ (เหมือนในเชลล์)
...
เปลี่ยนเป็นเวอร์ชั่น 3.5 : รองรับ globs แบบเรียกซ้ำโดยใช้“**
”
>>> import glob, os >>> wildcard_pattern = "*" >>> root_dir = os.path.join("root_dir", wildcard_pattern) # Match every file/dir name >>> root_dir 'root_dir\\*' >>> >>> glob_list = glob.glob(root_dir) >>> glob_list ['root_dir\\dir0', 'root_dir\\dir1', 'root_dir\\dir2', 'root_dir\\dir3', 'root_dir\\file0', 'root_dir\\file1'] >>> >>> [item.replace("root_dir" + os.path.sep, "") for item in glob_list] # Strip the dir name and the path separator from begining ['dir0', 'dir1', 'dir2', 'dir3', 'file0', 'file1'] >>> >>> for entry in glob.iglob(root_dir + "*", recursive=True): ... print(entry) ... root_dir\ root_dir\dir0 root_dir\dir0\dir00 root_dir\dir0\dir00\dir000 root_dir\dir0\dir00\dir000\file0000 root_dir\dir0\dir00\file000 root_dir\dir0\dir01 root_dir\dir0\dir01\file010 root_dir\dir0\dir01\file011 root_dir\dir0\dir02 root_dir\dir0\dir02\dir020 root_dir\dir0\dir02\dir020\dir0200 root_dir\dir1 root_dir\dir1\file10 root_dir\dir1\file11 root_dir\dir1\file12 root_dir\dir2 root_dir\dir2\dir20 root_dir\dir2\dir20\file200 root_dir\dir2\file20 root_dir\dir3 root_dir\file0 root_dir\file1
หมายเหตุ :
os.listdir
[Python 3]: pathlib ของชั้นเรียน Path ( * pathegments ) ( Python 3.4 +, backport: [PyPI]: pathlib2 )
>>> import pathlib >>> root_dir = "root_dir" >>> root_dir_instance = pathlib.Path(root_dir) >>> root_dir_instance WindowsPath('root_dir') >>> root_dir_instance.name 'root_dir' >>> root_dir_instance.is_dir() True >>> >>> [item.name for item in root_dir_instance.glob("*")] # Wildcard searching for all direct descendants ['dir0', 'dir1', 'dir2', 'dir3', 'file0', 'file1'] >>> >>> [os.path.join(item.parent.name, item.name) for item in root_dir_instance.glob("*") if not item.is_dir()] # Display paths (including parent) for files only ['root_dir\\file0', 'root_dir\\file1']
หมายเหตุ :
[Python 2]: dircache.listdir (เส้นทาง) ( Python 2เท่านั้น)
os.listdir
ด้วยการแคชdef listdir(path):
"""List directory contents, using cache."""
try:
cached_mtime, list = cache[path]
del cache[path]
except KeyError:
cached_mtime, list = -1, []
mtime = os.stat(path).st_mtime
if mtime != cached_mtime:
list = os.listdir(path)
list.sort()
cache[path] = mtime, list
return list
[man7]: OPENDIR (3) / [man7]: READDIR (3) / [man7]: CLOSEDIR (3)ผ่าน[Python 3]: ctypes - ไลบรารีฟังก์ชันต่างประเทศสำหรับ Python ( POSIXเฉพาะ)
ctypesเป็นห้องสมุดฟังก์ชันต่างประเทศสำหรับ Python มันมีประเภทข้อมูลที่เข้ากันได้ C และช่วยให้ฟังก์ชั่นการโทรใน DLLs หรือห้องสมุดที่ใช้ร่วมกัน มันสามารถใช้ห่อห้องสมุดเหล่านี้ในหลามบริสุทธิ์
code_ctypes.py :
#!/usr/bin/env python3
import sys
from ctypes import Structure, \
c_ulonglong, c_longlong, c_ushort, c_ubyte, c_char, c_int, \
CDLL, POINTER, \
create_string_buffer, get_errno, set_errno, cast
DT_DIR = 4
DT_REG = 8
char256 = c_char * 256
class LinuxDirent64(Structure):
_fields_ = [
("d_ino", c_ulonglong),
("d_off", c_longlong),
("d_reclen", c_ushort),
("d_type", c_ubyte),
("d_name", char256),
]
LinuxDirent64Ptr = POINTER(LinuxDirent64)
libc_dll = this_process = CDLL(None, use_errno=True)
# ALWAYS set argtypes and restype for functions, otherwise it's UB!!!
opendir = libc_dll.opendir
readdir = libc_dll.readdir
closedir = libc_dll.closedir
def get_dir_content(path):
ret = [path, list(), list()]
dir_stream = opendir(create_string_buffer(path.encode()))
if (dir_stream == 0):
print("opendir returned NULL (errno: {:d})".format(get_errno()))
return ret
set_errno(0)
dirent_addr = readdir(dir_stream)
while dirent_addr:
dirent_ptr = cast(dirent_addr, LinuxDirent64Ptr)
dirent = dirent_ptr.contents
name = dirent.d_name.decode()
if dirent.d_type & DT_DIR:
if name not in (".", ".."):
ret[1].append(name)
elif dirent.d_type & DT_REG:
ret[2].append(name)
dirent_addr = readdir(dir_stream)
if get_errno():
print("readdir returned NULL (errno: {:d})".format(get_errno()))
closedir(dir_stream)
return ret
def main():
print("{:s} on {:s}\n".format(sys.version, sys.platform))
root_dir = "root_dir"
entries = get_dir_content(root_dir)
print(entries)
if __name__ == "__main__":
main()
หมายเหตุ :
os.walk
รูปแบบของ ฉันไม่ได้สนใจที่จะทำให้มันวนซ้ำ แต่เริ่มจากรหัสที่มีอยู่นั่นจะเป็นงานที่ไม่สำคัญผลผลิต :
[cfati@cfati-ubtu16x64-0:~/Work/Dev/StackOverflow/q003207219]> ./code_ctypes.py 3.5.2 (default, Nov 12 2018, 13:43:14) [GCC 5.4.0 20160609] on linux ['root_dir', ['dir2', 'dir1', 'dir3', 'dir0'], ['file1', 'file0']]
[ActiveState.Docs]: win32file.FindFilesW ( Winเฉพาะ)
ดึงรายการชื่อไฟล์ที่ตรงกันโดยใช้ Windows Unicode API ส่วนต่อประสานไปยังฟังก์ชัน API FindFirstFileW / FindNextFileW / Find
>>> import os, win32file, win32con >>> root_dir = "root_dir" >>> wildcard = "*" >>> root_dir_wildcard = os.path.join(root_dir, wildcard) >>> entry_list = win32file.FindFilesW(root_dir_wildcard) >>> len(entry_list) # Don't display the whole content as it's too long 8 >>> [entry[-2] for entry in entry_list] # Only display the entry names ['.', '..', 'dir0', 'dir1', 'dir2', 'dir3', 'file0', 'file1'] >>> >>> [entry[-2] for entry in entry_list if entry[0] & win32con.FILE_ATTRIBUTE_DIRECTORY and entry[-2] not in (".", "..")] # Filter entries and only display dir names (except self and parent) ['dir0', 'dir1', 'dir2', 'dir3'] >>> >>> [os.path.join(root_dir, entry[-2]) for entry in entry_list if entry[0] & (win32con.FILE_ATTRIBUTE_NORMAL | win32con.FILE_ATTRIBUTE_ARCHIVE)] # Only display file "full" names ['root_dir\\file0', 'root_dir\\file1']
หมายเหตุ :
win32file.FindFilesW
เป็นส่วนหนึ่งของ[GitHub]: mhammond / pywin32 - Python สำหรับ Windows (pywin32) ส่วนขยายซึ่งเป็นPython wrapper ผ่านWINAPI sหมายเหตุ :
รหัสนี้หมายถึงพกพาได้ (ยกเว้นสถานที่ที่กำหนดเป้าหมายไปยังพื้นที่เฉพาะซึ่งถูกทำเครื่องหมายไว้) หรือข้าม:
มีการใช้สไตล์พา ธ หลายรูปแบบ (สัมบูรณ์ญาติ) ข้ามตัวแปรข้างต้นเพื่อแสดงความจริงว่า "เครื่องมือ" ที่ใช้มีความยืดหยุ่นในทิศทางนี้
os.listdir
และos.scandir
ใช้opendir / readdir / closir ( [MS.Docs]: ฟังก์ชัน FindFirstFileW / [MS.Docs]: ฟังก์ชัน FindNextFileW / [MS.Docs]: ฟังก์ชัน FindClose (ผ่าน[GitHub]: python / cpython - (หลัก) cpython / โมดูล / posixmodule.c )
win32file.FindFilesW
ใช้ฟังก์ชั่นเหล่านั้น ( เฉพาะWin ) เช่นกัน (ผ่าน[GitHub]: mhammond / pywin32 - (master) pywin32 / win32 / src / win32file.i )
_get_dir_content (จากจุด# 1 ) สามารถนำไปใช้งานได้โดยใช้วิธีการใด ๆ เหล่านี้ (บางวิธีจะต้องใช้งานมากกว่านี้และใช้งานน้อยลง)
filter_func=lambda x: True
(สิ่งนี้จะไม่ตัดออกไป อะไรก็ได้) และภายใน_get_dir_contentสิ่งที่ต้องการ: if not filter_func(entry_with_path): continue
(หากฟังก์ชั่นล้มเหลวสำหรับหนึ่งรายการมันจะถูกข้าม) แต่ยิ่งโค้ดซับซ้อนมากเท่าไหร่ก็จะยิ่งนานขึ้นเท่านั้นโปรดทราบ! เนื่องจากมีการใช้การเรียกซ้ำฉันต้องพูดถึงว่าฉันทำการทดสอบบางอย่างบนแล็ปท็อปของฉัน ( Win 10 x64 ) โดยไม่เกี่ยวข้องกับปัญหานี้ทั้งหมดและเมื่อระดับการเรียกซ้ำได้ถึงค่าบางแห่งในช่วง(990 .. 1,000) ( recursionlimit - 1000 (ค่าเริ่มต้น)) ฉันได้รับStackOverflow :) หากทรีไดเรกทอรีเกินขีด จำกัด นั้น (ฉันไม่ใช่ผู้เชี่ยวชาญFSดังนั้นฉันไม่ทราบว่าเป็นไปได้หรือไม่) นั่นอาจเป็นปัญหาได้
ฉันต้องพูดถึงว่าฉันไม่ได้พยายามเพิ่มrecursionlimitเพราะฉันไม่มีประสบการณ์ในพื้นที่ (ฉันสามารถเพิ่มได้มากแค่ไหนก่อนที่จะต้องเพิ่มสแต็กที่ OS ด้วยเช่นกันระดับ) แต่ในทางทฤษฎีแล้วจะมีความเป็นไปได้สำหรับความล้มเหลวอยู่เสมอหากความลึกของ dir มากกว่าค่าที่เรียกซ้ำสูงสุด(บนเครื่องนั้น)
ตัวอย่างรหัสมีวัตถุประสงค์เพื่อการสาธิตเท่านั้น นั่นหมายความว่าฉันไม่ได้คำนึงถึงข้อผิดพลาดในการจัดการบัญชี (ฉันไม่คิดว่าจะมีการลอง / ยกเว้น / อื่น / ปิดกั้นในที่สุด ) ดังนั้นรหัสไม่ได้มีประสิทธิภาพ (เหตุผลคือ: เพื่อให้ง่ายและสั้นที่สุด ) สำหรับการผลิตการจัดการข้อผิดพลาดควรเพิ่มเช่นกัน
ใช้Pythonเป็นเสื้อคลุมเท่านั้น
รสชาติที่โด่งดังที่สุดที่ฉันรู้คือสิ่งที่ฉันเรียกว่าวิธีการของผู้ดูแลระบบ :
grep
/ findstr
) หรือการจัดรูปแบบผลลัพธ์สามารถทำได้ทั้งสองด้าน แต่ฉันจะไม่ยืนยันในเรื่องนี้ นอกจากนี้ผมจงใจใช้แทนos.system
subprocess.Popen
(py35x64_test) E:\Work\Dev\StackOverflow\q003207219>"e:\Work\Dev\VEnvs\py35x64_test\Scripts\python.exe" -c "import os;os.system(\"dir /b root_dir\")" dir0 dir1 dir2 dir3 file0 file1
โดยทั่วไปวิธีการนี้ควรหลีกเลี่ยงเนื่องจากหากรูปแบบเอาต์พุตคำสั่งบางรูปแบบแตกต่างกันเล็กน้อยระหว่างเวอร์ชั่น / รสชาติของOSรหัสการแยกวิเคราะห์ควรถูกปรับเช่นกัน ไม่ต้องพูดถึงความแตกต่างระหว่างตำแหน่งที่ตั้ง)
ฉันชอบคำตอบของ adamkแนะนำให้คุณใช้glob()
จากโมดูลที่มีชื่อเดียวกัน สิ่งนี้ช่วยให้คุณมีรูปแบบการจับคู่กับ*
s
แต่ในขณะที่คนอื่น ๆ ชี้ให้เห็นในความคิดเห็นที่glob()
สามารถได้รับการเพิ่มขึ้นมากกว่าทิศทางเฉือนที่ไม่สอดคล้องกัน เพื่อช่วยในเรื่องนั้นฉันขอแนะนำให้คุณใช้join()
และexpanduser()
ฟังก์ชั่นในos.path
โมดูลและอาจใช้getcwd()
ฟังก์ชั่นในos
โมดูลเช่นกัน
เป็นตัวอย่าง:
from glob import glob
# Return everything under C:\Users\admin that contains a folder called wlp.
glob('C:\Users\admin\*\wlp')
ข้างต้นเป็นสิ่งที่แย่มาก - เส้นทางนั้นได้รับการ hardcoded และจะทำงานบน Windows ระหว่างชื่อไดรฟ์และ\
ฮาร์ดโค้ดที่ถูกพาเข้าไปในเส้นทางเท่านั้น
from glob import glob
from os.path import join
# Return everything under Users, admin, that contains a folder called wlp.
glob(join('Users', 'admin', '*', 'wlp'))
ข้างต้นใช้งานได้ดีกว่า แต่ขึ้นอยู่กับชื่อโฟลเดอร์Users
ที่มักพบใน Windows และไม่พบบ่อยในระบบปฏิบัติการอื่น admin
นอกจากนี้ยังต้องอาศัยอยู่กับผู้ใช้ที่มีชื่อเฉพาะ
from glob import glob
from os.path import expanduser, join
# Return everything under the user directory that contains a folder called wlp.
glob(join(expanduser('~'), '*', 'wlp'))
มันทำงานได้อย่างสมบูรณ์ในทุกแพลตฟอร์ม
อีกตัวอย่างที่ยอดเยี่ยมที่ทำงานได้อย่างสมบูรณ์ในแพลตฟอร์มและทำบางสิ่งที่แตกต่าง:
from glob import glob
from os import getcwd
from os.path import join
# Return everything under the current directory that contains a folder called wlp.
glob(join(getcwd(), '*', 'wlp'))
หวังว่าตัวอย่างเหล่านี้จะช่วยให้คุณเห็นพลังของฟังก์ชั่นบางอย่างที่คุณสามารถหาได้ในโมดูลไลบรารี Python มาตรฐาน
**
recursive = True
ดูเอกสารได้ที่นี่: docs.python.org/3.5/library/glob.html#glob.glob
def list_files(path):
# returns a list of names (with extension, without full path) of all files
# in folder path
files = []
for name in os.listdir(path):
if os.path.isfile(os.path.join(path, name)):
files.append(name)
return files
หากคุณกำลังมองหาการใช้ Python ในการค้นหานี่เป็นสูตรที่ฉันใช้บ่อย:
from findtools.find_files import (find_files, Match)
# Recursively find all *.sh files in **/usr/bin**
sh_files_pattern = Match(filetype='f', name='*.sh')
found_files = find_files(path='/usr/bin', match=sh_files_pattern)
for found_file in found_files:
print found_file
ดังนั้นฉันจึงสร้างแพ็คเกจ PyPI ออกมาและมีที่เก็บ GitHubด้วย ฉันหวังว่าบางคนอาจพบว่ามันมีประโยชน์สำหรับรหัสนี้
เพื่อผลลัพธ์ที่ดีกว่าคุณสามารถใช้listdir()
วิธีการของos
โมดูลพร้อมกับตัวสร้าง (ตัวกำเนิดเป็นตัววนรอบที่ทรงพลังที่จะรักษาสถานะของมันจำไว้?) รหัสต่อไปนี้ใช้งานได้ดีกับทั้งสองเวอร์ชัน: Python 2 และ Python 3
นี่คือรหัส:
import os
def files(path):
for file in os.listdir(path):
if os.path.isfile(os.path.join(path, file)):
yield file
for file in files("."):
print (file)
listdir()
วิธีการส่งกลับรายการของรายการสำหรับไดเรกทอรีที่กำหนด วิธีการos.path.isfile()
ส่งกลับTrue
ถ้ารายการที่กำหนดเป็นไฟล์ และyield
โอเปอเรเตอร์จะออกจาก func แต่ยังคงสถานะปัจจุบันไว้และจะส่งคืนเฉพาะชื่อของรายการที่ตรวจพบว่าเป็นไฟล์ ด้านบนทั้งหมดช่วยให้เราสามารถวนรอบฟังก์ชั่นเครื่องกำเนิดไฟฟ้า
การส่งคืนรายการพา ธ ของไฟล์แบบสัมบูรณ์จะไม่ถูกเก็บในไดเร็กทอรีย่อย
L = [os.path.join(os.getcwd(),f) for f in os.listdir('.') if os.path.isfile(os.path.join(os.getcwd(),f))]
os.path.abspath(f)
os.path.join(os.getcwd(),f)
cwd = os.path.abspath('.')
จากนั้นใช้cwd
แทน'.'
และos.getcwd()
ตลอดเพื่อหลีกเลี่ยงการเรียกใช้ระบบซ้ำซ้อน
import os
import os.path
def get_files(target_dir):
item_list = os.listdir(target_dir)
file_list = list()
for item in item_list:
item_dir = os.path.join(target_dir,item)
if os.path.isdir(item_dir):
file_list += get_files(item_dir)
else:
file_list.append(item_dir)
return file_list
ที่นี่ฉันใช้โครงสร้างแบบเรียกซ้ำ
ครูที่ชาญฉลาดคนหนึ่งบอกฉันหนึ่งครั้งว่า:
เมื่อมีวิธีที่กำหนดไว้หลายวิธีในการทำบางสิ่งบางอย่างก็ไม่ดีสำหรับทุกกรณี
ฉันจะเพิ่มวิธีแก้ปัญหาสำหรับเซตย่อยของปัญหา: บ่อยครั้งเราเพียงต้องการตรวจสอบว่าไฟล์ตรงกับสตริงเริ่มต้นและสตริงสุดท้ายโดยไม่ต้องเข้าไปในไดเรกทอรีย่อย เราต้องการฟังก์ชั่นที่คืนค่าชื่อไฟล์เช่น:
filenames = dir_filter('foo/baz', radical='radical', extension='.txt')
หากคุณสนใจที่จะประกาศสองฟังก์ชันแรกสิ่งนี้สามารถทำได้:
def file_filter(filename, radical='', extension=''):
"Check if a filename matches a radical and extension"
if not filename:
return False
filename = filename.strip()
return(filename.startswith(radical) and filename.endswith(extension))
def dir_filter(dirname='', radical='', extension=''):
"Filter filenames in directory according to radical and extension"
if not dirname:
dirname = '.'
return [filename for filename in os.listdir(dirname)
if file_filter(filename, radical, extension)]
วิธีแก้ปัญหานี้สามารถพูดคุยกับนิพจน์ทั่วไปได้อย่างง่ายดาย (และคุณอาจต้องการเพิ่มpattern
อาร์กิวเมนต์หากคุณไม่ต้องการให้รูปแบบของคุณยึดติดกับจุดเริ่มต้นหรือจุดสิ้นสุดของชื่อไฟล์)
การใช้เครื่องกำเนิดไฟฟ้า
import os
def get_files(search_path):
for (dirpath, _, filenames) in os.walk(search_path):
for filename in filenames:
yield os.path.join(dirpath, filename)
list_files = get_files('.')
for filename in list_files:
print(filename)
อีกตัวแปรที่อ่านได้มากสำหรับ Python 3.4+ กำลังใช้ pathlib.Path.glob:
from pathlib import Path
folder = '/foo'
[f for f in Path(folder).glob('*') if f.is_file()]
มันง่ายมากที่จะเจาะจงเฉพาะเจาะจงเช่นค้นหาเฉพาะไฟล์ต้นฉบับของ Python ที่ไม่ใช่ลิงก์สัญลักษณ์รวมถึงในไดเรกทอรีย่อยทั้งหมด:
[f for f in Path(folder).glob('**/*.py') if not f.is_symlink()]
นี่คือฟังก์ชั่นวัตถุประสงค์ทั่วไปของฉันสำหรับสิ่งนี้ มันส่งคืนรายการพา ธ ของไฟล์มากกว่าชื่อไฟล์เนื่องจากฉันพบว่ามีประโยชน์มากกว่า มันมีอาร์กิวเมนต์ที่เป็นตัวเลือกไม่กี่ตัวที่ทำให้ใช้งานได้หลากหลาย ยกตัวอย่างเช่นฉันมักจะใช้กับการขัดแย้งเหมือนหรือpattern='*.txt'
subfolders=True
import os
import fnmatch
def list_paths(folder='.', pattern='*', case_sensitive=False, subfolders=False):
"""Return a list of the file paths matching the pattern in the specified
folder, optionally including files inside subfolders.
"""
match = fnmatch.fnmatchcase if case_sensitive else fnmatch.fnmatch
walked = os.walk(folder) if subfolders else [next(os.walk(folder))]
return [os.path.join(root, f)
for root, dirnames, filenames in walked
for f in filenames if match(f, pattern)]
ฉันจะให้ตัวอย่างหนึ่งซับที่แหล่งที่มาและประเภทไฟล์สามารถให้เป็นอินพุต รหัสส่งคืนรายการชื่อไฟล์ที่มีนามสกุล csv ใช้ ในกรณีที่จำเป็นต้องส่งคืนไฟล์ทั้งหมด นี่จะสแกนไดเรกทอรีย่อยซ้ำ ๆ
[y for x in os.walk(sourcePath) for y in glob(os.path.join(x[0], '*.csv'))]
แก้ไขนามสกุลไฟล์และพา ธ ต้นทางตามต้องการ
glob
glob('**/*.csv', recursive=True)
ไม่จำเป็นต้องรวมสิ่งนี้เข้ากับos.walk()
การเรียกคืน ( recursive
และ**
รองรับตั้งแต่ Python 3.5)
สำหรับ python2: pip install rglob
import rglob
file_list=rglob.rglob("/home/base/dir/", "*")
print file_list
dircacheคือ "เลิกใช้แล้วตั้งแต่เวอร์ชัน 2.6: โมดูล dircache ถูกลบใน Python 3.0 แล้ว"
import dircache
list = dircache.listdir(pathname)
i = 0
check = len(list[0])
temp = []
count = len(list)
while count != 0:
if len(list[i]) != check:
temp.append(list[i-1])
check = len(list[i])
else:
i = i + 1
count = count - 1
print temp