รายการต้นไม้ไดเรกทอรีใน Python


คำตอบ:


615

นี่เป็นวิธีการสำรวจทุก ๆ ไฟล์และไดเรกทอรีในแผนผังไดเรกทอรี:

import os

for dirname, dirnames, filenames in os.walk('.'):
    # print path to all subdirectories first.
    for subdirname in dirnames:
        print(os.path.join(dirname, subdirname))

    # print path to all filenames.
    for filename in filenames:
        print(os.path.join(dirname, filename))

    # Advanced usage:
    # editing the 'dirnames' list will stop os.walk() from recursing into there.
    if '.git' in dirnames:
        # don't go into any .git directories.
        dirnames.remove('.git')

19
และถ้าคุณเรียกใช้รหัสนี้ (เหมือนเดิม) จาก Python Shell ให้จำว่า Ctrl + C จะหยุดการส่งออกไปยังเชลล์ที่กล่าวไว้ ;)
แกรี่

41
ซึ่งจะแสดงรายการไฟล์และไดเรกทอรีซ้ำ ๆ
rds

คุณสามารถแก้ไขรายการ dirnames เพื่อป้องกันไม่ให้เรียกซ้ำเส้นทางบางเส้นทาง
bugloaf

8
@ Clément "เมื่อ topdown เป็น True ผู้เรียกสามารถแก้ไขรายการ dirnames แบบแทนที่ (อาจใช้การกำหนด del หรือ slice) และ walk () จะย่อเข้าในไดเรกทอรีย่อยที่มีชื่ออยู่ใน dirnames ซึ่งสามารถใช้เพื่อตัด ค้นหากำหนดลำดับเฉพาะของการเยี่ยมชมหรือแม้แต่แจ้งการเดิน () เกี่ยวกับไดเรกทอรีที่ผู้โทรสร้างหรือเปลี่ยนชื่อก่อนที่จะดำเนินการต่อการเดิน () อีกครั้ง " จากdocs.python.org/2/library/os.html#os.walk
bugloaf

วิธีที่ง่ายกว่าในการเพิกเฉยบางไดเรกทอรีคือการไม่เพิ่มลงใน dirnames ในตอนแรกfor subdirname in dirnames: if subdirname != '.git'
smci

537

คุณสามารถใช้ได้

os.listdir(path)

สำหรับการอ้างอิงและฟังก์ชั่นระบบปฏิบัติการอื่น ๆ ดูที่นี่:


1
คำถามเดิมนั้นคลุมเครือพอที่จะไม่รู้ว่าพวกเขาต้องการโซลูชันแบบเรียกซ้ำหรือไม่ "ไฟล์ทั้งหมดในไดเรกทอรี" สามารถตีความได้ว่าเป็นแบบเรียกซ้ำ
Tommy

3
@ ทอมมี่ "ไดเรกทอรี" เป็นโครงสร้างข้อมูลที่กำหนดไว้อย่างชัดเจนและมันหมายถึง "ls" มากกว่า "ls -R" นอกจากนี้เครื่องมือ UNIX เกือบทั้งหมดจะไม่ทำงานซ้ำโดยปริยาย ฉันไม่รู้ว่าผู้ถามหมายความว่าอย่างไรแต่สิ่งที่เขาเขียนนั้นชัดเจน
Torsten Bronger

python 3 docs บอกให้คุณใช้งานos.scandirแทนอย่างไรก็ตามเนื่องจากในหลาย ๆ กรณีจะช่วยให้คุณสามารถป้องกันการโทรของระบบทำให้เพิ่มความเร็วได้ฟรี (ทั้ง IPC และ IO ช้า)
Jappie Kerk

5
listdir ให้ชื่อไฟล์เดียวในไดเรกทอรีมีวิธีการในการรับเส้นทางแบบเต็มหรือไม่?
greperror

1
@greperror คุณสามารถใช้os.path.abspathเพื่อรับเส้นทางแบบเต็ม นอกจากนี้ยังมีการตรวจสอบว่าเป็นเส้นทางที่ได้รับเป็นไฟล์ที่ใช้os.path.isfileos.path.isdirหรือ
Aleksandar

111

นี่คือฟังก์ชั่นตัวช่วยที่ฉันใช้บ่อย:

import os

def listdir_fullpath(d):
    return [os.path.join(d, f) for f in os.listdir(d)]

3
เครื่องกำเนิดไฟฟ้าจะดีกว่า
Robert Siemer

1
@RobertSiemer ที่ขึ้นอยู่กับการใช้งาน ในหลายกรณีรายการจะดีกว่า แต่ฉันคิดว่าตัวสร้างมีความหลากหลายมากกว่าเนื่องจากสามารถแปลงเป็นรายการได้ ขึ้นอยู่กับว่าคุณกำลังมองหาความคล่องตัวหรือบางสิ่งบางอย่างคล่องตัวขึ้นเล็กน้อย
James Mchugh

3
เป็นเวลาสิบปีแล้ว แต่ฉันคิดว่าฉันทำอย่างนี้เพราะ os.listdir () ส่งคืนรายการและฉันเลียนแบบมัน
giltay

82
import os

for filename in os.listdir("C:\\temp"):
    print  filename

16
r'C:\temp'มีความชัดเจนและเป็นที่ต้องการสำหรับ"C:\\temp"Rawstrings ดีกว่าในการหลบหลีกแบ็กสแลช
smci

13

หากคุณต้องการความสามารถในการเสริมกำลังมีโมดูลสำหรับสิ่งนั้นเช่นกัน ตัวอย่างเช่น:

import glob
glob.glob('./[0-9].*')

จะคืนบางสิ่งเช่น:

['./1.gif', './2.txt']

โปรดดูเอกสารที่นี่


10

ลองสิ่งนี้:

import os
for top, dirs, files in os.walk('./'):
    for nm in files:       
        print os.path.join(top, nm)

ในหนึ่งบรรทัด: [top + os.sep + f สำหรับ top, dirs, ไฟล์ใน os.walk ('./') สำหรับ f ใน files]
J. Peterson

9

สำหรับไฟล์ในไดเรกทอรีการทำงานปัจจุบันโดยไม่ระบุพา ธ

Python 2.7:

import os
os.listdir(os.getcwd())

Python 3.x:

import os
os.listdir()

ขอบคุณ Stam Kaly สำหรับความคิดเห็นใน python 3.x


5
os.listdir()รายการองค์ประกอบในไดเรกทอรีปัจจุบันโดยค่าเริ่มต้น! ไม่จำเป็นต้องos.getcwd():)
Stam Kaly

ฉันจะทำสิ่งนี้ได้อย่างไร เมื่อฉันใช้ >>> os.listdir () โดยไม่มีข้อโต้แย้งฉันจะได้รับ: TypeError: listdir () รับ 1 อาร์กิวเมนต์อย่างแน่นอน (0 ได้รับ)
Dave Engineer

2
ฉันคิดว่าคุณกำลังทำงานใน 2.7 สิ่งนี้ถูกเพิ่มเข้ามาใน 3.x
Stam Kaly


3

ฉันเขียนเวอร์ชันยาวโดยมีตัวเลือกทั้งหมดที่ฉันต้องการ: http://sam.nipl.net/code/python/find.py

ฉันเดาว่ามันจะพอดีกับที่นี่ด้วย:

#!/usr/bin/env python

import os
import sys

def ls(dir, hidden=False, relative=True):
    nodes = []
    for nm in os.listdir(dir):
        if not hidden and nm.startswith('.'):
            continue
        if not relative:
            nm = os.path.join(dir, nm)
        nodes.append(nm)
    nodes.sort()
    return nodes

def find(root, files=True, dirs=False, hidden=False, relative=True, topdown=True):
    root = os.path.join(root, '')  # add slash if not there
    for parent, ldirs, lfiles in os.walk(root, topdown=topdown):
        if relative:
            parent = parent[len(root):]
        if dirs and parent:
            yield os.path.join(parent, '')
        if not hidden:
            lfiles   = [nm for nm in lfiles if not nm.startswith('.')]
            ldirs[:] = [nm for nm in ldirs  if not nm.startswith('.')]  # in place
        if files:
            lfiles.sort()
            for nm in lfiles:
                nm = os.path.join(parent, nm)
                yield nm

def test(root):
    print "* directory listing, with hidden files:"
    print ls(root, hidden=True)
    print
    print "* recursive listing, with dirs, but no hidden files:"
    for f in find(root, dirs=True):
        print f
    print

if __name__ == "__main__":
    test(*sys.argv[1:])

3

นี่คือตัวเลือกอื่น

os.scandir(path='.')

มันจะส่งคืนตัววนซ้ำของวัตถุ os.DirEntry ที่สอดคล้องกับรายการ (พร้อมกับข้อมูลแอตทริบิวต์ของไฟล์) ในไดเรกทอรีที่กำหนดโดยเส้นทาง

ตัวอย่าง:

with os.scandir(path) as it:
    for entry in it:
        if not entry.name.startswith('.'):
            print(entry.name)

การใช้ scandir () แทนที่จะเป็น listdir () สามารถเพิ่มประสิทธิภาพของรหัสได้อย่างมากซึ่งต้องการประเภทของไฟล์หรือข้อมูลแอตทริบิวต์ของไฟล์มากเนื่องจากวัตถุ os.DirEntry จะเปิดเผยข้อมูลนี้หากระบบปฏิบัติการจัดเตรียมไว้เมื่อสแกนไดเรกทอรี เมธอด os.DirEntry ทั้งหมดอาจทำการเรียกระบบ แต่ is_dir () และ is_file () มักจะต้องการการเรียกใช้ระบบสำหรับลิงก์สัญลักษณ์เท่านั้น os.DirEntry.stat () ต้องมีการเรียกระบบบนยูนิกซ์เสมอ แต่ต้องการเพียงหนึ่งสำหรับลิงก์สัญลักษณ์บน Windows

Python Docs


3

ในขณะที่os.listdir()ใช้ได้สำหรับการสร้างรายชื่อไฟล์และชื่อ dir บ่อยครั้งที่คุณต้องการทำมากขึ้นเมื่อคุณมีชื่อเหล่านั้น - และใน Python3, pathlibทำให้เหลือเกินอื่น ๆ ที่ง่าย ลองมาดูกันว่าคุณชอบมันมากที่สุด

หากต้องการแสดงเนื้อหา dir ให้สร้างออบเจกต์ Path และคว้าตัววนซ้ำ:

In [16]: Path('/etc').iterdir()
Out[16]: <generator object Path.iterdir at 0x110853fc0>

หากเราต้องการเพียงรายชื่อสิ่งต่าง ๆ :

In [17]: [x.name for x in Path('/etc').iterdir()]
Out[17]:
['emond.d',
 'ntp-restrict.conf',
 'periodic',

ถ้าคุณต้องการแค่ dirs:

In [18]: [x.name for x in Path('/etc').iterdir() if x.is_dir()]
Out[18]:
['emond.d',
 'periodic',
 'mach_init.d',

หากคุณต้องการชื่อของไฟล์ conf ทั้งหมดในทรีนั้น:

In [20]: [x.name for x in Path('/etc').glob('**/*.conf')]
Out[20]:
['ntp-restrict.conf',
 'dnsextd.conf',
 'syslog.conf',

หากคุณต้องการรายการไฟล์ conf ในแผนผัง> = 1K:

In [23]: [x.name for x in Path('/etc').glob('**/*.conf') if x.stat().st_size > 1024]
Out[23]:
['dnsextd.conf',
 'pf.conf',
 'autofs.conf',

การแก้ไขเส้นทางสัมพัทธ์กลายเป็นเรื่องง่าย:

In [32]: Path('../Operational Metrics.md').resolve()
Out[32]: PosixPath('/Users/starver/code/xxxx/Operational Metrics.md')

การนำทางด้วยเส้นทางค่อนข้างชัดเจน (แม้ว่าจะไม่คาดคิด):

In [10]: p = Path('.')

In [11]: core = p / 'web' / 'core'

In [13]: [x for x in core.iterdir() if x.is_file()]
Out[13]:
[PosixPath('web/core/metrics.py'),
 PosixPath('web/core/services.py'),
 PosixPath('web/core/querysets.py'),

1

ซับในที่ดีเพื่อแสดงเฉพาะไฟล์ที่วนซ้ำ ฉันใช้สิ่งนี้ในคำสั่ง setup.py package_data ของฉัน:

import os

[os.path.join(x[0],y) for x in os.walk('<some_directory>') for y in x[2]]

ฉันรู้ว่ามันไม่ใช่คำตอบสำหรับคำถาม แต่อาจมีประโยชน์


1

สำหรับ Python 2

#!/bin/python2

import os

def scan_dir(path):
    print map(os.path.abspath, os.listdir(pwd))

สำหรับ Python 3

สำหรับตัวกรองและแผนที่คุณจำเป็นต้องล้อมด้วยรายการ ()

#!/bin/python3

import os

def scan_dir(path):
    print(list(map(os.path.abspath, os.listdir(pwd))))

คำแนะนำตอนนี้คือคุณแทนที่การใช้แผนที่และตัวกรองด้วยนิพจน์กำเนิดหรือความเข้าใจในรายการ:

#!/bin/python

import os

def scan_dir(path):
    print([os.path.abspath(f) for f in os.listdir(path)])

1

นี่คือเวอร์ชั่น Pythonic หนึ่งบรรทัด:

import os
dir = 'given_directory_name'
filenames = [os.path.join(os.path.dirname(os.path.abspath(__file__)),dir,i) for i in os.listdir(dir)]

รหัสนี้แสดงเส้นทางแบบเต็มของไฟล์และไดเรกทอรีทั้งหมดในชื่อไดเรกทอรีที่กำหนด


ขอบคุณ Saleh แต่รหัสของคุณใช้งานไม่ได้และมีการแก้ไขดังนี้: 'dir =' given_directory_name 'ชื่อไฟล์ = [os.path.abspath (os.path.join (dir, i)) สำหรับฉันใน os.listdir (dir)] '
HassanSh__3571619

1

ฉันรู้ว่านี่เป็นคำถามเก่า นี่เป็นวิธีที่เรียบร้อยฉันเจอถ้าคุณอยู่ในเครื่อง liunx

import subprocess
print(subprocess.check_output(["ls", "/"]).decode("utf8"))

0
#import modules
import os

_CURRENT_DIR = '.'


def rec_tree_traverse(curr_dir, indent):
    "recurcive function to traverse the directory"
    #print "[traverse_tree]"

    try :
        dfList = [os.path.join(curr_dir, f_or_d) for f_or_d in os.listdir(curr_dir)]
    except:
        print "wrong path name/directory name"
        return

    for file_or_dir in dfList:

        if os.path.isdir(file_or_dir):
            #print "dir  : ",
            print indent, file_or_dir,"\\"
            rec_tree_traverse(file_or_dir, indent*2)

        if os.path.isfile(file_or_dir):
            #print "file : ",
            print indent, file_or_dir

    #end if for loop
#end of traverse_tree()

def main():

    base_dir = _CURRENT_DIR

    rec_tree_traverse(base_dir," ")

    raw_input("enter any key to exit....")
#end of main()


if __name__ == '__main__':
    main()

5
คำถามนี้มีคำตอบที่ดีอย่างสมบูรณ์แบบไม่จำเป็นต้องตอบอีกครั้ง
Mike Pennington

0

FYI เพิ่มตัวกรองการขยายหรือขยายการนำเข้าไฟล์ระบบปฏิบัติการ

path = '.'
for dirname, dirnames, filenames in os.walk(path):
    # print path to all filenames with extension py.
    for filename in filenames:
        fname_path = os.path.join(dirname, filename)
        fext = os.path.splitext(fname_path)[1]
        if fext == '.py':
            print fname_path
        else:
            continue

0

หากคิดว่าฉันจะโยนสิ่งนี้มาวิธีที่ง่ายและสกปรกในการค้นหาไวด์การ์ด

import re
import os

[a for a in os.listdir(".") if re.search("^.*\.py$",a)]

0

รหัสด้านล่างจะแสดงรายการไดเรกทอรีและไฟล์ภายใน dir

def print_directory_contents(sPath):
        import os                                       
        for sChild in os.listdir(sPath):                
            sChildPath = os.path.join(sPath,sChild)
            if os.path.isdir(sChildPath):
                print_directory_contents(sChildPath)
            else:
                print(sChildPath)

0

คนที่ทำงานกับฉันเป็นรุ่นดัดแปลงจากคำตอบของ Saleh ด้านบน

รหัสดังต่อไปนี้:

"dir = 'given_directory_name' filenames = [os.path.abspath (os.path.join (dir, i)) สำหรับ i ใน os.listdir (dir)]"

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.