คุณจะจัดเรียงรายการไดเร็กทอรีตามวันที่สร้างใน python ได้อย่างไร?


129

วิธีใดเป็นวิธีที่ดีที่สุดในการรับรายชื่อไฟล์ทั้งหมดในไดเร็กทอรีโดยเรียงตามวันที่ [สร้าง | แก้ไข] โดยใช้ python บนเครื่อง windows?

คำตอบ:


79

อัปเดต : เพื่อจัดเรียงdirpathรายการตามวันที่แก้ไขใน Python 3:

import os
from pathlib import Path

paths = sorted(Path(dirpath).iterdir(), key=os.path.getmtime)

(ใส่คำตอบของ @ Pygirlที่นี่เพื่อการมองเห็นที่ดีขึ้น)

หากคุณมีรายชื่อไฟล์อยู่filesแล้วให้จัดเรียงตามเวลาสร้างบน Windows:

files.sort(key=os.path.getctime)

รายชื่อของไฟล์ที่คุณสามารถได้รับตัวอย่างเช่นการใช้globตามที่แสดงใน@ คำตอบของเจย์


คำตอบเก่า นี่เป็นมากขึ้น verbose รุ่นของคำตอบ@Greg Hewgill 's เป็นไปตามข้อกำหนดของคำถามมากที่สุด สร้างความแตกต่างระหว่างวันที่สร้างและวันที่แก้ไข (อย่างน้อยใน Windows)

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

ตัวอย่าง:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py

1
สิ่งนี้ทำงานได้อย่างสมบูรณ์แบบ ฉันพยายามเปรียบเทียบสองไดเรกทอรี cdate ซึ่งกันและกัน มีวิธีเปรียบเทียบวินาทีระหว่างซีดีทั้งสองหรือไม่?
Federer

@malcmcmul: cdateเป็นจำนวนวินาทีตั้งแต่ Epoch
jfs

4
วิธีนี้ใช้ได้ผล แต่วิธีแก้ปัญหาที่รวบรัดที่สุดอยู่ที่stackoverflow.com/a/4500607/68534
jmoz

@jmoz: คุณหมายถึงเช่นนี้ วิธีแก้ปัญหาที่คุณลิงก์ผิด: ไม่ได้กรองไฟล์ปกติ หมายเหตุ: โซลูชันของฉันโทรstatหนึ่งครั้งต่อ dir.entry
jfs

ยกโทษให้ฉันลิงค์ที่ซาบาสเตียนให้มานั้นกระชับยิ่งกว่า! ขอบคุณ.
jmoz

148

ฉันเคยทำสิ่งนี้มาแล้วสำหรับสคริปต์ Python เพื่อกำหนดไฟล์ที่อัพเดตล่าสุดในไดเร็กทอรี:

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = list(filter(os.path.isfile, glob.glob(search_dir + "*")))
files.sort(key=lambda x: os.path.getmtime(x))

นั่นควรทำในสิ่งที่คุณกำลังมองหาตาม mtime ของไฟล์

แก้ไข : โปรดทราบว่าคุณยังสามารถใช้ os.listdir () แทน glob.glob () ได้หากต้องการเหตุผลที่ฉันใช้ glob ในโค้ดดั้งเดิมของฉันคือฉันต้องการใช้ glob เพื่อค้นหาเฉพาะไฟล์ที่มีชุดเฉพาะเท่านั้น ของนามสกุลไฟล์ซึ่ง glob () เหมาะสมกว่า หากต้องการใช้ listdir ต่อไปนี้จะมีลักษณะดังนี้:

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))

glob () เป็นสิ่งที่ดี แต่โปรดทราบว่ามันจะข้ามไฟล์ที่เริ่มต้นด้วยจุด * ระบบ nix จะถือว่าไฟล์ดังกล่าวถูกซ่อนไว้ (จึงไม่รวมไฟล์เหล่านี้จากรายการ) แต่ใน Windows จะเป็นไฟล์ปกติ
efotinis

โซลูชันเหล่านี้ไม่รวม dirs จากรายการ
คอนสแตนติน

โซลูชัน os.listdir ของคุณไม่มี os.path.join: files.sort (lambda x, y: cmp (os.path.getmtime (os.path.join (search_dir, x)), os.path.getmtime (os .path.join (search_dir, y)))
Peter Hoffmann

files.sort(key=lambda fn: os.path.getmtime(os.path.join(search_dir, fn)))
jfs

22
เพียงfiles.sort(key=os.path.getmtime)ควรจะทำงาน (ไม่มีlambda)
jfs

31

มีความเป็นฟังก์ชั่นที่ช่วยให้จำนวนวินาทีตั้งแต่ยุคและควรจะเร็วกว่าos.path.getmtimeos.stat

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)

23

นี่คือเวอร์ชันของฉัน:

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

ขั้นแรกเราสร้างรายการชื่อไฟล์ isfile () ใช้เพื่อข้ามไดเร็กทอรี สามารถละเว้นได้หากควรรวมไดเรกทอรี จากนั้นเราจัดเรียงรายการในสถานที่โดยใช้วันที่แก้ไขเป็นกุญแจสำคัญ


จัดเรียงตามเก่าที่สุดก่อนไปหาใหม่ที่สุด เมื่อฉันต้องการไฟล์ใหม่ล่าสุด 5 ไฟล์ฉันต้องทำสิ่งต่อไปนี้a[-5:]
Daniel Butler

20

นี่คือซับเดียว:

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

สิ่งนี้เรียก os.listdir () เพื่อรับรายชื่อไฟล์จากนั้นเรียก os.stat () สำหรับแต่ละชื่อเพื่อรับเวลาในการสร้างจากนั้นเรียงตามเวลาที่สร้าง

โปรดทราบว่าวิธีนี้จะเรียก os.stat () เพียงครั้งเดียวสำหรับแต่ละไฟล์ซึ่งจะมีประสิทธิภาพมากกว่าการเรียกใช้สำหรับการเปรียบเทียบแต่ละครั้งในการจัดเรียง


นั่นแทบจะไม่ pythonic แม้ว่ามันจะช่วยแก้งานได้ (ข้อจำกัดความรับผิดชอบ: ไม่ได้ทดสอบโค้ด)
Adriano Varoli Piazza

โซลูชันนี้ไม่รวม dirs จากรายการ
Constantin

@ คอนสแตนติน: นั่นเป็นเรื่องจริง แต่ [... ถ้า stat.S_ISREG (x)] จะจัดการอย่างรวดเร็ว
Greg Hewgill

16

โดยไม่ต้องเปลี่ยนไดเรกทอรี:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list


11

นี่คือคำตอบของฉันโดยใช้ glob ที่ไม่มีตัวกรองหากคุณต้องการอ่านไฟล์ที่มีนามสกุลที่แน่นอนตามลำดับวันที่ (Python 3)

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)

5
# *** the shortest and best way ***
# getmtime --> sort by modified time
# getctime --> sort by created time

import glob,os

lst_files = glob.glob("*.txt")
lst_files.sort(key=os.path.getmtime)
print("\n".join(lst_files))

โปรดระบุบริบท
Claire

"ดีที่สุด" เป็นเรื่องส่วนตัว คำตอบของคุณจะดีกว่าถ้าคุณอธิบายว่าทำไมคุณถึงคิดว่าเป็นวิธีที่ดีที่สุด
Bryan Oakley

ถ้าคุณต้องการ "ดีที่สุด" คุณจะไม่ใช้ glob อย่างแน่นอนเพราะมันช้ามาก
user136036

4
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

คุณสามารถใช้os.walk('.').next()[-1]แทนการกรองได้os.path.isfileแต่จะทิ้งลิงก์สัญลักษณ์ที่ตายแล้วไว้ในรายการและos.statจะล้มเหลว


4
from pathlib import Path
import os

sorted(Path('./').iterdir(), key=lambda t: t.stat().st_mtime)

หรือ

sorted(Path('./').iterdir(), key=os.path.getmtime)

หรือ

sorted(os.scandir('./'), key=lambda t: t.stat().st_mtime)

โดยที่เวลา m คือเวลาแก้ไข


1

นี่เป็นขั้นตอนพื้นฐานสำหรับการเรียนรู้:

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001

1

คำตอบของ Alex Coventry จะทำให้เกิดข้อยกเว้นหากไฟล์นั้นเป็น symlink ไปยังไฟล์ที่ไม่มีอยู่จริงรหัสต่อไปนี้จะแก้ไขคำตอบนั้น:

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

เมื่อไม่มีไฟล์ now () จะถูกใช้และ symlink จะอยู่ท้ายสุดของรายการ


0

นี่คือบรรทัดสองสามบรรทัดง่ายๆที่มองหาส่วนขยายและมีตัวเลือกการจัดเรียง

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate

0

เพื่อความสมบูรณ์ด้วยos.scandir(เร็วขึ้น 2 เท่าpathlib):

import os
sorted(os.scandir('/tmp/test'), key=lambda d: d.stat().st_mtime)

0

นี่คือเวอร์ชันของฉัน:

import os

folder_path = r'D:\Movies\extra\new\dramas' # your path
os.chdir(folder_path) # make the path active
x = sorted(os.listdir(), key=os.path.getctime)  # sorted using creation time

folder = 0

for folder in range(len(x)):
    print(x[folder]) # print all the foldername inside the folder_path
    folder = +1

ในรหัสของฉันไฟล์จะเรียงลำดับจากเก่าที่สุดไปหาใหม่ที่สุด ในการรับชื่อไฟล์หรือโฟลเดอร์ใหม่ล่าสุดก่อนอื่นคุณต้องเพิ่ม reverse = True ในรายการไฟล์ (ในกรณีของฉันคือ x) ดังนั้น x = เรียงลำดับ (os.listdir (), key = os.path.getctime, reverse = True)
haqrafiul

-6

บางทีคุณควรใช้คำสั่งเชลล์ ใน Unix / Linux ให้ค้นหา piped ที่มีการเรียงลำดับอาจสามารถทำสิ่งที่คุณต้องการได้

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.