web-dev-qa-db-ja.com

Pythonで作成日順にディレクトリリストを取得するにはどうすればよいですか?

ディレクトリ内のすべてのファイルのリストを取得するための最良の方法は、日付[作成日|修正]、Pythonを使用して、Windowsマシンで?

102
Liza

@Greg Hewgill 's answer のより詳細なバージョンを次に示します。質問の要件に最も適合しています。作成日と変更日を区別します(少なくともWindowsでは)。

#!/usr/bin/env python
from stat import S_ISREG, ST_CTIME, ST_MODE
import os, sys, time

# path to the directory (relative or absolute)
dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

# get all entries in the directory w/ stats
entries = (os.path.join(dirpath, fn) for fn in os.listdir(dirpath))
entries = ((os.stat(path), path) for path in entries)

# leave only regular files, insert creation date
entries = ((stat[ST_CTIME], path)
           for stat, path in entries if S_ISREG(stat[ST_MODE]))
#NOTE: on Windows `ST_CTIME` is a creation date 
#  but on Unix it could be something else
#NOTE: use `ST_MTIME` to sort by a modification date

for cdate, path in sorted(entries):
    print time.ctime(cdate), os.path.basename(path)

例:

$ python stat_creation_date.py
Thu Feb 11 13:31:07 2009 stat_creation_date.py
53
jfs

過去にPythonスクリプトでこれを行って、ディレクトリ内の最後に更新されたファイルを判断しました。

import glob
import os

search_dir = "/mydir/"
# remove anything from the list that is not a file (directories, symlinks)
# thanks to J.F. Sebastion for pointing out that the requirement was a list 
# of files (presumably not including directories)  
files = filter(os.path.isfile, glob.glob(search_dir + "*"))
files.sort(key=lambda x: os.path.getmtime(x))

これは、ファイルmtimeに基づいて探していることを実行するはずです。

EDIT:必要に応じて、glob.glob()の代わりにos.listdir()を使用することもできることに注意してください-元のコードでglobを使用した理由は、globを使用したかったからです特定のファイル拡張子のセットを持つファイルのみを検索するには、glob()の方が適しています。 listdirを使用するには、次のようになります。

import os

search_dir = "/mydir/"
os.chdir(search_dir)
files = filter(os.path.isfile, os.listdir(search_dir))
files = [os.path.join(search_dir, f) for f in files] # add path to each file
files.sort(key=lambda x: os.path.getmtime(x))
121
Jay

エポックからの秒数を与えるos.path.getmtime関数があり、os.statよりも高速でなければなりません。

import os 

os.chdir(directory)
sorted(filter(os.path.isfile, os.listdir('.')), key=os.path.getmtime)
23

これが私のバージョンです。

def getfiles(dirpath):
    a = [s for s in os.listdir(dirpath)
         if os.path.isfile(os.path.join(dirpath, s))]
    a.sort(key=lambda s: os.path.getmtime(os.path.join(dirpath, s)))
    return a

まず、ファイル名のリストを作成します。 isfile()はディレクトリをスキップするために使用されます。ディレクトリを含める必要がある場合は省略できます。次に、変更日をキーとして使用して、リストをインプレースでソートします。

22
efotinis

ワンライナーは次のとおりです。

import os
import time
from pprint import pprint

pprint([(x[0], time.ctime(x[1].st_ctime)) for x in sorted([(fn, os.stat(fn)) for fn in os.listdir(".")], key = lambda x: x[1].st_ctime)])

これは、os.listdir()を呼び出してファイル名のリストを取得し、次に、ファイルごとにos.stat()を呼び出して作成時間を取得し、作成時間に基づいてソートします。

このメソッドは、各ファイルに対してos.stat()を1回だけ呼び出すことに注意してください。これは、ソートの各比較に対して呼び出すよりも効率的です。

20
Greg Hewgill

ディレクトリを変更せずに:

import os    

path = '/path/to/files/'
name_list = os.listdir(path)
full_list = [os.path.join(path,i) for i in name_list]
time_sorted_list = sorted(full_list, key=os.path.getmtime)

print time_sorted_list

# if you want just the filenames sorted, simply remove the dir from each
sorted_filename_list = [ os.path.basename(i) for i in time_sorted_list]
print sorted_filename_list
15
Nic

日付順に特定の拡張子を持つファイルを読みたい場合に、フィルターなしのglobを使用した私の答えを次に示します(Python 3)。

dataset_path='/mydir/'   
files = glob.glob(dataset_path+"/morepath/*.extension")   
files.sort(key=os.path.getmtime)
11
dinos66

python 3.5以降

from pathlib import Path
sorted(Path('.').iterdir(), key=lambda f: f.stat().st_mtime)
9
ignorant
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.stat(p).st_mtime)

os.path.isfileでフィルタリングする代わりにos.walk('.').next()[-1]を使用することもできますが、リストに無効なシンボリックリンクが残り、os.statは失敗します。

4
Alex Coventry

Alex Coventryの答えは、ファイルが存在しないファイルへのシンボリックリンクである場合に例外を生成します。次のコードはその答えを修正します。

import time
import datetime
sorted(filter(os.path.isfile, os.listdir('.')), 
    key=lambda p: os.path.exists(p) and os.stat(p).st_mtime or time.mktime(datetime.now().timetuple())

ファイルが存在しない場合、now()が使用され、シンボリックリンクはリストの最後に移動します。

1
Paolo Benvenuto

これは学ぶための基本的なステップです。

import os, stat, sys
import time

dirpath = sys.argv[1] if len(sys.argv) == 2 else r'.'

listdir = os.listdir(dirpath)

for i in listdir:
    os.chdir(dirpath)
    data_001 = os.path.realpath(i)
    listdir_stat1 = os.stat(data_001)
    listdir_stat2 = ((os.stat(data_001), data_001))
    print time.ctime(listdir_stat1.st_ctime), data_001
1
cumulus_13

以下は、拡張機能を探し、並べ替えオプションを提供する簡単な数行です。

def get_sorted_files(src_dir, regex_ext='*', sort_reverse=False): 
    files_to_evaluate = [os.path.join(src_dir, f) for f in os.listdir(src_dir) if re.search(r'.*\.({})$'.format(regex_ext), f)]
    files_to_evaluate.sort(key=os.path.getmtime, reverse=sort_reverse)
    return files_to_evaluate
0
TXN_747