web-dev-qa-db-ja.com

Pythonを使用してファイルのディレクトリ全体を既存のディレクトリにコピーするにはどうすればよいですか?

barという名前のディレクトリ(1つ以上のファイルを含む)およびbazという名前のディレクトリ(1つ以上のファイルを含む)を含むディレクトリから次のコードを実行します。 fooという名前のディレクトリがないことを確認してください。

import shutil
shutil.copytree('bar', 'foo')
shutil.copytree('baz', 'foo')

以下で失敗します:

$ python copytree_test.py 
Traceback (most recent call last):
  File "copytree_test.py", line 5, in <module>
    shutil.copytree('baz', 'foo')
  File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/shutil.py", line 110, in copytree
  File "/System/Library/Frameworks/Python.framework/Versions/2.5/lib/python2.5/os.py", line 172, in makedirs
OSError: [Errno 17] File exists: 'foo'

入力した場合と同じように動作させたい:

$ mkdir foo
$ cp bar/* foo/
$ cp baz/* foo/

bazの各ファイルをfooにコピーするには、shutil.copy()を使用する必要がありますか? (shutil.copytree()で 'bar'の内容を 'foo'に既にコピーした後)またはより簡単/より良い方法はありますか?

158
Daryl Spitzer

標準のshutil.copytreeのこの制限は、arbitrary意的で迷惑なようです。回避策:

def copytree(src, dst, symlinks=False, ignore=None):
    for item in os.listdir(src):
        s = os.path.join(src, item)
        d = os.path.join(dst, item)
        if os.path.isdir(s):
            shutil.copytree(s, d, symlinks, ignore)
        else:
            shutil.copy2(s, d)

標準のコピーツリーと完全に一貫しているわけではないことに注意してください。

  • symlinksツリーのルートディレクトリのignoreおよびsrcパラメーターを尊重しません。
  • srcのルートレベルでエラーが発生してもshutil.Errorは発生しません。
  • サブツリーのコピー中にエラーが発生した場合、他のサブツリーをコピーして単一の結合shutil.Errorを生成する代わりに、そのサブツリーに対してshutil.Errorを生成します。
143
atzz

これが標準ライブラリの一部であるソリューションです。

from distutils.dir_util import copy_tree
copy_tree("/a/b/c", "/x/y/z")

同様の質問をご覧ください。

pythonを使用してディレクトリの内容をディレクトリにコピーします

159
Brendan Abel

上記の関数が常にソースから宛先にファイルをコピーしようとする関数に対するatzzの答えをわずかに改善しました。

def copytree(src, dst, symlinks=False, ignore=None):
    if not os.path.exists(dst):
        os.makedirs(dst)
    for item in os.listdir(src):
        s = os.path.join(src, item)
        d = os.path.join(dst, item)
        if os.path.isdir(s):
            copytree(s, d, symlinks, ignore)
        else:
            if not os.path.exists(d) or os.stat(s).st_mtime - os.stat(d).st_mtime > 1:
                shutil.copy2(s, d)

上記の実装では

  • まだ存在しない場合の出力ディレクトリの作成
  • 独自のメソッドを再帰的に呼び出してコピーディレクトリを作成します。
  • 実際にファイルをコピーするようになったら、ファイルが変更されているかどうかを確認し、コピーする必要があります。

上記の関数とsconsビルドを使用しています。コンパイルするたびに、ファイルのセット全体をコピーする必要はないかもしれませんが、変更されたファイルのみをコピーする必要があるため、非常に役立ちました。

51
Mital Vora

AtzzとMital Voraに触発されたマージ:

#!/usr/bin/python
import os
import shutil
import stat
def copytree(src, dst, symlinks = False, ignore = None):
  if not os.path.exists(dst):
    os.makedirs(dst)
    shutil.copystat(src, dst)
  lst = os.listdir(src)
  if ignore:
    excl = ignore(src, lst)
    lst = [x for x in lst if x not in excl]
  for item in lst:
    s = os.path.join(src, item)
    d = os.path.join(dst, item)
    if symlinks and os.path.islink(s):
      if os.path.lexists(d):
        os.remove(d)
      os.symlink(os.readlink(s), d)
      try:
        st = os.lstat(s)
        mode = stat.S_IMODE(st.st_mode)
        os.lchmod(d, mode)
      except:
        pass # lchmod not available
    Elif os.path.isdir(s):
      copytree(s, d, symlinks, ignore)
    else:
      shutil.copy2(s, d)
  • shutil.copytreeと同じ動作、symlinksおよびignore パラメーター
  • 存在しない場合、ディレクトリの宛先構造を作成する
  • dstがすでに存在する場合は失敗しません
30

ドキュメントは、宛先ディレクトリがnot存在する必要があることを明示的に述べています

dstで指定された宛先ディレクトリは、すでに存在していてはなりません。不足している親ディレクトリと同様に作成されます。

あなたの最善の策は、2番目のすべての結果のディレクトリであるos.walkcopy2 ディレクトリとファイル、およびディレクトリの追加のcopystatを行うことだと思います。結局、それはまさにcopytreeがドキュメントで説明されているように行うことです。または、copyおよびcopystat各ディレクトリ/ファイルおよびos.listdirの代わりにos.walkを使用できます。

7
SilentGhost

shutilを変更して効果を得ることができます(私のバージョンのshutilでは、これは315行にあります)

変化する

os.makedirs(dst)

os.makedirs(dst,exist_ok=True)
2
user2728397

私はpythonシステムコマンドを呼び出すことが最も速く簡単な方法だと思います...

例..

import os
cmd = '<command line call>'
os.system(cmd)

ディレクトリをtarおよびgzipします。..目的の場所でディレクトリをunzipおよびuntarします。

そう?

1
Kirby

これは、atzzが提供する元のベストアンサーからインスピレーションを得たもので、ファイル/フォルダーロジックの置換ロジックを追加しました。したがって、実際にはマージされませんが、既存のファイル/フォルダーを削除し、新しいファイル/フォルダーをコピーします。

import shutil
import os
def copytree(src, dst, symlinks=False, ignore=None):
    for item in os.listdir(src):
        s = os.path.join(src, item)
        d = os.path.join(dst, item)
        if os.path.exists(d):
            try:
                shutil.rmtree(d)
            except Exception as e:
                print e
                os.unlink(d)
        if os.path.isdir(s):
            shutil.copytree(s, d, symlinks, ignore)
        else:
            shutil.copy2(s, d)
    #shutil.rmtree(src)

Rmtreeのコメントを解除して、移動関数にします。

1
radtek

これが私の問題です。元の機能を維持するためにcopytreeのソースコードを変更しましたが、ディレクトリが既に存在する場合、エラーは発生しません。また、既存のファイルを上書きしないように変更しましたが、アプリケーションにとって重要であるため、変更された名前を持つ両方のコピーを保持します。

import shutil
import os


def _copytree(src, dst, symlinks=False, ignore=None):
    """
    This is an improved version of shutil.copytree which allows writing to
    existing folders and does not overwrite existing files but instead appends
    a ~1 to the file name and adds it to the destination path.
    """

    names = os.listdir(src)
    if ignore is not None:
        ignored_names = ignore(src, names)
    else:
        ignored_names = set()

    if not os.path.exists(dst):
        os.makedirs(dst)
        shutil.copystat(src, dst)
    errors = []
    for name in names:
        if name in ignored_names:
            continue
        srcname = os.path.join(src, name)
        dstname = os.path.join(dst, name)
        i = 1
        while os.path.exists(dstname) and not os.path.isdir(dstname):
            parts = name.split('.')
            file_name = ''
            file_extension = parts[-1]
            # make a new file name inserting ~1 between name and extension
            for j in range(len(parts)-1):
                file_name += parts[j]
                if j < len(parts)-2:
                    file_name += '.'
            suffix = file_name + '~' + str(i) + '.' + file_extension
            dstname = os.path.join(dst, suffix)
            i+=1
        try:
            if symlinks and os.path.islink(srcname):
                linkto = os.readlink(srcname)
                os.symlink(linkto, dstname)
            Elif os.path.isdir(srcname):
                _copytree(srcname, dstname, symlinks, ignore)
            else:
                shutil.copy2(srcname, dstname)
        except (IOError, os.error) as why:
            errors.append((srcname, dstname, str(why)))
        # catch the Error from the recursive copytree so that we can
        # continue with other files
        except BaseException as err:
            errors.extend(err.args[0])
    try:
        shutil.copystat(src, dst)
    except WindowsError:
        # can't copy file access times on Windows
        pass
    except OSError as why:
        errors.extend((src, dst, str(why)))
    if errors:
        raise BaseException(errors)
0
James

distutils.file_util.copy_fileをより厳密に模倣したこのスレッドに触発されたバージョンを次に示します。

updateonlyはTrueの場合ブール値であり、dstにリストされていない限り、forceupdateにある既存のファイルよりも変更日が新しいファイルのみをコピーします。

ignoreおよびforceupdateは、ファイル名またはフォルダー/ファイル名のリストを期待します相対srcおよびglobまたはfnmatch

この関数は、コピーされたファイルのリストを返します(Trueの場合、dryrunの場合はコピーされます)。

import os
import shutil
import fnmatch
import stat
import itertools

def copyToDir(src, dst, updateonly=True, symlinks=True, ignore=None, forceupdate=None, dryrun=False):

    def copySymLink(srclink, destlink):
        if os.path.lexists(destlink):
            os.remove(destlink)
        os.symlink(os.readlink(srclink), destlink)
        try:
            st = os.lstat(srclink)
            mode = stat.S_IMODE(st.st_mode)
            os.lchmod(destlink, mode)
        except OSError:
            pass  # lchmod not available
    fc = []
    if not os.path.exists(dst) and not dryrun:
        os.makedirs(dst)
        shutil.copystat(src, dst)
    if ignore is not None:
        ignorepatterns = [os.path.join(src, *x.split('/')) for x in ignore]
    else:
        ignorepatterns = []
    if forceupdate is not None:
        forceupdatepatterns = [os.path.join(src, *x.split('/')) for x in forceupdate]
    else:
        forceupdatepatterns = []
    srclen = len(src)
    for root, dirs, files in os.walk(src):
        fullsrcfiles = [os.path.join(root, x) for x in files]
        t = root[srclen+1:]
        dstroot = os.path.join(dst, t)
        fulldstfiles = [os.path.join(dstroot, x) for x in files]
        excludefiles = list(itertools.chain.from_iterable([fnmatch.filter(fullsrcfiles, pattern) for pattern in ignorepatterns]))
        forceupdatefiles = list(itertools.chain.from_iterable([fnmatch.filter(fullsrcfiles, pattern) for pattern in forceupdatepatterns]))
        for directory in dirs:
            fullsrcdir = os.path.join(src, directory)
            fulldstdir = os.path.join(dstroot, directory)
            if os.path.islink(fullsrcdir):
                if symlinks and dryrun is False:
                    copySymLink(fullsrcdir, fulldstdir)
            else:
                if not os.path.exists(directory) and dryrun is False:
                    os.makedirs(os.path.join(dst, dir))
                    shutil.copystat(src, dst)
        for s,d in Zip(fullsrcfiles, fulldstfiles):
            if s not in excludefiles:
                if updateonly:
                    go = False
                    if os.path.isfile(d):
                        srcdate = os.stat(s).st_mtime
                        dstdate = os.stat(d).st_mtime
                        if srcdate > dstdate:
                            go = True
                    else:
                        go = True
                    if s in forceupdatefiles:
                        go = True
                    if go is True:
                        fc.append(d)
                        if not dryrun:
                            if os.path.islink(s) and symlinks is True:
                                copySymLink(s, d)
                            else:
                                shutil.copy2(s, d)
                else:
                    fc.append(d)
                    if not dryrun:
                        if os.path.islink(s) and symlinks is True:
                            copySymLink(s, d)
                        else:
                            shutil.copy2(s, d)
    return fc
0
KenV99

同じタスクの私のバージョンは次のとおりです。

import os, glob, shutil

def make_dir(path):
    if not os.path.isdir(path):
        os.mkdir(path)


def copy_dir(source_item, destination_item):
    if os.path.isdir(source_item):
        make_dir(destination_item)
        sub_items = glob.glob(source_item + '/*')
        for sub_item in sub_items:
            copy_dir(sub_item, destination_item + '/' + sub_item.split('/')[-1])
    else:
        shutil.copy(source_item, destination_item)
0
Barmaley

以前のソリューションには、srcが通知や例外なしでdstを上書きするという問題があります。

predict_errorメソッドを追加して、copy .copytreeの前にエラーを予測します。主にCyrille Pontvieuxのバージョンに基づいています。

最初にpredict_errorを使用してすべてのエラーを予測するのが最適です。ただし、すべてのエラーを修正するまでcopytreeを実行するときに例外が次々に発生するのを確認したい場合を除きます。

def predict_error(src, dst):  
    if os.path.exists(dst):
        src_isdir = os.path.isdir(src)
        dst_isdir = os.path.isdir(dst)
        if src_isdir and dst_isdir:
            pass
        Elif src_isdir and not dst_isdir:
            yield {dst:'src is dir but dst is file.'}
        Elif not src_isdir and dst_isdir:
            yield {dst:'src is file but dst is dir.'}
        else:
            yield {dst:'already exists a file with same name in dst'}

    if os.path.isdir(src):
        for item in os.listdir(src):
            s = os.path.join(src, item)
            d = os.path.join(dst, item)
            for e in predict_error(s, d):
                yield e


def copytree(src, dst, symlinks=False, ignore=None, overwrite=False):
    '''
    would overwrite if src and dst are both file
    but would not use folder overwrite file, or viceverse
    '''
    if not overwrite:
        errors = list(predict_error(src, dst))
        if errors:
            raise Exception('copy would overwrite some file, error detail:%s' % errors)

    if not os.path.exists(dst):
        os.makedirs(dst)
        shutil.copystat(src, dst)
    lst = os.listdir(src)
    if ignore:
        excl = ignore(src, lst)
        lst = [x for x in lst if x not in excl]
    for item in lst:
        s = os.path.join(src, item)
        d = os.path.join(dst, item)
        if symlinks and os.path.islink(s):
            if os.path.lexists(d):
                os.remove(d)
            os.symlink(os.readlink(s), d)
            try:
                st = os.lstat(s)
                mode = stat.S_IMODE(st.st_mode)
                os.lchmod(d, mode)
            except:
                pass  # lchmod not available
        Elif os.path.isdir(s):
            copytree(s, d, symlinks, ignore)
        else:
            if not overwrite:
                if os.path.exists(d):
                    continue
            shutil.copy2(s, d)
0
Mithril

これを試して:

import os,shutil

def copydir(src, dst):
  h = os.getcwd()
  src = r"{}".format(src)
  if not os.path.isdir(dst):
     print("\n[!] No Such directory: ["+dst+"] !!!")
     exit(1)

  if not os.path.isdir(src):
     print("\n[!] No Such directory: ["+src+"] !!!")
     exit(1)
  if "\\" in src:
     c = "\\"
     tsrc = src.split("\\")[-1:][0]
  else:
    c = "/"
    tsrc = src.split("/")[-1:][0]

  os.chdir(dst)
  if os.path.isdir(tsrc):
    print("\n[!] The Directory Is already exists !!!")
    exit(1)
  try:
    os.mkdir(tsrc)
  except WindowsError:
    print("\n[!] Error: In[ {} ]\nPlease Check Your Dirctory Path !!!".format(src))
    exit(1)
  os.chdir(h)
  files = []
  for i in os.listdir(src):
    files.append(src+c+i)
  if len(files) > 0:
    for i in files:
        if not os.path.isdir(i):
            shutil.copy2(i, dst+c+tsrc)

  print("\n[*] Done ! :)")

copydir("c:\folder1", "c:\folder2")
0
J0KER11