web-dev-qa-db-ja.com

特定のパスにあるすべてのファイルとディレクトリを高速に取得します

C#がディレクトリをスキャンするバックアップアプリケーションを作成しています。使用する前に、ディレクトリ内のすべてのファイルとサブファイルを取得するために次のようなものを使用します。

DirectoryInfo di = new DirectoryInfo("A:\\");
var directories= di.GetFiles("*", SearchOption.AllDirectories);

foreach (FileInfo d in directories)
{
       //Add files to a list so that later they can be compared to see if each file
       // needs to be copid or not
}

それに関する唯一の問題は、ファイルにアクセスできないことがあり、いくつかのエラーが発生することです。私が得るエラーの例は次のとおりです。error

その結果、現在のディレクトリ内のすべてのファイルをスキャンする再帰的なメソッドを作成しました。そのディレクトリにディレクトリがある場合、そのディレクトリを渡してメソッドが再度呼び出されます。この方法の良い点は、エラーがなければリストにそれらのファイルを追加し、エラーがあった場合に別のリストにディレクトリを追加するオプションを与えるtry catchブロック内にファイルを配置できることです。

try
{
    files = di.GetFiles(searchPattern, SearchOption.TopDirectoryOnly);               
}
catch
{
     //info of this folder was not able to get
     lstFilesErrors.Add(sDir(di));
     return;
}

したがって、この方法がうまく機能する唯一の問題は、大きなディレクトリをスキャンするときに時間がかかることです。このプロセスをどのようにスピードアップできますか?私の実際の方法は、必要な場合に備えてこれです。

private void startScan(DirectoryInfo di)
{
    //lstFilesErrors is a list of MyFile objects
    // I created that class because I wanted to store more specific information
    // about a file such as its comparePath name and other properties that I need 
    // in order to compare it with another list

    // lstFiles is a list of MyFile objects that store all the files
    // that are contained in path that I want to scan

    FileInfo[] files = null;
    DirectoryInfo[] directories = null;
    string searchPattern = "*.*";

    try
    {
        files = di.GetFiles(searchPattern, SearchOption.TopDirectoryOnly);               
    }
    catch
    {
        //info of this folder was not able to get
        lstFilesErrors.Add(sDir(di));
        return;
    }

    // if there are files in the directory then add those files to the list
    if (files != null)
    {
        foreach (FileInfo f in files)
        {
            lstFiles.Add(sFile(f));
        }
    }


    try
    {
        directories = di.GetDirectories(searchPattern, SearchOption.TopDirectoryOnly);
    }
    catch
    {
        lstFilesErrors.Add(sDir(di));
        return;
    }

    // if that directory has more directories then add them to the list then 
    // execute this function
    if (directories != null)
        foreach (DirectoryInfo d in directories)
        {
            FileInfo[] subFiles = null;
            DirectoryInfo[] subDir = null;

            bool isThereAnError = false;

            try
            {
                subFiles = d.GetFiles();
                subDir = d.GetDirectories();

            }
            catch
            {
                isThereAnError = true;                                                
            }

            if (isThereAnError)
                lstFilesErrors.Add(sDir(d));
            else
            {
                lstFiles.Add(sDir(d));
                startScan(d);
            }


        }

}

次のようなもので例外を処理しようとすると、問題はアリになります:

DirectoryInfo di = new DirectoryInfo("A:\\");
FileInfo[] directories = null;
            try
            {
                directories = di.GetFiles("*", SearchOption.AllDirectories);

            }
            catch (UnauthorizedAccessException e)
            {
                Console.WriteLine("There was an error with UnauthorizedAccessException");
            }
            catch
            {
                Console.WriteLine("There was antother error");
            }

例外が発生した場合、ファイルを取得できません。

67
Tono Nam

この方法ははるかに高速です。ディレクトリに多数のファイルを配置する場合にのみ、telを使用できます。私のA:\外付けハードドライブにはほぼ1テラビットが含まれているため、多くのファイルを処理するときに大きな違いが生じます。

static void Main(string[] args)
{
    DirectoryInfo di = new DirectoryInfo("A:\\");
    FullDirList(di, "*");
    Console.WriteLine("Done");
    Console.Read();
}

static List<FileInfo> files = new List<FileInfo>();  // List that will hold the files and subfiles in path
static List<DirectoryInfo> folders = new List<DirectoryInfo>(); // List that hold direcotries that cannot be accessed
static void FullDirList(DirectoryInfo dir, string searchPattern)
{
    // Console.WriteLine("Directory {0}", dir.FullName);
    // list the files
    try
    {
        foreach (FileInfo f in dir.GetFiles(searchPattern))
        {
            //Console.WriteLine("File {0}", f.FullName);
            files.Add(f);                    
        }
    }
    catch
    {
        Console.WriteLine("Directory {0}  \n could not be accessed!!!!", dir.FullName);                
        return;  // We alredy got an error trying to access dir so dont try to access it again
    }

    // process each directory
    // If I have been able to see the files in the directory I should also be able 
    // to look at its directories so I dont think I should place this in a try catch block
    foreach (DirectoryInfo d in dir.GetDirectories())
    {
        folders.Add(d);
        FullDirList(d, searchPattern);                    
    }

}

ところで、あなたのコメントJim Mischelに感謝します

44
Tono Nam

.NET 4.0には、IEnumerable<string>を返す Directory.EnumerateFiles メソッドがあり、メモリ内のすべてのファイルをロードしていません。ファイルが返され、 例外が処理される可能性がある が返されるのは、返されたコレクションの反復処理を開始したときだけです。

17
Darin Dimitrov

.NETファイル列挙方法が遅いという長い歴史があります。問題は、大きなディレクトリ構造を瞬時に列挙する方法がないことです。ここで受け入れられている答えでさえ、GCの割り当てに問題があります。

私ができることは、ライブラリにまとめて、 FindFilesource )) CSharpTest.Net.IO 名前空間のクラス。このクラスは、不要なGC割り当ておよび文字列マーシャリングなしでファイルとフォルダーを列挙できます。

使い方は非常に簡単で、RaiseOnAccessDeniedプロパティは、ユーザーがアクセスできないディレクトリとファイルをスキップします。

    private static long SizeOf(string directory)
    {
        var fcounter = new CSharpTest.Net.IO.FindFile(directory, "*", true, true, true);
        fcounter.RaiseOnAccessDenied = false;

        long size = 0, total = 0;
        fcounter.FileFound +=
            (o, e) =>
            {
                if (!e.IsDirectory)
                {
                    Interlocked.Increment(ref total);
                    size += e.Length;
                }
            };

        Stopwatch sw = Stopwatch.StartNew();
        fcounter.Find();
        Console.WriteLine("Enumerated {0:n0} files totaling {1:n0} bytes in {2:n3} seconds.",
                          total, size, sw.Elapsed.TotalSeconds);
        return size;
    }

ローカルC:\ドライブの場合、これは次を出力します。

列挙された810,046ファイルは、合計で232.876秒で​​307,707,792,662バイトです。

走行距離はドライブの速度によって異なる場合がありますが、これはマネージコードでファイルを列挙する最速の方法です。イベントパラメーターは、タイプ FindFile.FileFoundEventArgs の変更クラスです。そのため、発生するイベントごとに値が変わるため、参照を保持しないでください。 。

12
csharptest.net

たぶんそれはあなたに役立つでしょう。必要に応じて、「 DirectoryInfo.EnumerateFiles 」メソッドとハンドルUnauthorizedAccessExceptionを使用できます。

using System;
using System.IO;

class Program
{
    static void Main(string[] args)
    {
        DirectoryInfo diTop = new DirectoryInfo(@"d:\");
        try
        {
            foreach (var fi in diTop.EnumerateFiles())
            {
                try
                {
                    // Display each file over 10 MB; 
                    if (fi.Length > 10000000)
                    {
                        Console.WriteLine("{0}\t\t{1}", fi.FullName, fi.Length.ToString("N0"));
                    }
                }
                catch (UnauthorizedAccessException UnAuthTop)
                {
                    Console.WriteLine("{0}", UnAuthTop.Message);
                }
            }

            foreach (var di in diTop.EnumerateDirectories("*"))
            {
                try
                {
                    foreach (var fi in di.EnumerateFiles("*", SearchOption.AllDirectories))
                    {
                        try
                        {
                            // Display each file over 10 MB; 
                            if (fi.Length > 10000000)
                            {
                                Console.WriteLine("{0}\t\t{1}",  fi.FullName, fi.Length.ToString("N0"));
                            }
                        }
                        catch (UnauthorizedAccessException UnAuthFile)
                        {
                            Console.WriteLine("UnAuthFile: {0}", UnAuthFile.Message);
                        }
                    }
                }
                catch (UnauthorizedAccessException UnAuthSubDir)
                {
                    Console.WriteLine("UnAuthSubDir: {0}", UnAuthSubDir.Message);
                }
            }
        }
        catch (DirectoryNotFoundException DirNotFound)
        {
            Console.WriteLine("{0}", DirNotFound.Message);
        }
        catch (UnauthorizedAccessException UnAuthDir)
        {
            Console.WriteLine("UnAuthDir: {0}", UnAuthDir.Message);
        }
        catch (PathTooLongException LongPath)
        {
            Console.WriteLine("{0}", LongPath.Message);
        }
    }
}
2
Yuriy A.

私はこれが古いことを知っていますが、...別のオプションは、FileSystemWatcherを次のように使用することです。

void SomeMethod()
{
    System.IO.FileSystemWatcher m_Watcher = new System.IO.FileSystemWatcher();
    m_Watcher.Path = path;
    m_Watcher.Filter = "*.*";
    m_Watcher.NotifyFilter = m_Watcher.NotifyFilter = NotifyFilters.LastAccess | NotifyFilters.LastWrite | NotifyFilters.FileName | NotifyFilters.DirectoryName;
    m_Watcher.Created += new FileSystemEventHandler(OnChanged);
    m_Watcher.EnableRaisingEvents = true;
}

private void OnChanged(object sender, FileSystemEventArgs e)
    {
        string path = e.FullPath;

        lock (listLock)
        {
            pathsToUpload.Add(path);
        }
    }

これにより、非常に軽量なプロセスでファイルの変更をディレクトリで監視し、変更したファイルの名前を保存して、適切なタイミングでバックアップできるようにすることができます。

2
TChadwick

(他の質問の私の他の回答からこの作品をコピーしました)

ディレクトリ内のすべてのファイルを検索するときに進行状況を表示する

高速ファイル列挙

もちろん、既にご存知のように、列挙自体を行う方法はたくさんありますが、瞬時に行われるものはありません。ファイルシステムの USN Journal を使用してスキャンを実行できます。 CodePlexでこのプロジェクトを見てください: VB.NETのMFTスキャナー ... IDE SATA(not SSD)ドライブ内のすべてのファイルを以下で見つけました15秒未満で、311000個のファイルが見つかりました。

探しているパス内のファイルのみが返されるように、パスでファイルをフィルターする必要があります。しかし、それは仕事の簡単な部分です!

2
Miguel Angelo

これを使用して、すべてのディレクトリとサブディレクトリを取得できます。次に、単にループスルーしてファイルを処理します。

string[] folders = System.IO.Directory.GetDirectories(@"C:\My Sample Path\","*", System.IO.SearchOption.AllDirectories);

foreach(string f in folders)
{
   //call some function to get all files in folder
}
2
Zombie