web-dev-qa-db-ja.com

ファイルの変更を監視する方法

変更を監視したい別のプロセスによってログファイルが書き込まれています。変更が発生するたびに、新しいデータを読み込んで処理します。

これを行うための最良の方法は何ですか?私はPyWin32ライブラリから何らかのフックがあることを望んでいました。私はwin32file.FindNextChangeNotification関数を見つけましたが、特定のファイルを見るようにそれに依頼する方法を知りません。

誰かがこのようなことをしたなら、私はその方法を聞いて本当に感謝するでしょう….

[Edit]私は投票を必要としない解決策の後だったと述べたべきです。

[編集]呪い!これはマップされたネットワークドライブではうまくいかないようです。私は、Windowsがローカルディスク上で行うような方法ではファイルへの更新を「聞こえない」と思います。

292
Jon Cage

あなたはすでに http://timgolden.me.uk/python/win32_how_do_i/watch_directory_for_changes.html で利用可能なドキュメントを見ましたか? Windowsで動作させるためだけに必要な場合、2番目の例はまさにあなたが望むもののようです(ディレクトリのパスを見たいファイルのものと交換する場合)。

そうでなければ、ポーリングはおそらくプラットフォームに依存しない唯一の選択肢となるでしょう。

注:これらの解決策は試していません。

71
Horst Gutmann

Watchdog を使ってみましたか?

ファイルシステムイベントを監視するためのPython APIライブラリとシェルユーティリティ。

ディレクトリ監視が簡単に

  • クロスプラットフォームAPI.
  • ディレクトリの変更に応じてコマンドを実行するためのシェルツール。

Quickstart ...の簡単な例ですぐに始めましょう.

260
simao

あなたにとってポーリングが十分であるならば、私はただ「修正された時間」ファイル統計が変わるかどうかを見るだけです。読むには

os.stat(filename).st_mtime

(また、Windowsのネイティブ変更イベントソリューションは、ネットワークドライブなど、すべての状況で機能するわけではありません。)

import os

class Monkey(object):
    def __init__(self):
        self._cached_stamp = 0
        self.filename = '/path/to/file'

    def ook(self):
        stamp = os.stat(self.filename).st_mtime
        if stamp != self._cached_stamp:
            self._cached_stamp = stamp
            # File has changed, so do something...
83
Deestan

マルチプラットフォームソリューションが必要な場合は、 QFileSystemWatcher を確認してください。ここにコード例(サニタイズされていません):

from PyQt4 import QtCore

@QtCore.pyqtSlot(str)
def directory_changed(path):
    print('Directory Changed!!!')

@QtCore.pyqtSlot(str)
def file_changed(path):
    print('File Changed!!!')

fs_watcher = QtCore.QFileSystemWatcher(['/path/to/files_1', '/path/to/files_2', '/path/to/files_3'])

fs_watcher.connect(fs_watcher, QtCore.SIGNAL('directoryChanged(QString)'), directory_changed)
fs_watcher.connect(fs_watcher, QtCore.SIGNAL('fileChanged(QString)'), file_changed)
49
hipersayan_x

これはWindows上では動作しないはずです(cygwinを使っているのでしょうか?)が、unixユーザの場合は "fcntl"システムコールを使うべきです。これがPythonの例です。 Cで書く必要がある場合はほとんど同じコードです(同じ関数名)

import time
import fcntl
import os
import signal

FNAME = "/HOME/TOTO/FILETOWATCH"

def handler(signum, frame):
    print "File %s modified" % (FNAME,)

signal.signal(signal.SIGIO, handler)
fd = os.open(FNAME,  os.O_RDONLY)
fcntl.fcntl(fd, fcntl.F_SETSIG, 0)
fcntl.fcntl(fd, fcntl.F_NOTIFY,
            fcntl.DN_MODIFY | fcntl.DN_CREATE | fcntl.DN_MULTISHOT)

while True:
    time.sleep(10000)
26
Maxime

pyinotify をチェックしてください。

inotifyは、より新しいLinuxで(以前の答えからの)dnotifyを置き換え、ディレクトリレベルではなくファイルレベルの監視を可能にします。

21
Michael Palmer

Tim Goldenの脚本を少しハッキングした後、次のようなものがうまくいったようです。

import os

import win32file
import win32con

path_to_watch = "." # look at the current directory
file_to_watch = "test.txt" # look for changes to a file called test.txt

def ProcessNewData( newData ):
    print "Text added: %s"%newData

# Set up the bits we'll need for output
ACTIONS = {
  1 : "Created",
  2 : "Deleted",
  3 : "Updated",
  4 : "Renamed from something",
  5 : "Renamed to something"
}
FILE_LIST_DIRECTORY = 0x0001
hDir = win32file.CreateFile (
  path_to_watch,
  FILE_LIST_DIRECTORY,
  win32con.FILE_SHARE_READ | win32con.FILE_SHARE_WRITE,
  None,
  win32con.OPEN_EXISTING,
  win32con.FILE_FLAG_BACKUP_SEMANTICS,
  None
)

# Open the file we're interested in
a = open(file_to_watch, "r")

# Throw away any exising log data
a.read()

# Wait for new data and call ProcessNewData for each new chunk that's written
while 1:
  # Wait for a change to occur
  results = win32file.ReadDirectoryChangesW (
    hDir,
    1024,
    False,
    win32con.FILE_NOTIFY_CHANGE_LAST_WRITE,
    None,
    None
  )

  # For each change, check to see if it's updating the file we're interested in
  for action, file in results:
    full_filename = os.path.join (path_to_watch, file)
    #print file, ACTIONS.get (action, "Unknown")
    if file == file_to_watch:
        newText = a.read()
        if newText != "":
            ProcessNewData( newText )

それはおそらくより多くのエラーチェックをすることで可能になるかもしれません、しかしそれはスクリーンにそれを吐き出す前に単にログファイルを見てそれに対して何らかの処理をするために、これはうまく機能します。

皆さんのご意見ありがとうございました。

13
Jon Cage

私にとって最も簡単な解決策は、watchdogのツールwatchmedoを使うことです。

https://pypi.python.org/pypi/watchdog ディレクトリ内のSQLファイルを検索し、必要に応じてそれらを実行するプロセスがあります。

watchmedo Shell-command \
--patterns="*.sql" \
--recursive \
--command='~/Desktop/load_files_into_mysql_database.sh' \
.
7
redestructa

Pythonを使用しているので、ファイルを開いてそこから行を読み続けることができます。

f = open('file.log')

読み込んだ行が空ではないの場合は、それを処理します。

line = f.readline()
if line:
    // Do what you want with the line

EOFでreadlineを呼び出し続けても大丈夫であることを見逃しているかもしれません。この場合、空の文字列を返すだけです。ログファイルに何かが追加されても、必要に応じて読み取りは停止した場所から続行されます。

イベントを使用するソリューション、または特定のライブラリを探している場合は、質問にこれを指定してください。そうでなければ、私はこの解決策はちょうどいいと思います。

6
seuvitor

これはKenderのコードを簡略化したもので、同じ方法でファイル全体をインポートすることはできません。

# Check file for new data.

import time

f = open(r'c:\temp\test.txt', 'r')

while True:

    line = f.readline()
    if not line:
        time.sleep(1)
        print 'Nothing New'
    else:
        print 'Call Function: ', line
6
AlaXul

私の答え から 類似の質問 を確認してください。 Pythonでも同じループを試すことができます。 このページ は示唆している:

import time

while 1:
    where = file.tell()
    line = file.readline()
    if not line:
        time.sleep(1)
        file.seek(where)
    else:
        print line, # already has newline

tail()Pythonファイル という質問も参照してください。

6
Bruno De Fraine

ポーリングと最小限の依存関係で単一のファイルを見るために、これは Deestan (上記)からの答えに基づく、完全に肉付けされた例です:

import os
import sys 
import time

class Watcher(object):
    running = True
    refresh_delay_secs = 1

    # Constructor
    def __init__(self, watch_file, call_func_on_change=None, *args, **kwargs):
        self._cached_stamp = 0
        self.filename = watch_file
        self.call_func_on_change = call_func_on_change
        self.args = args
        self.kwargs = kwargs

    # Look for changes
    def look(self):
        stamp = os.stat(self.filename).st_mtime
        if stamp != self._cached_stamp:
            self._cached_stamp = stamp
            # File has changed, so do something...
            print('File changed')
            if self.call_func_on_change is not None:
                self.call_func_on_change(*self.args, **self.kwargs)

    # Keep watching in a loop        
    def watch(self):
        while self.running: 
            try: 
                # Look for changes
                time.sleep(self.refresh_delay_secs) 
                self.look() 
            except KeyboardInterrupt: 
                print('\nDone') 
                break 
            except FileNotFoundError:
                # Action on file not found
                pass
            except: 
                print('Unhandled error: %s' % sys.exc_info()[0])

# Call this function each time a change happens
def custom_action(text):
    print(text)

watch_file = 'my_file.txt'

# watcher = Watcher(watch_file)  # simple
watcher = Watcher(watch_file, custom_action, text='yes, changed')  # also call custom action function
watcher.watch()  # start the watch going
5
4Oh4

これは、Linuxで動作し、辞書(file => time)を使用してファイルを変更するための簡単なウォッチャーを追加するTim Goldanのスクリプトのもう1つの変更です。

使用法:whateverName.py path_to_dir_to_watch

#!/usr/bin/env python

import os, sys, time

def files_to_timestamp(path):
    files = [os.path.join(path, f) for f in os.listdir(path)]
    return dict ([(f, os.path.getmtime(f)) for f in files])

if __== "__main__":

    path_to_watch = sys.argv[1]
    print "Watching ", path_to_watch

    before = files_to_timestamp(path_to_watch)

    while 1:
        time.sleep (2)
        after = files_to_timestamp(path_to_watch)

        added = [f for f in after.keys() if not f in before.keys()]
        removed = [f for f in before.keys() if not f in after.keys()]
        modified = []

        for f in before.keys():
            if not f in removed:
                if os.path.getmtime(f) != before.get(f):
                    modified.append(f)

        if added: print "Added: ", ", ".join(added)
        if removed: print "Removed: ", ", ".join(removed)
        if modified: print "Modified ", ", ".join(modified)

        before = after
4
ronedg

Horst Gutmann で示される Tim Goldenの記事 でわかるように、WIN32は比較的複雑でディレクトリを監視しますが、単一のファイルではありません。

IronPython 、つまり.NETのpython実装を調べてください。 IronPythonでは、すべての.NET機能を使用できます。

System.IO.FileSystemWatcher

これは単純なEventインタフェースで単一のファイルを処理します。

3
gimel

これはファイルの変更をチェックする例です。それをする最善の方法ではないかもしれませんが、それは確かに短い方法です。

ソースに変更が加えられたときにアプリケーションを再起動するための便利なツール。 pygameで遊んでいるときにこれを作ったので、ファイルを保存した直後に効果が現れるのを見ることができます。

Pygameで使用するときは、 'while'ループ内のものがあなたのゲームループ(別名updateなど)に配置されていることを確認してください。そうでなければ、あなたのアプリケーションは無限ループに陥り、あなたはあなたのゲームが更新されるのを見ることはないでしょう。

file_size_stored = os.stat('neuron.py').st_size

  while True:
    try:
      file_size_current = os.stat('neuron.py').st_size
      if file_size_stored != file_size_current:
        restart_program()
    except: 
      pass

あなたが私がウェブで見つけたリスタートコードが欲しいならば。ここにあります。 (それは便利になるかもしれないが、質問には関係ありません)

def restart_program(): #restart application
    python = sys.executable
    os.execl(python, python, * sys.argv)

電子にあなたが彼らにしてもらいたいことをさせることを楽しんでください。

1
Bassim Huis

これは、1秒間に1行を超えないが、通常ははるかに少ない入力ファイルを監視するための例です。目標は、指定された出力ファイルに最後の行(最新の書き込み)を追加することです。私は自分のプロジェクトの1つからこれをコピーし、無関係な行をすべて削除しました。不足している記号を入力するか変更する必要があります。

from PyQt5.QtCore import QFileSystemWatcher, QSettings, QThread
from ui_main_window import Ui_MainWindow   # Qt Creator gen'd 

class MainWindow(QMainWindow, Ui_MainWindow):
    def __init__(self, parent=None):
        QMainWindow.__init__(self, parent)
        Ui_MainWindow.__init__(self)
        self._fileWatcher = QFileSystemWatcher()
        self._fileWatcher.fileChanged.connect(self.fileChanged)

    def fileChanged(self, filepath):
        QThread.msleep(300)    # Reqd on some machines, give chance for write to complete
        # ^^ About to test this, may need more sophisticated solution
        with open(filepath) as file:
            lastLine = list(file)[-1]
        destPath = self._filemap[filepath]['dest file']
        with open(destPath, 'a') as out_file:               # a= append
            out_file.writelines([lastLine])

もちろん、包括的なQMainWindowクラスは厳密には必要ではありません。 QFileSystemWatcherを単独で使用することができます。

1
user1277936
ACTIONS = {
  1 : "Created",
  2 : "Deleted",
  3 : "Updated",
  4 : "Renamed from something",
  5 : "Renamed to something"
}
FILE_LIST_DIRECTORY = 0x0001

class myThread (threading.Thread):
    def __init__(self, threadID, fileName, directory, Origin):
        threading.Thread.__init__(self)
        self.threadID = threadID
        self.fileName = fileName
        self.daemon = True
        self.dir = directory
        self.originalFile = Origin
    def run(self):
        startMonitor(self.fileName, self.dir, self.originalFile)

def startMonitor(fileMonitoring,dirPath,originalFile):
    hDir = win32file.CreateFile (
        dirPath,
        FILE_LIST_DIRECTORY,
        win32con.FILE_SHARE_READ | win32con.FILE_SHARE_WRITE,
        None,
        win32con.OPEN_EXISTING,
        win32con.FILE_FLAG_BACKUP_SEMANTICS,
        None
    )
    # Wait for new data and call ProcessNewData for each new chunk that's
    # written
    while 1:
        # Wait for a change to occur
        results = win32file.ReadDirectoryChangesW (
            hDir,
            1024,
            False,
            win32con.FILE_NOTIFY_CHANGE_LAST_WRITE,
            None,
            None
        )
        # For each change, check to see if it's updating the file we're
        # interested in
        for action, file_M in results:
            full_filename = os.path.join (dirPath, file_M)
            #print file, ACTIONS.get (action, "Unknown")
            if len(full_filename) == len(fileMonitoring) and action == 3:
                #copy to main file
                ...
1
imp

誰も投稿していないようです fswatch 。これはクロスプラットフォームのファイルシステムウォッチャーです。インストールして実行し、プロンプトに従ってください。

私はpythonとgolangプログラムでそれを使った、そしてそれはただうまくいく。

0
Gus

repyt という単純なライブラリを使用することもできます。これは例です。

repyt ./app.py
0
Rafal Enden

最も簡単で簡単な解決策はpygtailを使うことです: https://pypi.python.org/pypi/pygtail

from pygtail import Pygtail

while True:
    for line in Pygtail("some.log"):
        sys.stdout.write(line)
0
george

関連する@ 4Oh4ソリューションは、監視するファイルのリストをスムーズに変更します。

import os
import sys
import time

class Watcher(object):
    running = True
    refresh_delay_secs = 1

    # Constructor
    def __init__(self, watch_files, call_func_on_change=None, *args, **kwargs):
        self._cached_stamp = 0
        self._cached_stamp_files = {}
        self.filenames = watch_files
        self.call_func_on_change = call_func_on_change
        self.args = args
        self.kwargs = kwargs

    # Look for changes
    def look(self):
        for file in self.filenames:
            stamp = os.stat(file).st_mtime
            if not file in self._cached_stamp_files:
                self._cached_stamp_files[file] = 0
            if stamp != self._cached_stamp_files[file]:
                self._cached_stamp_files[file] = stamp
                # File has changed, so do something...
                file_to_read = open(file, 'r')
                value = file_to_read.read()
                print("value from file", value)
                file_to_read.seek(0)
                if self.call_func_on_change is not None:
                    self.call_func_on_change(*self.args, **self.kwargs)

    # Keep watching in a loop
    def watch(self):
        while self.running:
            try:
                # Look for changes
                time.sleep(self.refresh_delay_secs)
                self.look()
            except KeyboardInterrupt:
                print('\nDone')
                break
            except FileNotFoundError:
                # Action on file not found
                pass
            except Exception as e:
                print(e)
                print('Unhandled error: %s' % sys.exc_info()[0])

# Call this function each time a change happens
def custom_action(text):
    print(text)
    # pass

watch_files = ['/Users/mexekanez/my_file.txt', '/Users/mexekanez/my_file1.txt']

# watcher = Watcher(watch_file)  # simple



if __== "__main__":
    watcher = Watcher(watch_files, custom_action, text='yes, changed')  # also call custom action function
    watcher.watch()  # start the watch going
0
mexekanez