web-dev-qa-db-ja.com

API機能を備えたネットワーク監視ツール

Ks-softのAdvancedHostmonitorパッケージを使用して、ネットワーク上の約2000個のアイテムを監視します。それは素晴らしいと思います。それをサポートする章は素晴らしいです。製品は高速で安定していて成熟していますが、会社として成長するにつれて、バックオフィス管理システムとの統合の分野でいくつかの摩擦点を示し始めていると感じています。

私たちがやりたいことの1つは、APIを介して使用する監視ツールに新しいテストを追加できるようにすることです。たとえば、サーバーの注文が小売店のインターフェースから来ると、サーバーは自動的にビルドされます。自動ビルドプロセスの一環として、ネットワーク監視システムに新しいテストを自動的に追加したいと考えています。

Hostmonitorは、HM Scriptと呼ばれる機能を介してこれをある程度サポートしていますが、スピードバンプが発生し始めています-

  1. 新しいオペレーター/ユーザーを追加することはできません
  2. 新しい「アクションプロファイル」を定義することはできません。これらは、テストが成功または失敗したときに実行されるアクションです。

私たちがhostmonitorで気に入っているのは、areアクションプロファイルです。たとえば、Windows IISボックスが悪くなった場合、悪いテストのアクションプロファイルは次のようになります。

  • ホストをもう一度確認してください(1回)
  • さらに30秒待ってから、もう一度テストします
  • リモートマシンでアプリプールを再起動してみてください(最大2回)
  • 再起動の失敗についてopsにメールを送信する
  • リモートマシンでIIS)を再起動してみてください(最大4回)
  • ページデューティ管理者(最大5回-デューティ管理者ACKSアラート後に停止)
  • ページバックアップ義務管理者(5回-義務管理者ACKSアラート後に停止)

私は他のネットワーク監視ツールを見回し始めており、探しています:

  1. テストの追加/削除/制御/「アクションプロファイル」/オペレーターのテストを可能にする包括的なAPI(プラグインだけでなく、制御および管理インターフェイスが必要です)
  2. 非常に詳細なアクション/エスカレーションプロファイルを持つ機能(およびAPIを介してこれらを定義する機能)

NagiosとIcingaを見てきましたが、これらの機能を使用できるかどうか、または可能であれば、実装/カスタマイズにどれだけの作業が必要になるかについて、ドキュメントから収集できないようです。

誰かがアドバイス、ガイダンス、または経験を提供できますか?

4
Kev

Icingaは非常にうまく機能します(データを取得するために使用できる単一のAPIがあり、Nagiosプラグインと100%互換性があるため、Nagiosよりも好みます)。

Nagios VS Icingaについてのビデオがあり、それをかなりよく説明しています: Youtube (Icingaによるので、注意してアプローチしてください)

Icingaを使用して、誰かに電子メールを送信/ SMSを送信したり、スクリプトを実行したりすることもできます(したがって、サービスを再起動し、再起動します...)例: Link (nagios-linkですが、同じ取引)。
私がよくわからないのは、コマンドを時系列で実行することだけです。

構成を簡単にするために、 NConf を使用します。ホスト、サービスなどのAPIを提供します(ユーザー管理用ではありません)。

1
Bart De Vos

環境によっては、プローブを使用せずにトラフィックを分析するだけのソリューションを検討し、500レベルのエラーやトラフィックが長期間急落した場合などに基づいてアラートを設定することをお勧めします。たとえば、ExtraHopが提供するものを見てください: http://www.extrahop.com/

2
Don Hennessy

OpsviewにはAPIがあります: http://docs.opsview.com/doku.php?id=opsview3.0:api

1
sendmoreinfo

外部モニタリングをお探しの場合は、WatchMouseをご覧ください。彼らのAPIはあなたが言及する機能を提供します(私があなたが正しいと理解している場合): apidoc.watchmouse.com

乾杯マーク

1
pors