web-dev-qa-db-ja.com

GangliaのRRDモジュールはボトルネックですか?

多くのマシンで多くのメトリックを監視したいのですが、GraphiteのWebサイトから、ガングリアのRRDコンポーネントが次のFAQ最初にささやきが発明された理由を説明する)からスケーラビリティの問題を課していることに気付きました。問題が解決されていない場合(私はganglia2のwebappが好きです)、gweb2を使用してささやきデータを読み取る方法があるかどうか疑問に思います。

「ウィスパーが作成された2つ目の理由は、パフォーマンスです。RRDtoolは非常に高速で、実際にはウィスパーよりもはるかに高速です。しかし、RRD(ウィスパーが作成された時点)の問題は、RRDでは単一の値しか挿入できないことでした。一度にデータベースを作成し、ウィスパーは複数のデータポイントを一度に挿入できるように記述されていましたが、それらを1回の書き込み操作に圧縮しました。これにより高負荷でパフォーマンスが大幅に向上する理由は、Graphiteが多数のファイルで動作するためです。実行中の操作(ここに数バイト、あそこに数バイトを書き込むなど)ボトルネックは、I/O操作の数によって引き起こされます。Graphiteが毎分100,000の異なるメトリック値を受信するシナリオを考えてみます。 、その負荷を維持するために、Graphiteは毎分その数のデータポイントをディスクに書き込むことができなければなりません。ただし、基盤となるストレージが1分あたり20,000のI/O操作しか処理できないと仮定します。RRDを使用(ウィスパーが書き込まれた時点) )、nがありましたo追いつくチャンス。しかし、ウィスパーを使用すると、特定のメトリックに対してたとえば10分に相当するデータが蓄積されるまで、受信データをキャッシュし続けることができます。その後、10回のI/O操作を実行してそれらの10個のデータポイントを書き込む代わりに、ウィスパーは1回の操作でそれを実行できます。 「ささやきが書かれたとき」と言い続けたのは、RRDがこの動作をサポートするようになったからです。ただし、最初の問題がまだ存在する限り、Graphiteはウィスパーを使用し続けます。」

1
chen

ささやきFAQが解決されたと述べている問題は、「RRDCacheD」と呼ばれます。そうです、 http://sourceforge.net/)に従って、これを使用するように神経節を構成できます。 apps/trac/ganglia/wiki/rrdcached_integration 、これにより、ガングリアのI/Oパフォーマンスが大幅に向上するはずです。

2
janneb