web-dev-qa-db-ja.com

成長するWebサイトに推奨されるGlusterFS構成は何ですか?

私は1日平均5000万ヒットを追跡しているウェブサイトを持っており、今後3か月以内に1日1億ヒットを超えるはずです。 GlusterFS v 3.0.0を使用しようとしています(2010年1月17日現在の最新のパッチを使用)

現在、Webページトラフィックを提供するために、6つのXen-Server 5.5u1 VM(各ホストに2つ)を備えた3つの物理ホストを持つロードバランサー環境にアップグレードしました。各マシンには、6つのRAID-6ローカルストレージドライブ(7200RPM-SATA)があります。私たちが使用した古いマシンには、ミラーリングされたSAS 10kドライブが1台ありました。

また、現在、各ホストに1つずつ、合計3つのブリックを使用してGlusterFSをセットアップし、6つのVMをクライアントとして提供しています。テストでは、すべてが正常に見えました。しかし、本番環境に移行したとき、1500万ヒットを超えるトラフィックを処理するのに十分なI/Oが利用できなかったようです。数週間前、私たちの古いサーバーは、最大で2,000万のトラフィックを処理できました。

そのようなアプリケーションに推奨される構成はありますか、または私たちのサイズのサイトのgluster.orgのドキュメントでは明らかではないことに注意する必要がありますか?

1
montana

書き込みキャッシュ(?)のない6x7.2krpmドライブのRAID-6は、ひどい書き込みパフォーマンスを持ちます。ひどいので、ディスクがダウンして、読み取りパフォーマンスにも実際に影響を与える可能性があります。アプリには健全な組み合わせがあります。つまり、現実的には、その配列から分割された80/20の読み取り/書き込みで250のランダムIOPSのように見えます。毎秒数百のhttpリクエストを実行している場合、Apacheアクセスログと同じくらい些細なことが、DoS攻撃のようにそれを妨害します。

可能であれば、それらをraid10としてやり直してください。それはあなたにいくらかの生のスペースを要しますが、I/Oパフォーマンスに大きな影響を与えます。そして、レイドカードでバッテリーバックアップの書き込みキャッシュを取得できる場合、それは非常に大きな違いを生みます。

私は特にglusterfsに精通していませんが、すべての分散ファイルシステムで同じ基本的な問題が発生する傾向があります。ネットワーク遅延+複雑なロック=パフォーマンスの低下、特に小さなファイル、特に大量の書き込みワークロードで。

ディスクI/Oが遅く、ファイルシステムが遅いため、このクラスター設計はワークロードに適合しません。サーバーまたは少なくともディスクサブシステムを返却するには遅すぎますか?これが多額の収益を上げる会社の主要なプラットフォームである場合は、本当に専門家を雇う必要があります。

3
cagenut

GlusterFSトラフィックをどのメディアに移動していますか?イーサネットの場合、TCP/IPのオーバーヘッドのため、構成が大幅に制限されます。 GlusterFSはそこで最も効率的ではありません。それが本当に輝いているのはRDMAです。これは、Infinibandまたは10GigEのいずれかで実現できます。

また、すべて同じ役割を果たしている場合に、各物理ホストに2つの仮想ホストを配置することにした理由についても少しわかりません。ベアメタル上でそれらを実行し、オーバーヘッドを回避しないのはなぜですか?

1
Kamil Kisiel

どのバージョンのGlusterFを使用していますか? GlusterFS 3.0.0はメジャーリリースであり、小さなファイルのパフォーマンスの向上など、多くの改善が加えられています。

GlusterFSには、さまざまなワークロードに合わせて調整できる多くのパフォーマンストランスレーターがあります。たとえば、読み取りパフォーマンスを向上させるために先読みトランスレータがあり、書き込みパフォーマンスのために後書きトランスレータがあります。 io-cacheは、キャッシュに使用できるもう1つのパフォーマンストランスレータです。

あなたのセットアップのタイプは何ですか?複製または配布、あるいはその両方を使用していますか?ネットワークバックエンドは何ですか?ボトルネックを解消するために、古いサーバーと新しいサーバーの間でネットワーク/ディスクIO)のベンチマークを実行しましたか?

ボリュームファイルを私たちと共有できる場合は、ワークロードに最適なパフォーマンスが得られるように構成ファイルを調整することができます。

参考までに、30日間の無料トライアルサポートサブスクリプション[1]を提供しており、クエリにすばやく詳細に回答することができます。

乾杯、サチ

[1] http://www.gluster.com/products/trial.php

0
Sachida

セットアップに関する詳細な洞察がなければ(たとえば、Webサイトは静的ですか動的ですか?データベーストランザクションは同じストレージサブシステムを使用するサーバーで実行されますか?)、RAID 6は一般に書き込みパフォーマンスにとって悪い選択です。さらに複雑なものを導入しても、気にしないでください。 glusterを介して。潜在的に、2セットの書き込みストライプ変換が実行されています。1つはglusterレベルで、もう1つはコントローラーレベルです。次に、2つのパリティ計算があり、書き込みキャッシュが大きく、I/Oアクティビティが少ない期間がない限り、処理速度が低下し、I/Oブロッキングが発生します。

RAID 10に切り替えて、ファイバーチャネルまたは複数のボンディングされたGigEリンクのいずれかでこれを元に戻すことをお勧めします。

0
Jeff