web-dev-qa-db-ja.com

SAN上の「必須」の空き領域?

私はSANの専門家ではありません。ここでは、サプライヤが解決できないと思われる、継続的で苛立たしい問題についての手がかりを得るために書いています。

eNHANCE ES3160P4 SANビデオ監視システム用に提供された16x 2Tbディスクを所有しています。SANは、サプライヤーによって使用するように構成されています。 RAID 5アレイ内の14個のディスク、および2個のディスクはグローバルスペアです。RAIDは通常、RAIDスペース全体にまたがる同じサイズの2個の仮想ディスクに分割されます。それぞれが12Tbを超える結果になります。各仮想ディスクは対応します。単一のLUNに接続され、ビデオデータを継続的に保存し、ユーザーが必要に応じて記録を取得できるようにします。LUNはNTFSでフォーマットされ、iSCSIを介してWindows Server2012ビデオサーバーに接続されます。ビデオサーバーは完全に使用する傾向があります。彼らが持っている利用可能なスペース。

この構成では、SANのディスクに障害が発生し、障害が発生します。その間、別のディスクに障害が発生したため、SANはRAIDを回復できません。過去数か月で4回のようなRAID。

この問題は、悪いSANサンプルが原因ではないようです。同じタイプで同じ問題が発生しているように見える他の3台のマシンを所有しているためです。問題は1台だけですが、十分に活用されていない瞬間。

数か月にわたる未知のテストとチェックの後、サプライヤは、SANを100%使用しないでください。そうしないと、物理的にも急速に劣化することはよく知られていると言ってしまいました。 RAIDで使用可能な合計スペースの10〜15%を残して、仮想ディスクを作成する必要があるという問題を解決します。

Webで問題を検索しましたが、これを示す具体的なステートメントは見つかりませんでした。 RAID全体にまたがる仮想ディスクを作成してからLUNを十分に活用しない(つまり、Windowsに空き領域を確保し、断片化を回避できるようにする)方が合理的であるように思われます。そうでない場合、ENHANCE SANが、空き領域を残さなければならないほど「よく知られている」場合に、RAID全体にまたがる仮想ディスクを作成できる理由とその理由がわかりません。サプライヤーは最初にこのようにシステムを構成しました...しかしそれは別のポイントです。

結局、私たちはこの状況を解決したいと思っています。どんな提案も受け入れられます。すでに述べたように、私はSANの専門家ではありませんが、多くの問題が発生した後、この状況を受け入れることができなくなったため、サプライヤーが何が起こっているのかを知っているかどうかを本当に理解したいと思います。 。

よろしくお願いします!よろしく

編集:ディスクタイプ回答から、関連情報のようですが、ディスクはすべてWesternDigitalモデルWD2001FYYG-01SL3であると付け加えます。

8
z2k

あなたの説明によると、主な問題は、このような大規模なアレイにRAID5を使用することを決定したことです。これは、まさにあなたが経験する理由から、このセットアップには非常に悪い選択です。リカバリ中に2番目のディスクに障害が発生すると、すべてが壊れます。そして、この2回目の失敗は、そのリスクを冒す可能性が非常に高いです。

彼らが使用した場合、例えば代わりに、RAID6では、リカバリ中に2番目のディスクに障害が発生してもアレイに障害が発生することはなく、1ディスク相当のネットストレージ容量と特定のパフォーマンスへの影響を犠牲にして、リカバリを正常に続行できます。

15%の空き領域を残しておくと、この問題がどのように役立つかわかりません。これは、ファイルシステムのパフォーマンスの観点からは良い考えかもしれませんが、RAIDの障害とは明らかに関係ありません。私はそれについてでたらめと呼びます。

とはいえ、不思議に思うのは仕方がありません。これが数か月の間に何度も発生することは、RAID5システムにとっても多すぎるように思われます。使用されているディスクの種類を調べることをお勧めします。そのようなシステムでの使用が認定されている24時間年中無休のドライブではなく、ベンダーが安価なデスクトップドライブを使用している可能性があります。

10
Sven

これは古い投稿であることを完全に理解していますが、本番環境で大規模なRAID5アレイが引き続き見られるので、ここに私の考えを追加したいと思います。

  • ディスクが頻繁に故障するのは、一般的に過熱や振動が多すぎる場合であり、システムの設計が不十分な場合や場所が悪い場合に見られます。

  • このような大きなRAID5アレイは強く避ける必要があります。原則として、RAID5 +ホットスペアアレイよりもRAID6アレイを使用する方がはるかに優れています。 OPの場合、2xグローバルホットスペアを備えた1xパリティディスクを使用するよりも、RAID6構成で2xパリティディスクを使用する方がはるかに優れていました。

  • エラーとステータスを報告するための信頼できるシステムを用意することが重要です。無意識のうちに劣化し、監視されていないアレイは災害のレシピです。

2
shodanshok