web-dev-qa-db-ja.com

sb40cストレージブレードのトラブルシューティング

ブレードシステムc3000(hp 469499-b21)には、DASとしてsb40cストレージブレードと提携しているbl460cブレードがあります。 bl460はディスクレスで実行されており、ストレージブレードにはRAID10アレイとして構成された4つのドライブがあります。

ストレージブレードには、赤いライトが点滅しています。インサイトディスプレイのエンクロージャーの正常性の概要は、「正常」と「警告」を交互に繰り返し、ストレージサーバーのベイにデバイスエラーがあることを示します。

また、iLOログでは、「ベイ内の温度センサーの障害..」と「OK」が交互に繰り返されます(すべてのシステムの状態)。今朝、障害のあるストレージサーバーがデバイスエラーを示し、ステータスが低下することがあるため、ブレードサーバーを起動できず、ブレードサーバーを引き出して接続し直すまで機能しないため、特に心配しています。レコードが見つかりませんでした。このエラーについてオンラインでiLOログに記載されています。

私のデータは危険にさらされていますか?私はできるだけ早く予備を手に入れるつもりですが、私は心配している災害がすぐに襲うでしょう。

これは、アップグレードすることで解決されるiLOファームウェアの問題でしょうか?

新しいストレージブレードを提供できた場合、構成などを行わずにハードドライブを新しいストレージブレードに接続するだけで十分ですか?または行う必要がある何かがありますか?

正常に動作していて、警告やエラーがまったく表示されていない別のブレードとストレージブレードがあることに注意してください。 2組のデバイスをベイ1-2から5-6に、またはその逆に切り替えたときに、元のデバイスにエラーが残ったため、ベイの場所ではないため、これはストレージブレード自体のハードウェア障害である可能性が高いと思います。エンクロージャーのもの。私のファンと電源はもちろん、4枚のブレードを収容するための正しい方法で設定されています。

あなたに提供する重要な詳細が不足している場合は申し訳ありませんが、あなたが共有できるものは何でも役に立ちます!

1
3a2roub

数秒の間に繰り返されていた正確なOAエラーログでこれと同じ問題を抱えている人(誰もがそれを経験することはないと思います)は次のとおりです。

ブレードx周囲温度センサーの障害...状態は劣化しています。

ブレードxは正常なヘルスステータスを報告しています。

ベイ#xステータスのブレードが劣化からOKに変更されました。

ブレードx周囲温度の状態はOKです。

私たちの唯一のローカルhpパートナーでのhpサポートはまったく役に立ちませんでした。ありがたいことに、何時間も頭を壁にぶつけて、ストレージブレードのコンポーネントの隅々まで調べた後、明らかに温度センサーのジャックが後方にあったことがわかりました。少年はその安堵でした!写真をチェックして、私が何を意味するかを確認してください。みんな、ありがとう!

enter image description here

2
3a2roub

ディスクを別のSB40ユニットに移動する(一緒に、順番に保つ)場合、データは安全です。これはストレージブレードユニットの問題(温度センサーの故障)だと思います。 HPサポートに連絡するか、オンラインでケースを開いてください サポートケースマネージャー

1
ewwhite