web-dev-qa-db-ja.com

LSI Megaraidアラーム-ホットスペアのクリア

私は、LSI Megaraidコントローラ9266-8iを備えたSupermicroサーバーをいくつか持っています。 1つは最近ドライブを失いました。通常どおり交換しましたが、再起動時にまだビープ音が鳴っています。 RAID 10 +ホットスペアとして設定されています。

MegaCli64 -AdpEventLog -GetEvents -f events.log -aALL && cat events.logは私を示しています:

Event Description: Global Hot Spare created on PD 08(e0xfc/s0) (global,rev)
Event Description: Reminder: Potential non-optimal configuration due to drive PD
                    08(e0xfc/s0) commissioned as emergency spare

ビープパターンは1秒オン、3秒オフです。これは、「SPEAKER_HOTSPARE_ENTRY-ホットスペアドライブが再構築プロセスを完了し、アレイに組み込まれた」ためのコードです。これが問題の根本であると思います。リリースノートに「Potential non-optimal configuration」というメッセージが含まれているため、最新のファームウェアに更新しましたが、変更はありません。

これをクリアする方法について誰かがアイデアを持っていますか?

6
Bob

出典:IBMヒント H206526

機能上の影響はありません。メッセージがシステムイベントログに表示されないようにするには:

  • MegaRAIDストレージマネージャーを開きます。
  • 「ツール」->「アラートの構成のモニター」を選択します。
  • [個々のイベントを変更]を選択します。
  • イベントID 406を強調表示します。
  • [システムログ]チェックボックスをオフにします。
5
eal

私は、4つのディスクを持つLSIコントローラ、RAID 10を持っています。 1つのディスクが不良になり、ホットスワップ交換->新しいディスクにホットスペアフラグが自動的に設定され、上記と同じ警告が表示されました。マシンの電源を切り、交換用ディスクを物理的に取り外し、RAIDの参加を解除するクイックフォーマットを個別に行い、ディスクを交換してマシンの電源を入れました。自動的にディスクを検出し、ホットスペアフラグを設定せずにRAIDへの再構築を開始しました。

Trickは、マシンをシャットダウンして新しいディスクとのコールドスワップが可能な時間を見つけているようです。

2
Gopher Baorque

ここに同様の問題があります。構成はIntel RS2BL040 RAIDコントローラーです(ブランド名が変更されたLSIと思います)。 RAID10構成の4台のハードドライブ。

故障したドライブは数か月前に交換されました。サーバーが初めて再起動され、すべてが最適と表示されているにもかかわらず、RAIDコントローラーがビープ音を鳴らし始めました。ドライブ(不良ドライブを交換するために最近取り付けられたドライブを想定)のプロパティに「緊急スペア:はい」と表示されていることに気づきました。他のドライブは「いいえ」を示しています。

サーバーログに「Non-Optimal」メッセージが表示されていることに気づきませんでしたが、問題は同じようです。 RAID WebコンソールでイベントID 406のこの設定を調整してみましたが、サーバーが再起動したときに、アラームが消音するまでビープ音が鳴り続けます。

Intelは、現状のまま(私は好きではない)のままにしても問題ないと述べています。または、初期化せずにRAID10構成をクリアして再作成することを推奨しています。これにより、ドライブの「緊急スペア」フラグがクリアされ、データはそのまま残ります(ただし、最初にバックアップする必要があります)。

私はそれが好きではありません、より簡単でより良い解決策があるはずです!ファームウェアのバグのように聞こえます。

1
Kremlar

不良ドライブ(RAID 10で4つのドライブ)をホットスワップに交換したときに、この状況が発生しました。 LSI megaraidは、新しいドライブのビルド中に緊急スペアフラグを自動的に設定します。

コンピュータの電源を切った状態で新しいドライブを後で取り外すことでこれをクリアし、RAIDデータをクリアするためのクイック(再)フォーマットを個別に実行してから、再電源/ブートの前にドライブを交換しました。新しいドライブは起動時に新たに検出され、緊急スペアフラグをオフにしてRAIDに再構築されました。

0
KC7HP

デフォルトでは、コピーバック機能がオンになっており、これが問題が発生している理由です。コピーバックを完了する必要があります。

Broadcomのソースサポート記事: 再構築が完了しても、MegaRAIDコントローラーはビープ音を鳴らし、コピーバックが有効になっている場合はVDが最適です

0
ETL

古いファームウェアバージョンのバグのようです。ファームウェアをアップデートしても、カードの設定に書き込まれているため、問題は解決しません。

したがって、ディスクからすべてのデータをバックアップし、構成を保存し、コントローラーの構成をワイプして、構成を復元する必要があります。

Broadcomテクニカルサポートからの完全な回答:

設定データにあり、クリアされていないデータがあります。

工場出荷時のデフォルトを設定してみてください:storcli /cx set factory defaults

それが機能しない場合は、データをバックアップし、コントローラー構成を保存、削除、および復元します。

  • 設定を保存:storcli64 /c0 get config file=c0.cfg
  • 破損した構成を破棄します:storcli64 /c0 delete config force
  • 設定を再読み込み:storcli64 /c0 set config file=c0.cfg

それか、コピーバックを無効にしたままにします。

同じ問題があり、サーバー全体をバックアップから復元する必要がなかったため、コピーバックを無効にしたままにしてしまいました。

0
Victor