web-dev-qa-db-ja.com

再起動せずにPOST)中に報告されたSupermicro DIMM(メモリ)エラーを検出する

Supermicroサーバーの1つが、POST中に次のようなエラーを報告します。

障害のあるDIMM:DIMMの場所(修正可能なメモリーコンポーネントが見つかりました)

DIMMB2

これは、IPMIWebインターフェイスのヘルスイベントログでも確認できます。

障害のあるDIMM:DIMMの場所。 (修正可能なメモリコンポーネントが見つかりました)(DIMMB2)

(無関係の理由で)再起動するまで、サーバーは正常に動作していたので、RAMに問題があるとは思いもしませんでした。サーバーを再起動せずにこのようなエラーを見つける方法はありますか?いくつかのipmitoolコマンド?

そうでない場合、これらのエラーを確認するための少なくともスクリプト可能な方法はありますかafterサーバーが再起動されました。つまり、Webインターフェイスを使用しませんか?私は試した ipmitool sel elist、ただし、これらのエントリは「不明」イベントとして表示されます。

5 | 2019年10月11日| 11:21:25 |不明#0xff | |主張

編集:Supermicro独自のツールであるIPMICFGがこれらのイベントを表示できることがわかりました(IPMICFG-Linux.x86_64 -sel list)しかし、ipmitoolを使用して、そして最も重要なことに、再起動せずにこれを行う方法があると便利です。

1
EM0

代わりにFreeIPMIを使用してみてください(たとえば、ipmi-sel):コードベースがはるかに維持されているため、ipmitoolよりも多くの情報が得られる可能性があります。

1
faxmodem