web-dev-qa-db-ja.com

mceの出力をどのように解釈しますか?

私のPCは最近自動的に再起動し、その後 abrt は、ハードウェア関連のエラーの可能性があることを通知しました。 dmesgをチェックすると、mceから次の行が見つかりました。

[    0.554142] mce: [Hardware Error]: Machine check events logged
[    0.554143] mce: [Hardware Error]: CPU 0: Machine Check: 0 Bank 3: baa0000000040118
[    0.554145] mce: [Hardware Error]: TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000 
[    0.554148] mce: [Hardware Error]: PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013

これをどのように解釈しますか? CPUがどのソケットにあるか(1つしかないので0)などのマイクロコードバージョンが報告されることに注意しますが、それはCPUに障害があることを意味しますか?状況に光を当てていただければ幸いです。

2
Newbyte

mcelog プログラムはいくつかの説明を提供できます:

/usr/sbin/mcelog --ascii < error_text

エラーテキスト部分を抽出しました:

Machine check events logged
CPU 0: Machine Check: 0 Bank 3: baa0000000040118
TSC 0 MISC d012000100000000 SYND 4d000000 IPID 300b000000000 
PROCESSOR 2:870f10 TIME 1590567072 SOCKET 0 APIC 0 microcode 8701013

次に、Linux Mint VMで実行しました。これにより、非常に部分的な分析が可能になりました。重要な部分は次のとおりです。

Hardware event. This is not a software error.

エラーが発生したコンピューターで分析を実行すると、詳細がわかります。

あなたの情報に基づく私自身の意見は、これはRAMメモリバンク3アドレスの問題baa0000000040118

1
harrymc