web-dev-qa-db-ja.com

ハードウェアエラー、おそらくCPUマイクロコードに関連していますか?

これの少しの初心者として、私は誰かが潜在的なハードウェアの問題を診断するのを手伝ってくれるだろうかと思っていました。

通常、私のシステムは正常に動作しますが、メモリ/ CPUを大量に消費するpythonコードでシステムが完全にクラッシュしました。ログにある主なエラーコードは次のとおりです。

mce: [Hardware Error]: CPU 11: Machine Check: 0 Bank 0: b200000000070005
 mce: [Hardware Error]: TSC 0 
 mce: [Hardware Error]: PROCESSOR 0:50654 TIME 1568095380 SOCKET 0 APIC 18 microcode 200005e

いくつかのグーグルは、少なくとも私が最新のマイクロコードを持っているかどうか(私は持っています)、そして私のシステムが一般的に最新であるかどうか(そうです)をチェックするように私を導きました。全体的に私のシステムは正常に動作し、コードは他のマシンでエラーを引き起こしていないので、間違いなくシステムの問題です。この時点でどこから解決を開始すればよいかさえわかりません。

私のセットアップ:
Ubuntu 18.04.3 LTS
Intel i9-7940X @ 3.10GHz(14コア、28スレッド)
64GB RAM
ASUS ROG STRIXX299-EゲーミングMB
GeForce GTX1050iグラフィックス

2
Richard

(少なくとも今のところ)BIOSフラッシュが問題を解決したようです。振り返ってみると、他の投稿から補間すると、そもそもエラーの原因となったのはカーネルとBIOSの不一致であった可能性がありますが、すべてのCPUが使用されている場合にのみシステムクラッシュが発生します。

0
Richard

クラッシュ前に実行したCPUを集中的に使用するPythonコード)について言及しているため、これは熱の問題に関連している可能性があることを思い出します。クラッシュを再現し、CPU温度を監視できますか? ?

0
Eradian