web-dev-qa-db-ja.com

オーバーウォッチを起動するときのみのコンピューターBSOD

さて、私はこれについてOWフォーラムに投稿しましたが、誰も気にしていないようです。ですから、ハードウェアの問題であり、オーバーウォッチの問題ではない場合に備えて、ここに投稿します。

だから私はすべてのゲームのニーズに合うようにゲームリグを構築しました、そしてそれはほぼ2年半の間持っています。私はほぼ同じ時間OWをプレイしていて、最近のOWパッチまですべてが順調でした。 (それが彼らの側で問題だと思う理由です)今、私はOWよりもグラフィックを多用する多くのゲームをプレイしていますが、クラッシュしたことは一度もありません。Doom、Fallout 4、Witcher3はほんの一例です。

クラッシュは、OWを起動したときにのみ発生し、黒い画面でハングします。バックグラウンドで音楽をオンにしている場合は、コンピューターのBSODが発生して再起動するまでメモが保持されます。最新のbsodは、「時計」に沿って何かを言い、私の2番目のコアについて何かを言いましたか?

私が試したこと。 Memcheck、Un and Reはゲームをインストールし、BIOSを更新し、グラフィックを更新し、さらにWindowsを再インストールしました。

これが関連しているかどうかはわかりませんが、最近新しいRazer Ornataキーボードを入手しましたが、これが影響している可能性がありますか?試行錯誤を繰り返し、この投稿を更新します。更新;プラグを抜いたキーボード、変更なし。

添付画像のスペック。

https://i.gyazo.com/23e5bf70eed481bb45678be16da44915.png

最新のミニダンプ: https://www.filehosting.org/file/details/758289/092618-20607-01.rar

男を助けますか?うまくいけば、この問題が私の最後の問題ほど馬鹿げたように見えないようにします。

1
surazaL

ミニダンプは、バグチェックコードがWHEA_UNCORRECTABLE_ERRORであることを示しています。

WHEA = Windowsハードウェアエラーアーキテクチャ。 (つまり、ハードウェアの問題が発生しました。)ミニダンプで報告されるバグチェックパラメータは次のとおりです。

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. 
Parameter 1 identifies the type of error source that reported the error. 
Parameter 2 holds the address of the WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: fffffa80070778f8, Address of the WHEA_ERROR_RECORD structure.
Arg3: 0000000000000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000000000, Low order 32-bits of the MCi_STATUS value.

簡単に言うと、CPUは「マシンチェック」と呼ばれる例外を発生させました。私の知る限り、これは常にOSにとって致命的です。ミニダンプはあなたがAMDCPUを持っていると言います。 AMDプロセッサアーキテクチャマニュアル は、プロセッサがこれらの状況でマシンチェック例外を発生させると述べています。

  1. データの読み取りと書き込み、プロービング、キャッシュラインのフィル、およびキャッシュラインのライトバックに関連するキャッシュエラー。 [これらはすべてCPU内のものであることに注意してください。たとえばとは何の関係もありません。 Windowsファイルキャッシュ。 -ジェ]
  2. キャッシュとTLBに関連するパリティエラー。 [CPU内-jeh]
  3. キャッシュとDRAMに関連するECCエラー。 [キャッシュのECCエラーはCPU内にあります。 ECC RAMを実行している可能性は非常に低いので、それは当てはまらないと思います。-jeh]
  4. プロセッサ外部バスでの読み取りと書き込みに関連するバスエラー。 [それが言うように-「外部バス」、CPU内部ではない-jeh]

これについての詳細は、WHEA_ERROR_RECORD構造をフォーマットすることで取得できます。この構造のアドレスは、Windowsがバグチェック引数2に便利に配置しています。

1: kd> !errrec fffffa80`070778f8
===========================================================================
Common Platform Error Record @ fffffa80070778f8
---------------------------------------------------------------------------
Record Id     : 01d45625295c3b26
Severity      : Fatal (1)
Length        : 928
[...]
Error         : BUSLG_GENERIC_ERR_*_TIMEOUT_ERR (Proc 1 Bank 0)
  Status      : 0xb880000000020f0f

つまり、バスでタイムアウトが発生しました。つまり、バスでのトランザクションが開始されましたが、すぐには完了しませんでした。 「バス」はおそらくPCIexpressでした。

あなたが説明する状況を考えると、これはグラフィックカードを強く指し示しています。

しかし、最初に私はあなたの電源をより良い/より強力なもの、特に12Vレールの電流がより多いものと交換してみます。最新のGPUは非常に電力を消費します。

Here は、このタイプのメモリダンプ(つまり、バグチェックコード0x124)の解釈について詳しく説明しているMicrosoftのページです。

ミニダンプから入手できる情報はそれほど多くありません。表示できるのは現在のスレッド情報だけです。そのスレッドはWHEAエラーの報告専用であるため、その時点で他のスレッド、おそらく他の論理プロセッサで何が起こっていたかについての情報はなく、ダンプにはその情報が含まれていません。通常、私は例えば!running、!readyなどですが、ここではデバッガーは「fffff800030b9000から読み取ることができません」とだけ表示します。これは、ミニダンプから情報が欠落しているためです。これは、WHEAエラーで一般的です。カーネルまたは自動ダンプを有効にして問題を再現した場合、より大きなダンプファイルに多くの情報が含まれている可能性がありますが、それなしでたどる明確なパス、つまりハードウェアの交換があるように見えます。申し訳ありません。

1
Jamie Hanrahan

私はここで推測しているだけですが、あなたが試したものの量に基づいて(Windowsを再インストールすることさえ)、GPUが小さなローカライズされたハードウェア障害に見舞われたと言いたくなります。 GPU自体、ボード、またはVRAMのごく一部に欠陥があり、グラフィックス描画呼び出しの特定のシーケンスのみがそれを顕在化させます。 1つのゲームだけがこれを行うことは完全に可能です。

私も同様の問題を抱えていました 約10年前 年齢とともに部分的な障害の影響を受けることが広く知られているはるかに古いNvidiaカードで。 1つの特定のMMOはアーティファクトを表示してからクラッシュしますが、他のMMOおよびFPSゲームは正常に実行されます。

GPUが2。5年前のものである場合、GPUは間違いなく十分に古く、何らかの「早期障害」タイプの方法で劣化し始めます。これは通常、チップがデスクトップよりも常に高温で動作するラップトップでより一般的です(たとえば、Macbook Proは年間)、GPUの寿命が短かったです。でもたぶんあなたは運が悪かっただけです。

大まかな一般化として、この種の問題は最近のデスクトップグラフィックカードでは非常にまれであると私は信じていますが、それはそれが起こり得ないという意味ではありません。頻度が減った唯一の理由は、過去数世代の間、NvidiaとAMDが、長期的な信頼性を確保するために以前よりも多くのQAとストレステストを製品に投資してきたことです。もちろん、チップを熱くしすぎると、最終的には壊れてしまいます。それはいつかという問題です。

最終的に、非常に特殊な機器(おそらく電子走査型顕微鏡および/またはX線顕微鏡、および数千ドルの追加のマイクロエレクトロニクス機器)がなければ、確実にを知る方法はありませんGPUの問題(存在する場合)とその発生方法/理由。

通常の消費者にとって、残念ながら、代替手段は単純ですが、多くの場合高価です。部品が「不良」であると思われる場合は、同等の機能を備えた新しい(または少なくとも異なるが動作が確認されている)デバイスと交換します。

たとえば、GTX 970が不良であると思われる場合は、友人のGTX 960(テスト済みで動作することがわかっている)を借りて、動作するかどうかを確認するためにシステムにインストールできます。それが機能しない場合、問題は別のものです。それが機能する場合は、GTX970が不良です。

マザーボード、CPU、RAM、おそらくWiFiカードのようなものなど、考えられるすべてのコンポーネントに対してこのプロセスを繰り返します。

コンピュータの部品を借りさせてくれる友達がいない場合は、これらのテストを行うために友達を購入する必要があるかもしれません。または、フレンドリーな地元のコンピューター修理店を知っている場合は、予備のハードウェアを使用してトラブルシューティングを行い、新しいGPUを購入するよりもはるかに安い診断料金(あるとしても)を請求するだけかもしれません。必要に応じて、中古市場でチャンスをつかむこともできます。

不良ハードウェアを特定したら、それを交換するだけです。ほとんどの場合、壊れたGPUを取り出して修正しようとするのは経済的ではありません。これは、ハイエンド機器を使用する専門家が実際に問題を見つけて修正するのに必要な時間が、GPUの価値を超えるためです。 。また、新品の場合は保証が付いているので、修理または交換のためにメーカーに返送する必要があります。残念ながら、GPUの減価償却が早すぎるため、保証対象外の修理を経済的に行うことはできません。

ハードウェアを交換しても問題が解決しない場合、ソフトウェアの問題である可能性がありますが、Windowsを完全に再インストールしたことを考えると(そして、オーバーウォッチ)、私の賭けでは、ソフトウェアに関連するものではなく、最終的には欠陥のあるハードウェアが見つかるでしょう。さらに、一般的なデータ破損タイプのエラーはBSODを引き起こしません。

この問題は、診断が難しく、根本原因を突き止めるのがほぼ不可能であり、私が思うに修正するのに費用がかかる可能性があります。ほとんどのGPUには2。5年以上ではなく1年または2年の保証が付いているため、非常に優れたメーカーが保証を行っていない限り、ほぼ間違いなく保証対象外です。より長い保証。保証の対象外で、GPUハードウェアに問題があると判断した場合は、新しいGPUを購入する必要があります。

0
allquixotic