web-dev-qa-db-ja.com

電源不足のPSUが原因でNVIDIAグラフィックカードがクラッシュするかどうかの確認

最近、いくつかの新しいゲームをプレイし始めましたが、DXGI_ERROR_DEVICE_HUNGDXGI_ERROR_DEVICE_REMOVEDなどの印刷エラーが頻繁に断続的にクラッシュしました。調査により、問題は次の可能性にまで減少しました。

  • 欠陥のあるグラフィックカード、
  • 電力不足のPSU。

私の質問は次のとおりです:2つを区別するにはどうすればよいですか?NVIDIAカードの「電力不足による障害」イベントをログに記録する診断、またはその効果のあるものはありますか?

このカードはNVIDIAGTX 6xxシリーズチップセットに基づいており、問題のシステムはWindows 7 64ビットです(トラブルシューティングの実行に必要な場合は、Linuxとのデュアルブート)。


ノート:

コミュニティの利益のために、回答をできるだけ一般的にしたいので、残りの構成は意図的に省略しています。まだ十分に一般的で絶対に必要のソリューションがあると思われる場合は、コメントをドロップしてください。

アンダークロックは実行可能な解決策ではなく(2つの条件を区別しないため)、カードとPSUの仕様によれば、提供されるワット数は十分である必要があります(オーバーヘッドはわずかですが)。

完全を期すために、クラッシュ直後のカードパラメータのグラフを次に示します。各ラベルはその下のグラフを説明し、一番上のグラフは摂氏での温度です。 GPU使用量の急増とコアクロック周波数の低下は、クラッシュに対応しています。

Graphics card stats during normal operation and a crash

3
mikołak

そのため、不特定の「ハードウェア障害」により、カードは保証期間中に交換されました。

要約すると、次の場合:

  • 質問のような問題があります(温度スパイクのない断続的なカードの電源オフ)、
  • pSUの電源が不足していないことを確認しました。グラフィックカード。

次に、カードが完全に異なるハードウェア構成に挿入されたときに障害が発生するかどうかを確認するように調整します。検証を提供するマシンは、もちろん、同等以上の仕様である必要があります(特にPSUとマザーボード)。 。

結局、これはまさに私がしたことです-友人に彼らのコンピュータでカードをチェックするように頼みました。まったく同じ障害が約7分で発生しました。

もちろん、マザーボードに損傷を与えるような方法でグラフィックカードが故障している可能性がある非常にリモートの可能性があります-しかし、これはそうではありません可能性は非常に低く、別の構成でグラフィックカードだけをチェックする方が、他の方法よりも安全です。ここでは、障害のある可能性のあるコンポーネントが1つしかないためです。

1
mikołak

名前のないPSUを使用する場合は、これが問題の原因である可能性があります。既知のブランドのPSUの場合でも、名前なしでは通常、すべての電力線(-5、-12、3.3、5、5VSB、12V)の合計ワット数がカウントされ、実際には+ 12Vのみが使用されます。グラフィックカード(外部電源コネクタがある場合)およびCPU(P4コネクタ付き)。さらに、3.3および/または5Vは多くの場合、高いアンペア電流を供給しますが、+ 12Vはそれよりも低くなります。 (+ 3.3Vで40Aが役に立たず、+ 12Vで18AがほとんどないPSUはすでに見られます)名前のないPSUのコンポーネントも小さすぎるため、合計ワット数の80%以上を正しく供給できません。

コンピュータのすべてのハードウェア仕様を知っていると、PSUで十分かどうかを知るのに役立ちます。

ただし、試すことができることの1つは、CPU乗算器を低い値にブロックし、それを低電圧にして、消費電流を少し少なくすることですが、これはグラフィックカードに直接影響しません。明らかに、ゲーム内ではパフォーマンスが低下します。

チップセットでも同じことを試すことができますが、PCIeリンク周波数が100Mhzに固定されていることを確認してください。

最後に、一部のグラフィックカードは、カードへの正しい電源供給の失敗を示すオンボードLEDを備えています。 (私のSapphire Radeon HD4850には、たとえば1つありますが、ここではNVidiaについて説明しています)

2
piernov