web-dev-qa-db-ja.com

LinuxはNvidiaGTXのみでは起動しません

機械学習トレーニングサーバー(GPUを使用)として使用されるヘッドレスデスクトップコンピューター(画面なし/キーボードなし)があります。他のコンピューター(ラップトップ)からSSH経由で接続します。

いつ:

  • マザーボードに接続されている唯一のグラフィックカードとしてNvidiaGTX 650を使用してコンピューターを起動しましたが、起動しないようで、コンピューターをSSH接続できません。

  • Nvidia GTX 650+古いATIRadeonグラフィックカード(MBに2つのPCI-expressスロットがあります)を使用してコンピューターを起動すると、起動してSSHで接続できます。

注:Nvidiaのドライバーがインストールされています(apt-get install nvidia-315)、それが検出され(2番目の場合)、Tensorflowはそれを正常に使用できるため、問題はドライバーの欠落によるものではないことを意味します。

buntu16.04サーバーが唯一のグラフィックカードとしてNvidiaGTX 650で起動するのを妨げる問題は何でしょうか?

1
Basj

このデュアルカード構成でそのラップトップをインストールした後、ディスプレイ構成(X)がそのラップトップを記憶している可能性があります。

できるよ :

  • ログファイル(システム、X)を確認し、ATIカードが接続されていない場合に何が起こるかを分析します。サーバーが起動してログを記録するかどうか
  • Xorg.confを更新または作成します。これは少し注意が必要です。
1
jayooin

奇妙なマザーボード+グラフィックカードの問題のようです(MB:M4A79XTD EVO)。私は実際にはそれを解決していませんが、将来の参考のために、ここにテストの説明があります:

  • スロットPCIEx16_1のNvidiaGTX 650 Tiのみ:起動すらしません!
    同じスロットでの古いATIのみ:起動OK
    同じスロットの古いRadeonHD 5770:起動OK

  • スロットPCIEx16_2のNvidiaGTX 650 Tiのみ:OK
    同じスロットにある古いATIのみ:OK

  • スロットPCIEx16_1のNvidiaGTX 650 Ti
    +スロットPCIEx16_2の古いATI
    =>起動OK

考えられる理由:

  • PCIEx16_1スロットがx16モードで正しく機能しないのではないかと思います。グラフィックカードが2枚ある場合、おそらくそれぞれにx8が強制されます(したがって、機能します)。
    古いグラフィックカードはおそらくx8を使用しているので、PCIEx16_1スロットでも古いグラフィックカードで動作するのはそのためです。

ソリューション:

  • 新しいBIOSのフラッシュ/アップデート(未テスト)
  • pCIEx16_2のみを使用し、PCIEx16_1を忘れてください(元々、コンピューターケース内のPCIEx16_1の位置が冷却に適しているため、これを避けたかったのです)
  • pCIEx16_1でNvidiaを使用しますが、x8を強制するためだけに、古い(役に立たない)グラフィックカードをPCIEx16_2に保持しておくと、機能します。
0
Basj