web-dev-qa-db-ja.com

プロセスに使用されているGPUコアの数を決定する方法は?

ご存知のように、CPUに4つのコアがある場合、最大使用率は400%となり、合計使用率が200%の場合、4つのコアのうち2つのコアが使い果たされたと分析されます。

したがって、GPUの場合、最大使用率は100%であり、合計使用率が80%の場合、使用されているコアの数を分析するにはどうすればよいでしょうか。

Nvidiaグラフィックスの場合、nvidia-smiを使用してnvidia GPU使用率を確認できます。

インテルグラフィックスの場合、intel_gpu_time/intel-gpu-topを使用してiGPUの使用率を確認できます。

しかし、どちらも使用されているGPUコアの数を示していません。それを行う方法はありますか?

Linuxを使用しています。 Ubuntu 14.04とCentos 7.2の両方

4
Vanns

GPUでは、100%の使用率は、すべてのコアが基本的に命令を実行していることを意味します。これらの命令がすべて融合積和演算である場合、最高のパフォーマンスで実行されます。a = a + b * c、ほとんどの現在のGPUは単一の命令のみを使用して実行できます。

GPUで計算を実行するプログラム(CUDAまたはOpenCLを使用)を作成する場合、作業をいわゆるスレッドのブロックのグリッド(CUDA用語)に分散します。すべてのGPUコアをビジー状態に保つために、これらすべてのスレッドを(32スレッドの「ワープ」で)スケジュールするのはGPU次第です。あなたがこの主題にどれほど精通しているかはわかりませんが、 this 紹介は興味深い読み物かもしれません。

例では、これが使用率にどのように関連するかを説明しています。 GPUがアイドル状態で、シングルスレッドブロックに対してのみカーネルを起動するアプリケーションを起動するとしますが、このブロック内で十分な計算が行われます。 GPUは、GPU上のストリーミングマルチプロセッサ(SM = 128コアのグループ)にスレッドブロックをスケジュールします。たとえば、20個のSMを備えたNvidia GTX 1080の場合、使用率は(1/20 * 100%)= 5%になります。

GPUコンピューティングのこの基本的な知識を前提として、 Nvidia Visual Profiler (CUDAアプリケーションの場合)またはCodeXL(OpenCLアプリケーションの場合)を介して実行すると、アプリケーションが使用するカーネルのスレッド構成を確認できますGPUの利用について推論する。しかし、それだけではありません。このツールは、GPUが実行している操作の種類(および効率)を正確に確認するために非常に役立ちます。

4
Bram