web-dev-qa-db-ja.com

omp_set_num_threads()を使用してスレッド数を2に設定しますが、omp_get_num_threads()は1を返します

OpenMPを使用した次のC/C++コードがあります。

_    int nProcessors=omp_get_max_threads();
    if(argv[4]!=NULL){
        printf("argv[4]: %s\n",argv[4]);
        nProcessors=atoi(argv[4]);
        printf("nProcessors: %d\n",nProcessors);
    }
    omp_set_num_threads(nProcessors);
    printf("omp_get_num_threads(): %d\n",omp_get_num_threads());
    exit(0);
_

ご覧のとおり、コマンドラインで渡された引数に基づいて、使用するプロセッサの数を設定しようとしています。

ただし、次の出力が得られます。

_argv[4]: 2   //OK
nProcessors: 2   //OK
omp_get_num_threads(): 1   //WTF?!
_

omp_get_num_threads()が2を返さないのはなぜですか?!!!


指摘したように、シリアル領域でomp_get_num_threads()を呼び出しているため、関数は_1_を返します。

ただし、次の並列コードがあります。

_#pragma omp parallel for private(i,j,tid,_hash) firstprivate(firstTime) reduction(+:nChunksDetected)
    for(i=0;i<fileLen-CHUNKSIZE;i++){
        tid=omp_get_thread_num();
        printf("%d\n",tid);
        int nThreads=omp_get_num_threads();
        printf("%d\n",nThreads);
...
_

出力:

_0   //tid
1   //nThreads - this should be 2!
0
1
0
1
0
1
...
_
23
Eamorr

omp_get_num_threads()呼び出しは、コードのシリアルセクションで1を返します。参照 リンク

したがって、正しい値を取得するには並列コードが必要です。ここでは、コードは次のようになります。

#include <iostream>
#include <omp.h>

int main (int argc, const char * argv[])
{
    int nProcessors = omp_get_max_threads();

    std::cout<<nProcessors<<std::endl;

    omp_set_num_threads(nProcessors);

    std::cout<<omp_get_num_threads()<<std::endl;

#pragma omp parallel for 
    for(int i = 0; i < 5; i++){
        int tid = omp_get_thread_num();
        std::cout<<tid<<"\t tid"<<std::endl;
        int nThreads = omp_get_num_threads();
        std::cout<<nThreads<<"\t nThreads"<<std::endl;
    }

    exit(0);
}

このコードは以下を生成します:

2

1
0    tid
2    nThreads
0    tid
2    nThreads
0    tid
2    nThreads
1    tid
2    nThreads
1    tid
2    nThreads

Open mpが有効になっていないか、ループがopenmpでパラレライズできる形式ではないようです

31
tune2fs

間違った機能を使用しています。使用する omp_get_max_threadsは、許可されたスレッドの最大数を確認します。

9
Bort

omp_get_num_threads()がコードの連続するセクションで_1_を返すことはすでに指摘されています。したがって、omp_set_num_threads()で_1_より大きいスレッドの総数を設定しても、omp_get_num_threads()を呼び出すと、_1_が返されます。平行断面。以下の例は、この点を明確にしようとしています

_#include <stdio.h>

#include <omp.h>

int main() {

    const int maxNumThreads = omp_get_max_threads();

    printf("Maximum number of threads for this machine: %i\n", maxNumThreads);

    printf("Not yet started a parallel Section: the number of threads is %i\n", omp_get_num_threads());

    printf("Setting the maximum number of threads...\n");
    omp_set_num_threads(maxNumThreads);

    printf("Once again, not yet started a parallel Section: the number of threads is still %i\n", omp_get_num_threads());

    printf("Starting a parallel Section...\n");

#pragma omp parallel for 
    for (int i = 0; i < maxNumThreads; i++) {
        int tid = omp_get_thread_num();
        printf("This is thread %i announcing that the number of launched threads is %i\n", tid, omp_get_num_threads());
    }

}
_
0
JackOLantern