4つの配列を反復処理するかなり単純なネストされたforループがあります。
for a in a_grid:
for b in b_grid:
for c in c_grid:
for d in d_grid:
do_some_stuff(a,b,c,d) # perform calculations and write to file
そもそも、これは4Dグリッド上で計算を実行するための最も効率的な方法ではないかもしれません。 joblib
が this のような2つのネストされたforループを並列化できることは知っていますが、4つのネストされたループに一般化するのに問題があります。何か案は?
私は通常、次の形式のコードを使用します。
#!/usr/bin/env python3
import itertools
import multiprocessing
#Generate values for each parameter
a = range(10)
b = range(10)
c = range(10)
d = range(10)
#Generate a list of tuples where each Tuple is a combination of parameters.
#The list will contain all possible combinations of parameters.
paramlist = list(itertools.product(a,b,c,d))
#A function which will process a Tuple of parameters
def func(params):
a = params[0]
b = params[1]
c = params[2]
d = params[3]
return a*b*c*d
#Generate processes equal to the number of cores
pool = multiprocessing.Pool()
#Distribute the parameter sets evenly across the cores
res = pool.map(func,paramlist)
4つではなく2つのネストされたループを簡単に並列化できるツールを使用する場合は、itertools.product
を使用して、4つのネストされたfor
ループを2つに減らすことができます。
from itertools import product
for a, b in product(a_grid, b_grid):
for c, d in product(c_grid, d_grid):
do_some_stuff(a, b, c, d)
ジョブの数は、ネストされたループの数とは関係ありません。他の答えでは、たまたまn_jobs=2
と2つのループですが、2つは完全に無関係です。
このように考えてください。作成する関数呼び出しがたくさんあります。あなたの場合(ループを展開する):
do_some_stuff(0,0,0,0)
do_some_stuff(0,0,0,1)
do_some_stuff(0,0,0,2)
do_some_stuff(0,0,1,0)
do_some_stuff(0,0,1,1)
do_some_stuff(0,0,1,2)
...
そして、それらの関数呼び出しをいくつかのジョブに分散させたいと考えています。あなたは2つの仕事、または10、または100を使うことができます、それは問題ではありません。 Parallel
があなたに代わって作品を配布します。