web-dev-qa-db-ja.com

マルチプロセスのグローバル変数の更新が親に返されない

私はサブプロセスから値を返そうとしていますが、これらの値は残念ながら選択できません。そのため、スレッドモジュールでグローバル変数を使用して成功しましたが、マルチプロセッシングモジュールを使用すると、サブプロセスで行われた更新を取得できませんでした。私は何かが欠けていると思います。

最後に出力される結果は、vars dataDV03およびdataDV04。サブプロセスはこれらのグローバル変数を更新していますが、これらのグローバル変数は親では変更されません。

import multiprocessing

# NOT ABLE to get python to return values in passed variables.

ants = ['DV03', 'DV04']
dataDV03 = ['', '']
dataDV04 = {'driver': '', 'status': ''}


def getDV03CclDrivers(lib):  # call global variable
    global dataDV03
    dataDV03[1] = 1
    dataDV03[0] = 0

# eval( 'CCL.' + lib + '.' +  lib + '( "DV03" )' ) these are unpicklable instantiations

def getDV04CclDrivers(lib, dataDV04):   # pass global variable
    dataDV04['driver'] = 0  # eval( 'CCL.' + lib + '.' +  lib + '( "DV04" )' )


if __name__ == "__main__":

    jobs = []
    if 'DV03' in ants:
        j = multiprocessing.Process(target=getDV03CclDrivers, args=('LORR',))
        jobs.append(j)

    if 'DV04' in ants:
        j = multiprocessing.Process(target=getDV04CclDrivers, args=('LORR', dataDV04))
        jobs.append(j)

    for j in jobs:
        j.start()

    for j in jobs:
        j.join()

    print 'Results:\n'
    print 'DV03', dataDV03
    print 'DV04', dataDV04

私は質問に投稿できないので、オリジナルを編集しようとします。

ピクルできないオブジェクトは次のとおりです。

In [1]: from CCL import LORR
In [2]: lorr=LORR.LORR('DV20', None)
In [3]: lorr
Out[3]: <CCL.LORR.LORR instance at 0x94b188c>

これは、multiprocessing.Poolを使用してインスタンスを親に戻すときに返されるエラーです。

Thread getCcl (('DV20', 'LORR'),)
Process PoolWorker-1:
Traceback (most recent call last):
File "/alma/ACS-10.1/casa/lib/python2.6/multiprocessing/process.py", line 232, in _bootstrap
self.run()
File "/alma/ACS-10.1/casa/lib/python2.6/multiprocessing/process.py", line 88, in run
self._target(*self._args, **self._kwargs)
File "/alma/ACS-10.1/casa/lib/python2.6/multiprocessing/pool.py", line 71, in worker
put((job, i, result))
File "/alma/ACS-10.1/casa/lib/python2.6/multiprocessing/queues.py", line 366, in put
return send(obj)
UnpickleableError: Cannot pickle <type 'thread.lock'> objects
In [5]: dir(lorr)
Out[5]:
['GET_AMBIENT_TEMPERATURE',
 'GET_CAN_ERROR',
 'GET_CAN_ERROR_COUNT',
 'GET_CHANNEL_NUMBER',
 'GET_COUNT_PER_C_OP',
 'GET_COUNT_REMAINING_OP',
 'GET_DCM_LOCKED',
 'GET_EFC_125_MHZ',
 'GET_EFC_COMB_LINE_PLL',
 'GET_ERROR_CODE_LAST_CAN_ERROR',
 'GET_INTERNAL_SLAVE_ERROR_CODE',
 'GET_MAGNITUDE_CELSIUS_OP',
 'GET_MAJOR_REV_LEVEL',
 'GET_MINOR_REV_LEVEL',
 'GET_MODULE_CODES_CDAY',
 'GET_MODULE_CODES_CMONTH',
 'GET_MODULE_CODES_Dig1',
 'GET_MODULE_CODES_Dig2',
 'GET_MODULE_CODES_Dig4',
 'GET_MODULE_CODES_Dig6',
 'GET_MODULE_CODES_SERIAL',
 'GET_MODULE_CODES_VERSION_MAJOR',
 'GET_MODULE_CODES_VERSION_MINOR',
 'GET_MODULE_CODES_YEAR',
 'GET_NODE_ADDRESS',
 'GET_OPTICAL_POWER_OFF',
 'GET_OUTPUT_125MHZ_LOCKED',
 'GET_OUTPUT_2GHZ_LOCKED',
 'GET_PATCH_LEVEL',
 'GET_POWER_SUPPLY_12V_NOT_OK',
 'GET_POWER_SUPPLY_15V_NOT_OK',
 'GET_PROTOCOL_MAJOR_REV_LEVEL',
 'GET_PROTOCOL_MINOR_REV_LEVEL',
 'GET_PROTOCOL_PATCH_LEVEL',
 'GET_PROTOCOL_REV_LEVEL',
 'GET_PWR_125_MHZ',
 'GET_PWR_25_MHZ',
 'GET_PWR_2_GHZ',
 'GET_READ_MODULE_CODES',
 'GET_RX_OPT_PWR',
 'GET_SERIAL_NUMBER',
 'GET_SIGN_OP',
 'GET_STATUS',
 'GET_SW_REV_LEVEL',
 'GET_TE_LENGTH',
 'GET_TE_LONG_FLAG_SET',
 'GET_TE_OFFSET_COUNTER',
 'GET_TE_SHORT_FLAG_SET',
 'GET_TRANS_NUM',
 'GET_VDC_12',
 'GET_VDC_15',
 'GET_VDC_7',
 'GET_VDC_MINUS_7',
 'SET_CLEAR_FLAGS',
 'SET_FPGA_LOGIC_RESET',
 'SET_RESET_AMBSI',
 'SET_RESET_DEVICE',
 'SET_RESYNC_TE',
 'STATUS',
 '_HardwareDevice__componentName',
 '_HardwareDevice__hw',
 '_HardwareDevice__stickyFlag',
 '_LORRBase__logger',
 '__del__',
 '__doc__',
 '__init__',
 '__module__',
 '_devices',
 'clearDeviceCommunicationErrorAlarm',
 'getControlList',
 'getDeviceCommunicationErrorCounter',
 'getErrorMessage',
 'getHwState',
 'getInternalSlaveCanErrorMsg',
 'getLastCanErrorMsg',
 'getMonitorList',
 'hwConfigure',
 'hwDiagnostic',
 'hwInitialize',
 'hwOperational',
 'hwSimulation',
 'hwStart',
 'hwStop',
 'inErrorState',
 'isMonitoring',
 'isSimulated']

In [6]:
33
Buoy

multiprocessingを使用して2番目のプロセスを開くと、独自のグローバル状態を持つPythonの完全に新しいインスタンスが作成されます。そのグローバル状態は共有されないため、子プロセスによってグローバル変数に加えられた変更は、親プロセスには見えません。

さらに、multiprocessingが提供するほとんどの抽象化はpickleを使用してデータを転送します。プロキシを使用して転送されるすべてのデータ ピクルスにする必要があります ;これには、 Managerが提供する のすべてのオブジェクトが含まれます。関連する引用(私の強調):

proxiesのメソッドへの引数が選択可能であることを確認してください。

そして(Managerセクションで):

他のプロセスは、プロキシを使用して共有オブジェクトにアクセスできます。

Queuesには、ピクル可能なデータも必要です。ドキュメントはそう言っていませんが、簡単なテストでそれを確認します:

import multiprocessing
import pickle

class Thing(object):
    def __getstate__(self):
        print 'got pickled'
        return self.__dict__
    def __setstate__(self, state):
        print 'got unpickled'
        self.__dict__.update(state)

q = multiprocessing.Queue()
p = multiprocessing.Process(target=q.put, args=(Thing(),))
p.start()
print q.get()
p.join()

出力:

$ python mp.py 
got pickled
got unpickled
<__main__.Thing object at 0x10056b350>

mightがあなたのために働く1つのアプローチは、本当にデータをピクルできない場合、ctypeオブジェクト;メモリへの参照は 子プロセスに渡される になります。これは私にはかなり危険なようです。私はやったことがありません。しかし、それはあなたにとって可能な解決策かもしれません。

更新を考えると、LORRの内部についてもっと詳しく知る必要があるようです。 LORRはクラスですか?それからサブクラス化できますか?それは他の何かのサブクラスですか? MROとは何ですか? (LORR.__mro__そして、それが機能する場合は出力をポストします。)純粋なpythonオブジェクトの場合、サブクラス化して、__setstate__および__getstate__酸洗を有効にします。

別のアプローチは、LORRインスタンスから関連データを取得し、単純な文字列を介して渡す方法を見つけることです。オブジェクトのメソッドを呼び出したいだけだと言うので、Queuesを使用してメッセージをやり取りするだけではどうでしょうか。言い換えると、次のようなものです(概略的に):

Main Process              Child 1                       Child 2
                          LORR 1                        LORR 2 
child1_in_queue     ->    get message 'foo'
                          call 'foo' method
child1_out_queue    <-    return foo data string
child2_in_queue                   ->                    get message 'bar'
                                                        call 'bar' method
child2_out_queue                  <-                    return bar data string
35
senderle

@DBlasは、回答でManagerクラスへの簡単なURLと参照を提供しますが、まだ少し曖昧だと思うので、それが適用されているのを見るのが役立つと思いました...

import multiprocessing
from multiprocessing import Manager

ants = ['DV03', 'DV04']

def getDV03CclDrivers(lib, data_dict):  
    data_dict[1] = 1
    data_dict[0] = 0

def getDV04CclDrivers(lib, data_list):   
    data_list['driver'] = 0  


if __name__ == "__main__":

    manager = Manager()
    dataDV03 = manager.list(['', ''])
    dataDV04 = manager.dict({'driver': '', 'status': ''})

    jobs = []
    if 'DV03' in ants:
        j = multiprocessing.Process(
                target=getDV03CclDrivers, 
                args=('LORR', dataDV03))
        jobs.append(j)

    if 'DV04' in ants:
        j = multiprocessing.Process(
                target=getDV04CclDrivers, 
                args=('LORR', dataDV04))
        jobs.append(j)

    for j in jobs:
        j.start()

    for j in jobs:
        j.join()

    print 'Results:\n'
    print 'DV03', dataDV03
    print 'DV04', dataDV04

マルチプロセッシングは実際には個別のプロセスを使用するため、グローバル変数はメモリ内の完全に異なる「スペース」にあるため、単純にグローバル変数を共有することはできません。あるプロセスの下でグローバルに対して行うことは、別のプロセスには反映されません。私はあなたがそれを見る方法から混乱しているように見えますが、そのすべてが同じコードの一部に存在しているので、「これらのメソッドがグローバルにアクセスできないのはなぜですか?」異なるプロセスで実行されるという考えに頭を悩ますことは困難です。

Managerクラス は、プロセス間で情報を往復させることができるデータ構造のプロキシとして機能するために提供されます。マネージャーから特別な辞書とリストを作成し、それらをメソッドに渡し、それらをローカルで操作します。

ピクルできないデータ

特殊化したLORRオブジェクトの場合、インスタンスの選択可能な状態を表すことができるプロキシのようなものを作成する必要があるかもしれません。

非常に堅牢ではありませんが、多くのテストを行いましたが、アイデアを提供します。

class LORRProxy(object):

    def __init__(self, lorrObject=None):
        self.instance = lorrObject

    def __getstate__(self):
        # how to get the state data out of a lorr instance
        inst = self.instance
        state = dict(
            foo = inst.a,
            bar = inst.b,
        )
        return state

    def __setstate__(self, state):
        # rebuilt a lorr instance from state
        lorr = LORR.LORR()
        lorr.a = state['foo']
        lorr.b = state['bar']
        self.instance = lorr
6
jdi

multiprocessを使用する場合、プロセス間でオブジェクトを渡す唯一の方法は、QueueまたはPipeを使用することです。グローバルは共有されません。オブジェクトはピクル可能でなければならないので、multiprocessはここでは役に立ちません。

5
ecatmur

multiprocessing Array を使用することもできます。これにより、プロセス間で状態を共有でき、おそらくグローバル変数に最も近いものになります。

Mainの上部で、配列を宣言します。最初の引数 'i'は、整数になることを示しています。 2番目の引数は初期値を示します。

shared_dataDV03 = multiprocessing.Array ('i', (0, 0)) #a shared array

次に、この配列を引数としてプロセスに渡します。

j = multiprocessing.Process(target=getDV03CclDrivers, args=('LORR',shared_dataDV03))

呼び出される関数で配列引数を受け取る必要があります。その後、関数内で配列引数を変更できます。

def getDV03CclDrivers(lib,arr):  # call global variable
    arr[1]=1
    arr[0]=0

配列は親と共有されるため、親の最後に値を出力できます。

print 'DV03', shared_dataDV03[:]

そして、変更が表示されます:

DV03 [0, 1]
4
Paul

P.map()を使用して、多数のプロセスをリモートサーバーにスピンオフし、予測できない時間に戻ったときに結果を出力します。

_Servers=[...]
from multiprocessing import Pool
p=Pool(len(Servers))
p.map(DoIndividualSummary, Servers)
_

DoIndividualSummaryが結果にprintを使用した場合、これは正常に機能しましたが、全体的な結果は予測できない順序であったため、解釈が困難になりました。グローバル変数を使用するためにいくつかのアプローチを試みましたが、問題に遭遇しました。最後に、sqlite3で成功しました。

p.map()の前に、sqlite接続を開き、テーブルを作成します。

_import sqlite3
conn=sqlite3.connect('servers.db') # need conn for commit and close
db=conn.cursor()
try: db.execute('''drop table servers''')
except: pass
db.execute('''CREATE TABLE servers (server text, serverdetail text, readings     text)''')
conn.commit()
_

次に、DoIndividualSummary()から戻るときに、結果をテーブルに保存します。

_db.execute('''INSERT INTO servers VALUES (?,?,?)''',         (server,serverdetail,readings))
conn.commit()
return
_

map()ステートメントの後に、結果を出力します。

_db.execute('''select * from servers order by server''')
rows=db.fetchall()
for server,serverdetail,readings in rows: print serverdetail,readings
_

やり過ぎのように見えるかもしれませんが、推奨されるソリューションよりも簡単でした。

1
Eva Smith