web-dev-qa-db-ja.com

Pythonで関数をネストするときにオーバーヘッドはありますか?

Pythonでは、親関数内に子関数がある場合、親関数が呼び出されるたびに子関数が「初期化」(作成)されますか?関数を別の関数内にネストすることに関連するオーバーヘッドはありますか?

63

はい、毎回新しいオブジェクトが作成されます。あなたがそれをタイトなループにしない限り、それはおそらく問題ではありません。プロファイリングは、それが問題であるかどうかを教えてくれます。

In [80]: def foo():
   ....:     def bar():
   ....:         pass
   ....:     return bar
   ....: 

In [81]: id(foo())
Out[81]: 29654024

In [82]: id(foo())
Out[82]: 29651384
37
Daenyth

コードオブジェクトは事前にコンパイルされているため、一部にオーバーヘッドがありません。関数オブジェクトは呼び出しのたびに作成されます-関数名をコードオブジェクトにバインドし、デフォルト変数を記録します。

エグゼクティブサマリー:無料ではありません。

>>> from dis import dis
>>> def foo():
        def bar():
                pass
        return bar

>>> dis(foo)
  2           0 LOAD_CONST               1 (<code object bar at 0x1017e2b30, file "<pyshell#5>", line 2>)
              3 MAKE_FUNCTION            0
              6 STORE_FAST               0 (bar)

  4           9 LOAD_FAST                0 (bar)
             12 RETURN_VALUE 
39

影響はありますが、ほとんどの場合、それは非常に小さいので心配する必要はありません。ほとんどの重要なアプリケーションには、おそらくこれよりも数桁大きい影響のパフォーマンスボトルネックがすでに存在しています。代わりに、コードの可読性と再利用性について心配します。

ここでは、ループを通して毎回関数を再定義するパフォーマンスを比較して、代わりに事前定義された関数を再利用するいくつかのコードを示します。

import gc
from datetime import datetime

class StopWatch:
     def __init__(self, name):
         self.name = name

     def __enter__(self):
         gc.collect()
         self.start = datetime.now()

     def __exit__(self, type, value, traceback):
         elapsed = datetime.now()-self.start
         print '** Test "%s" took %s **' % (self.name, elapsed)

def foo():
     def bar():
          pass
     return bar

def bar2():
    pass

def foo2():
    return bar2

num_iterations = 1000000

with StopWatch('FunctionDefinedEachTime') as sw:
    result_foo = [foo() for i in range(num_iterations)]

with StopWatch('FunctionDefinedOnce') as sw:
    result_foo2 = [foo2() for i in range(num_iterations)]

OS X Lionを実行しているMacbook AirのPython 2.7でこれを実行すると、次のようになります。

** Test "FunctionDefinedEachTime" took 0:00:01.138531 **
** Test "FunctionDefinedOnce" took 0:00:00.270347 **
14
Thanos Baskous

私もこれに興味があったので、これがどのくらいのオーバーヘッドを発生させるかを把握することにしました。 TL; DR、答えは多くありません。

Python 3.5.2 (default, Nov 23 2017, 16:37:01) 
[GCC 5.4.0 20160609] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from timeit import timeit
>>> def subfunc():
...     pass
... 
>>> def no_inner():
...     return subfunc()
... 
>>> def with_inner():
...     def s():
...         pass
...     return s()
... 
>>> timeit('[no_inner() for _ in range(1000000)]', setup='from __main__     import no_inner', number=1)
0.22971350199986773
>>> timeit('[with_inner() for _ in range(1000000)]', setup='from __main__ import with_inner', number=1)
0.2847519510000893

私の本能はパーセント(with_innerは24%遅い)を調べることでしたが、実際には外部関数から内部関数の値を返すだけではないため、この数は誤解を招く可能性があります。実際に何でもします。
その間違いをした後、私はそれを他の一般的なものと比較して、これがいつ重要で重要でないかを確認することにしました。

    >>> def no_inner():
    ...     a = {}
    ...     return subfunc()
    ... 
    >>> timeit('[no_inner() for _ in range(1000000)]', setup='from __main__ import no_inner', number=1)
    0.3099582109998664

これを見ると、空の辞書( 速い方法 )を作成するよりも時間がかからないことがわかります。そのため、重要なことを行っている場合、これはおそらくまったく問題ではありません。

3
Bengerman

他の答えは素晴らしく、本当に質問によく答えます。 python forループの使用、関数の生成など)でほとんどの内部関数を回避できることを追加したいと思います。

次の例を検討してください。

def foo():
    # I need to execute some function on two sets of arguments:
    argSet1 = (arg1, arg2, arg3, arg4)
    argSet2 = (arg1, arg2, arg3, arg4)

    # A Function could be executed on each set of args
    def bar(arg1, arg2, arg3, arg4):
        return (arg1 + arg2 + arg3 + arg4)

    total =  bar(argSet1)
    total += bar(argSet2)

    # Or a loop could be used on the argument sets
    total = 0
    for arg1, arg2, arg3, arg4 in [argSet1, argSet2]:
        total += arg1 + arg2 + arg3 + arg4

この例は少し間抜けですが、それでも私の要点を理解していただければ幸いです。多くの場合、内部関数は必要ありません。

1
Cory-G

はい。これにより、クロージャと関数ファクトリが有効になります。

クロージャーは、呼び出されたときに内部関数にその環境の状態を記憶させます。

def generate_power(number):

    # Define the inner function ...
    def nth_power(power):
        return number ** power

    return nth_power

>>> raise_two = generate_power(2)
>>> raise_three = generate_power(3)

>>> print(raise_two(3))
8
>>> print(raise_three(5))
243
"""
0
RFV5s