web-dev-qa-db-ja.com

Julia実行可能ファイルのJITオーバーヘッドを排除する方法(MWEを使用)

私は PackageCompiler を使用しています。ジャストインタイムのコンパイルオーバーヘッドを排除する実行可能ファイルを作成することを期待しています。

ドキュメントには、プログラムのロジックを呼び出すための関数Julia_mainを定義し、プリコンパイルしたい関数を呼び出すスクリプトである「スヌープファイル」を記述する必要があると説明されています。私のJulia_mainは、分析される入力データを含むファイルの場所という単一の引数を取ります。だから、物事をシンプルに保つために、私のsnoopファイルは、特定の入力ファイルでJulia_mainを1回呼び出すだけです。そのため、同じ入力ファイルに対して実行すると、生成された実行可能ファイルがナイスで高速(コンパイルのオーバーヘッドなし)で実行されることを期待しています。

しかし、悲しいかな、それは私が見るものではありません。新しいJuliaインスタンスでは、Julia_mainは最初の実行に約74秒、後続の実行に約4.5秒かかります。実行可能ファイルは、呼び出されるたびに約50秒かかります。

build_executable関数の使用は次のようになります。

Julia> using PackageCompiler

Julia> build_executable("d:/philip/source/script/Julia/jsource/SCRiPTMain.jl",
                        "testexecutable",
                        builddir = "d:/temp/builddir4",
                        snoopfile = "d:/philip/source/script/Julia/jsource/snoop.jl",
                        compile = "all",
                        verbose = true)

質問:

  1. 上記の引数は、JITオーバーヘッドのない実行可能ファイルの私の目的を達成するために正しいですか?
  2. 他に何かアドバイスはありますか?

build_executableへの呼び出しに対する応答は次のとおりです。 Start of snoop file execution!からEnd of snoop file execution!までの行は私のコードによって生成されます。

Julia program file:
  "d:\philip\source\script\Julia\jsource\SCRiPTMain.jl"
C program file:
  "C:\Users\Philip\.Julia\packages\PackageCompiler\CJQcs\examples\program.c"
Build directory:
  "d:\temp\builddir4"
Executing snoopfile: "d:\philip\source\script\Julia\jsource\snoop.jl"
Start of snoop file execution!
┌ Warning: The 'control file' contains the key 'InterpolateCovariance' with value 'true' but that is not supported. Pass a value of 'false' or omit the key altogether.
└ @ ValidateInputs d:\Philip\Source\script\Julia\JSource\ValidateInputs.jl:685
Time to build model 20.058000087738037
Saving c:/temp/SCRiPT/SCRiPTModel.jls
Results written to c:/temp/SCRiPT/SCRiPTResultsJulia.json
Time to write file: 3620 milliseconds
Time in method runscript: 76899 milliseconds
End of snoop file execution!
[ Info: used 1313 out of 1320 precompile statements
Build static library "testexecutable.a":
  atexit_hook_copy = copy(Base.atexit_hooks) # make backup
# clean state so that any package we use can carelessly call atexit
empty!(Base.atexit_hooks)
Base.__init__()
Sys.__init__() #fix https://github.com/JuliaLang/Julia/issues/30479
using REPL
Base.REPL_MODULE_REF[] = REPL
Mod = @eval module $(gensym("anon_module")) end
# Include into anonymous module to not polute namespace
Mod.include("d:\\\\temp\\\\builddir4\\\\Julia_main.jl")
Base._atexit() # run all exit hooks we registered during precompile
empty!(Base.atexit_hooks) # don't serialize the exit hooks we run + added
# atexit_hook_copy should be empty, but who knows what base will do in the future
append!(Base.atexit_hooks, atexit_hook_copy)

Build shared library "testexecutable.dll":
  `'C:\Users\Philip\.Julia\packages\WinRPM\Y9QdZ\deps\usr\x86_64-w64-mingw32\sys-root\mingw\bin\gcc.exe' --sysroot 'C:\Users\Philip\.Julia\packages\WinRPM\Y9QdZ\deps\usr\x86_64-w64-mingw32\sys-root' -shared '-DJULIAC_PROGRAM_LIBNAME="testexecutable.dll"' -o testexecutable.dll -Wl,--whole-archive testexecutable.a -Wl,--no-whole-archive -std=gnu99 '-IC:\Users\philip\AppData\Local\Julia-1.2.0\include\Julia' -DJULIA_ENABLE_THREADING=1 '-LC:\Users\philip\AppData\Local\Julia-1.2.0\bin' -Wl,--stack,8388608 -ljulia -lopenlibm -m64 -Wl,--export-all-symbols`
Build executable "testexecutable.exe":
  `'C:\Users\Philip\.Julia\packages\WinRPM\Y9QdZ\deps\usr\x86_64-w64-mingw32\sys-root\mingw\bin\gcc.exe' --sysroot 'C:\Users\Philip\.Julia\packages\WinRPM\Y9QdZ\deps\usr\x86_64-w64-mingw32\sys-root' '-DJULIAC_PROGRAM_LIBNAME="testexecutable.dll"' -o testexecutable.exe 'C:\Users\Philip\.Julia\packages\PackageCompiler\CJQcs\examples\program.c' testexecutable.dll -std=gnu99 '-IC:\Users\philip\AppData\Local\Julia-1.2.0\include\Julia' -DJULIA_ENABLE_THREADING=1 '-LC:\Users\philip\AppData\Local\Julia-1.2.0\bin' -Wl,--stack,8388608 -ljulia -lopenlibm -m64`
Copy Julia libraries to build directory:
  7z.dll
  BugpointPasses.dll
  libamd.2.4.6.dll
  libamd.2.dll
  libamd.dll
  libatomic-1.dll
  libbtf.1.2.6.dll
  libbtf.1.dll
  libbtf.dll
  libcamd.2.4.6.dll
  libcamd.2.dll
  libcamd.dll
  libccalltest.dll
  libccolamd.2.9.6.dll
  libccolamd.2.dll
  libccolamd.dll
  libcholmod.3.0.13.dll
  libcholmod.3.dll
  libcholmod.dll
  libclang.dll
  libcolamd.2.9.6.dll
  libcolamd.2.dll
  libcolamd.dll
  libdSFMT.dll
  libexpat-1.dll
  libgcc_s_seh-1.dll
  libgfortran-4.dll
  libgit2.dll
  libgmp.dll
  libjulia.dll
  libklu.1.3.8.dll
  libklu.1.dll
  libklu.dll
  libldl.2.2.6.dll
  libldl.2.dll
  libldl.dll
  libllvmcalltest.dll
  libmbedcrypto.dll
  libmbedtls.dll
  libmbedx509.dll
  libmpfr.dll
  libopenblas64_.dll
  libopenlibm.dll
  libpcre2-8-0.dll
  libpcre2-8.dll
  libpcre2-posix-2.dll
  libquadmath-0.dll
  librbio.2.2.6.dll
  librbio.2.dll
  librbio.dll
  libspqr.2.0.9.dll
  libspqr.2.dll
  libspqr.dll
  libssh2.dll
  libssp-0.dll
  libstdc++-6.dll
  libsuitesparseconfig.5.4.0.dll
  libsuitesparseconfig.5.dll
  libsuitesparseconfig.dll
  libsuitesparse_wrapper.dll
  libumfpack.5.7.8.dll
  libumfpack.5.dll
  libumfpack.dll
  libuv-2.dll
  libwinpthread-1.dll
  LLVM.dll
  LLVMHello.dll
  zlib1.dll
All done

Julia> 

[〜#〜]編集[〜#〜]

最小限の実用的な例を作成するのは難しいと思いましたが、簡単でした。

TestBuildExecutable.jlに含まれるもの:

module TestBuildExecutable

Base.@ccallable function Julia_main(ARGS::Vector{String}=[""])::Cint
    @show sum(myarray())
    return 0
end

#Function which takes approx 8 seconds to compile. Returns a 500 x 20 array of 1s
function myarray()
    [1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1;
     1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1;

# PLEASE EDIT TO INSERT THE MISSING 496 LINES, EACH IDENTICAL TO THE LINE ABOVE!

     1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1;
     1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1  1]
end

end #module

SnoopFile.jlに含まれるもの:

module SnoopFile

currentpath = dirname(@__FILE__)
Push!(LOAD_PATH, currentpath)
unique!(LOAD_PATH)

using TestBuildExecutable

println("Start of snoop file execution!")
TestBuildExecutable.Julia_main()
println("End of snoop file execution!")

end # module

新しいJuliaインスタンスでは、Julia_mainは最初の実行に8.3秒、2回目の実行に0.5ミリ秒かかります。

Julia> @time TestBuildExecutable.Julia_main()
sum(myarray()) = 10000
  8.355108 seconds (425.36 k allocations: 25.831 MiB, 0.06% gc time)
0

Julia> @time TestBuildExecutable.Julia_main()
sum(myarray()) = 10000
  0.000537 seconds (25 allocations: 82.906 KiB)
0

次に、build_executableを呼び出します。

Julia> using PackageCompiler

Julia> build_executable("d:/philip/source/script/Julia/jsource/TestBuildExecutable.jl",
                       "testexecutable",
                       builddir = "d:/temp/builddir15",
                       snoopfile = "d:/philip/source/script/Julia/jsource/SnoopFile.jl",
                       verbose = false)
Julia program file:
  "d:\philip\source\script\Julia\jsource\TestBuildExecutable.jl"
C program file:
  "C:\Users\Philip\.Julia\packages\PackageCompiler\CJQcs\examples\program.c"
Build directory:
  "d:\temp\builddir15"
Start of snoop file execution!
sum(myarray()) = 10000
End of snoop file execution!
[ Info: used 79 out of 79 precompile statements
All done

最後に、Windowsコマンドプロンプトで:

D:\temp\builddir15>testexecutable
sum(myarray()) = 1000

D:\temp\builddir15>

これは(私のストップウォッチによって)実行に8秒かかり、初回だけでなく、実行されるたびに8秒かかります。これは、実行されるたびにJITコンパイルを実行する実行可能ファイルと一致していますが、snoopファイルはそれを回避するように設計されています!

バージョン情報:

Julia> versioninfo()
Julia Version 1.2.0
Commit c6da87ff4b (2019-08-20 00:03 UTC)
Platform Info:
  OS: Windows (x86_64-w64-mingw32)
  CPU: Intel(R) Core(TM) i7-6700 CPU @ 3.40GHz
  Word_SIZE: 64
  LIBM: libopenlibm
  LLVM: libLLVM-6.0.1 (ORCJIT, skylake)
Environment:
  Julia_NUM_THREADS = 8
  Julia_EDITOR = "C:\Users\Philip\AppData\Local\Programs\Microsoft VS Code\Code.exe"
9
Philip Swannell

Windowsを使用しているようです。

ある時点で PackageCompiler.jl は、Windowsで試してみることができるようになります。

1
xiaodai

@xiaodaiによって提案されたように、ソリューションは確かにPackageCompilerXでの進行を待つことでした。

2020年2月10日、以前はPackageCompilerXだったものが新しい(バージョン1.0の)PackageCompilerになり、APIが大幅に変更され、ドキュメントがさらに詳しくなりました。

特に、上記のMWE( mutated for the new API to PackageCompiler )は、JITオーバーヘッドなしで正しく機能するようになりました。

1
Philip Swannell