web-dev-qa-db-ja.com

colabからモデルをロードするときに「sklearn.svm._classes」という名前のモジュールはありません

Google colabでモデルをトレーニングし、ローカルマシンにロードしたいと思います。しかし、私はModuleNotFoundError: No module named 'sklearn.svm._classes'。 colabにモデルをロードしても問題ありません。

コラボ:

[1] import sys
    sys.version
'3.6.9 (default, Nov  7 2019, 10:44:02) \n[GCC 8.3.0]'
[2] import joblib
    import numpy as np
    from sklearn import svm
    clf = svm.SVC(gamma=0.001)
    clf.fit(np.random.Rand(9,8).astype(int), np.arange(9))
    joblib.dump(clf, 'simple_classifier')
[3] joblib.load('simple_classifier')

私のローカルマシン:

>>> import sys
>>> sys.version
'3.6.9 (default, Nov  7 2019, 10:44:02) \n[GCC 8.3.0]'
>>> import numpy as np
>>> import joblib
>>> from sklearn import svm
>>> joblib.load('simple_classifier')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "/home/.../ml-env/lib/python3.6/site-packages/joblib/numpy_pickle.py", line 605, in load
    obj = _unpickle(fobj, filename, mmap_mode)
  File "/home/.../ml-env/lib/python3.6/site-packages/joblib/numpy_pickle.py", line 529, in _unpickle
    obj = unpickler.load()
  File "/usr/lib/python3.6/pickle.py", line 1050, in load
    dispatch[key[0]](self)
  File "/usr/lib/python3.6/pickle.py", line 1338, in load_global
    klass = self.find_class(module, name)
  File "/usr/lib/python3.6/pickle.py", line 1388, in find_class
    __import__(module, level=0)
ModuleNotFoundError: No module named 'sklearn.svm._classes'
1
peer

joblibによるシリアル化は、インストールされたパッケージのバージョンがモデルを保存するプログラムとモデルをロードするプログラムの間で正確に同じ場合にのみ機能します。

表示されているエラーから、Colabとローカルマシンで異なるバージョンのscikit-learnを使用していると思います。関連するパッケージのバージョンが一致していることを確認すると、モデルのロードが機能するはずです。

詳細は https://joblib.readthedocs.io/en/latest/persistence.html を参照してください。

1
jakevdp

以下を使用してsklearnライブラリをアップグレードします。

pip install scikit-learn --upgrade

モデルが特定のバージョンのライブラリで構築され、他のバージョンでテストされたときに発生します。

0