web-dev-qa-db-ja.com

事前にトレーニングされたWord2vecモデルファイルをロードして再利用するにはどうすればよいですか?

事前にトレーニングされたWord2vecモデルを使用したいのですが、Pythonでロードする方法がわかりません。

このファイルはモデルファイル(703 MB)です。ここからダウンロードできます:
http://devmount.github.io/GermanWordEmbeddings/

7
Vahid

ロードするだけ

import gensim

# Load pre-trained Word2Vec model.
model = gensim.models.Word2Vec.load("modelName.model")

これで、通常どおりモデルをトレーニングできます。また、保存して複数回再トレーニングできるようにしたい場合は、次のようにする必要があります。

model.train(//insert proper parameters here//)
"""
If you don't plan to train the model any further, calling
init_sims will make the model much more memory-efficient
If `replace` is set, forget the original vectors and only keep the normalized
ones = saves lots of memory!
replace=True if you want to reuse the model
"""
model.init_sims(replace=True)

# save the model for later use
# for loading, call Word2Vec.load()

model.save("modelName.model")
9
AbtPst