web-dev-qa-db-ja.com

nltk.download()を使用したダウンロードエラー

Pythonを使用してNLTKパッケージを実験しています。 nltk.download()を使用してNLTKをダウンロードしようとしました。この種のエラーメッセージが表示されました。この問題を解決するには?ありがとう。

私が使用したシステムは、VMwareの下にインストールされたUbuntuです。 IDEはSpyderです。

enter image description here

nltk.download('all')を使用した後、いくつかのパッケージをダウンロードできますが、oanc_mascをダウンロードするとエラーメッセージが表示されます

enter image description here

15
user288609

特定のデータセット/モデルをダウンロードするには、nltk.download()関数を使用します。 punkt文のトークナイザーをダウンロードする場合は、次を使用します。

$ python3
>>> import nltk
>>> nltk.download('punkt')

必要なデータ/モデルがわからない場合は、データとモデルの基本的なリストから始めることができます:

>>> import nltk
>>> nltk.download('popular')

「人気のある」リソースのリストをダウンロードします。

NLTKの最新バージョンを使用していることを確認してください。これは常に改善され、常に維持されているためです。

$ pip install --upgrade nltk

編集済み

誰かがnltkから https://stackoverflow.com/a/38135306/610569 から大きなデータセットをダウンロードすることでエラーを回避している場合

$ rm /Users/<your_username>/nltk_data/corpora/panlex_lite.Zip
$ rm -r /Users/<your_username>/nltk_data/corpora/panlex_lite
$ python

>>> import nltk
>>> dler = nltk.downloader.Downloader()
>>> dler._update_index()
>>> dler._status_cache['panlex_lite'] = 'installed' # Trick the index to treat panlex_lite as it's already installed.
>>> dler.download('popular')

そして、誰かがnltk_dataディレクトリを見つけたい場合は、 https://stackoverflow.com/a/36383314/610569 を参照してください

nltk_dataパスを設定するには、 https://stackoverflow.com/a/22987374/610569 を参照してください

21
alvas

コマンドラインから、nltkをインポートした後、試してください

nltk.download('popular', halt_on_error=False)

エラーが発生すると、破損したパッケージを再試行するよう求められます。nで拒否するだけで、適切なパッケージで続行されます。

7
tolgayilmaz