web-dev-qa-db-ja.com

使いやすさ:StanfordCoreNLPとOpenNLP

個人的なプロジェクトに一連のNLPツールを使用したいと思っていたのですが、スタンフォード大学のCoreNLPの方が使いやすいのかOpenNLPなのか疑問に思いました。または、お勧めする別の無料パッケージはありますか?私はこれまでNLPを実際に行ったことがないので、概念を学び、アイデアのプロトタイプを作成するためにすぐに使用できるものを探しています。どんな助けでも大歓迎です。

28
Pratik Thaker

どちらが使いやすいかという私の意見には偏りがありますが、Ivan Akcheurovの回答に関しては、2010年10月にStanford CoreNLPをリリースしただけなので、それほど古くはありません。彼の提案に関しては、より高いレベルの処理フレームワークを使用するか、実際の処理ツールを使用するかによって異なるようです。たとえば、Knimeをざっと見てみると、含まれているNLPコンポーネントは実際には OpenNLPコンポーネント だけであり、機械学習のほとんどはラッピングです Weka ....グループの場合連携して動作する個々のツールのうち、Stanford NLP、OpenNLP、NLTK、およびLingpipeがおそらく主な選択肢です。

28

GATE(gate.ac.uk)をお勧めします:

GATE

  1. 言語:Java
  2. UIMAは統合をサポートしています
  3. ドキュメント:非常に優れたドキュメントです!映画のチュートリアルとトレーニングコース
  4. GUIがあります
  5. WordNet、Lucene、Google、Yahoo、Google翻訳、Wekaを使用する機能
  6. プラグインとしてLingPipeとOpenNLPの一部があります

OpenNLP

  1. 言語:Java
  2. SharpNLP(そのC-Sharpポート)
  3. UIMAは統合をサポートしています

LingPipe

  1. 言語:Java
  2. ドキュメント:無料の本のチュートリアル

NLTK

  1. 言語:Python
  2. ドキュメント:優れた無料の本
  3. コーパス:数十のコーパスデータ(〜850 MB)とwordnetなどのレキシコンを提供します。
14
htaghizadeh

スタンフォード大学は、オープンソースでもある1つのパッケージで複数のものを提供しているのでお勧めします。スタンフォードCoreNLPは

  1. StanFord Parser.
  2. Stanford POS Tagger.
  3. Stanford Named Entity Recognition
  4. Stanford Typed Dependencies. etc.

つまり、1つの傘の下で、複数のソリューションを取得できます。

3
Imran