web-dev-qa-db-ja.com

テキストの感情検出のためのデータセット

テキスト内の人間の感情を検出できるシステムを実装しています。教師あり学習およびテストに使用できる手動注釈付きデータセットはありますか?

ここにいくつかの興味深いデータセットがあります: https://dataturks.com/projects/trending

22
ekka

テキストの感情検出の分野はまだ非常に新しく、文献はさまざまな分野の多くのさまざまなジャーナルで断片化されています。そこにあるものをよく見るのは本当に難しいです。

心理学にはいくつかの感情理論があることに注意してください。したがって、コンピューティングで感情をモデリング/表現するさまざまな方法があります。ほとんどの場合、「感情」とは怒り、恐れ、喜びなどの現象を指します。他の理論では、すべての感情は多次元空間で表現できると述べています(したがって、感情は無限にあります)。

私が知っている(更新された)いくつかの(公開されている)データセットは次のとおりです。

  1. エモバンク。 Valence、Arousal、およびDominanceの値が付けられた1万文(開示:私は著者の1人です)。 https://github.com/JULIELab/EmoBank

  2. WASSA 2017共有タスクからの「ツイートの感情強度」データセット。 http://saifmohammad.com/WebPages/EmotionIntensity-SharedTask.html

  3. Preotiuc-Pietroおよびその他によるValenceおよびArousalのFacebook投稿: http://wwbp.org/downloads/public_data/dataset-fb-valence-arousal-anon.csv

  4. Cecilia Ovesdotter Almによる影響データ: http://people.rc.rit.edu/~coagla/affectdata/index.html

  5. CrowdFlowerによって設定されたテキストデータの感情 https://www.crowdflower.com/wp-content/uploads/2016/07/text_emotion.csv

  6. ISEAR: http://emotion-research.net/toolbox/toolboxdatabase.2006-10-13.2581092615

  7. SemEval 2007のテストコーパス(効果的なテキストに関するタスク) http://web.eecs.umich.edu/~mihalcea/downloads.html

  8. 感情を伴うSemEval Stanceデータの再注釈: http://www.ims.uni-stuttgart.de/data/ssec

このトピックをさらに詳しく知りたい場合は、以下のアンケートをお勧めします(開示:最初のアンケートを作成しました)。

  1. Buechel、S.&Hahn、U.(2016)。回帰問題としての感情分析—次元モデルと、感情表現およびメトリック評価に対するその意味。 ECAI 2016.22人工知能に関する欧州会議(pp。1114–1122)。オランダ、ハーグ(利用可能: http://ebooks.iospress.nl/volumearticle/44864 )。

  2. Canales、L.&&Martínez-Barco、P.(n.d.)。テキストからの感情検出:調査。第5回情報システム研究作業日(JISIC 2014)での処理、37(利用可能: http://www.aclweb.org/anthology/W14-6905 )。

37
buechel