web-dev-qa-db-ja.com

同義語をサポートするtxtまたはxmlファイルとしての英語辞書

誰かが私に英語の辞書をtxtまたはxmlファイルとしてダウンロードできる場所を教えてもらえますか?私は自分用のシンプルなアプリを作成していて、複雑なAPIを習得せずにすぐに使い始めることができるものを探しています。

同義語のサポートは素晴らしいでしょう。つまり、特定の単語のすべての同義語を簡単に取得できるはずです。

辞書に英国式と米国式の異なる単語のスペルがリストされているとしたら、それは絶対に素晴らしいことです。

小さな辞書(数千語)でも大丈夫ですが、必要なのは小さなプロジェクトだけです。

価格が手頃で、辞書が使いやすいのであれば、私も喜んで購入します。単純なXMLがあれば素晴らしいでしょう。

任意の方向をお願いします。

20
Simon

WordNet はあなたが望むものです。それは大きく、10万以上のエントリが含まれており、無料で利用できます。

ただし、XMLとしては保存されません。データにアクセスするには、選択した言語に既存の WordNet API のいずれかを使用する必要があります。

APIの使用は一般的に非常に簡単なので、「(a)複雑なAPIの学習」についてあまり心配する必要はないと思います。たとえば、 WordNet How to for Python based Natural Language Toolkit(NLTK)

 >>> from nltk.corpus import wordnet
 >>> 
 >>> # Get All Synsets for 'dog'
 >>> # This is essentially all senses of the Word in the db
 >>> wordnet.synsets('dog')
 [Synset('dog.n.01'), Synset('frump.n.01'), Synset('dog.n.03'), 
  Synset('cad.n.01'), Synset('frank.n.02'),Synset('pawl.n.01'), 
  Synset('andiron.n.01'), Synset('chase.v.01')]

 >>> # Get the definition and usage for the first synset
 >>> wn.synset('dog.n.01').definition
 'a member of the genus Canis (probably descended from the common 
 wolf) that has been domesticated by man since prehistoric times; 
 occurs in many breeds'
 >>> wn.synset('dog.n.01').examples
 ['the dog barked all night']

 >>> # Get antonyms for 'good'
 >>> wordnet.synset('good.a.01').lemmas[0].antonyms()
 [Lemma('bad.a.01.bad')]

 >>> # Get synonyms for the first noun sense of 'dog'
 >>> wordnet.synset('dog.n.01').lemmas
 [Lemma('dog.n.01.dog'), Lemma('dog.n.01.domestic_dog'), 
 Lemma('dog.n.01.Canis_familiaris')]

 >>> # Get synonyms for all senses of 'dog'
 >>> for synset in wordnet.synsets('dog'): print synset.lemmas
 [Lemma('dog.n.01.dog'), Lemma('dog.n.01.domestic_dog'), 
 Lemma('dog.n.01.Canis_familiaris')]
 ...
 [Lemma('frank.n.02.frank'), Lemma('frank.n.02.frankfurter'), 
 ...

WordNetにはアメリカ英語の偏見がありますが、イギリス英語のスペルと使用法をサポートしています。たとえば、「color」を検索でき、「lift」のシンセットの1つは「elevator.n.01」です。

XMLに関する注記

データをXMLとして表現することが不可欠な場合は、APIの1つを使用してWordNetデータベースにアクセスし、それをXMLに変換することが簡単にできます。 XMLの考え方:WordNetをXMLとしてクエリする を参照してください。

16
dmcer

私はこの質問がかなり古いことを知っていますが、それをtxtファイルとして見つけるのに問題があったので、誰かが同義語と反意語のtxtファイルデータベースを探しているなら、最も簡単で非常に詳細な試み https://ia801407.us。 archive.org/10/items/synonymsantonyms00ordwiala/synonymsantonyms00ordwiala_djvu.txt

8
pc_

私は過去に ロジェのシソーラス を使用しました。プレーンテキストファイルに同義語情報があります。テキストの解析に役立つJavaコードもあります。

これらのページには、無料でダウンロードできるシソーラス/語彙リソースへのリンクがあります。

http://www.w3.org/2001/sw/Europe/reports/thes/thes_links.html

http://www-a2k.is.tokushima-u.ac.jp/member/kita/NLP/Lex.html

3
hashable

WordNet を試してください。

2
Mark McDonald