web-dev-qa-db-ja.com

/ usr / share / dict / wordsの単語はどこから来たのですか?

/usr/share/dict/words には多くの単語が含まれています。このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?何を含める必要があるかを規定する標準はありますか?

これまでに確認できたのは、Ubuntu/Debianではリストが wordlist パッケージからのものであるということだけですが、それらの説明では、リストが実際に生成された方法についての手がかりは得られません。

8
Mark Amery

あなたは複数の質問をしているのですが、主な質問は次のとおりです。

何を含める必要があるかを示す標準はありますか?

私の知る限りではありません。

それを考えると、あなたの関連する質問:

このリストはどのように生成されますか?その内容は異なるUnices間で同じですか?

「それぞれのUnixに依存します」と答えます。

オペレーティングシステムの一部としてWordリストを含めるという規則は、 spell(1)ユーティリティ からのものです。チェック手順。

そのスペルチェック手順は、1982年のベル研究所のM. D.マキロイによる学術論文 「Developing of a Spelling List」に記載されています

オペレーティングシステムのパッケージマネージャーをチェックして、スペルリストの取得元、スペルリストの生成方法、および利用可能な代替手段を確認してください。

たとえば、Debian GNU + Linuxの場合:

  • /usr/share/dict/wordsファイルは、Debianの「代替」システムを使用して管理されるシンボリックリンクです。
  • そのリンクを提供する一般的なWordリストパッケージはwamericanパッケージです。
  • wamericanのパッケージドキュメントには、そのWordリストは SCOWL(スペルチェッカー指向のWordリスト) プロジェクトからのものであると記載されています。

他の多くのWordリストパッケージをインストールできます。それぞれに「Provides:wordlist」フィールドがあります。

$ aptitude search '?provides(wordlist)' | wc -l
34

異なるUnicesでは、Wordリストの由来と代替案を知るためにパッケージシステムとドキュメントを参照する必要があります。

8
bignose