web-dev-qa-db-ja.com

検索エンジンはハイフネーションされた単語をどのように処理しますか?

私のタイトルが私の言っていることを完全に説明しているのかわかりません。これは興味深い質問だと思いました。

ダッシュまたは2で区切られた一連のキーワードがあった場合、検索エンジンは破線の分割キーワードを完全なキーワードと見なしますか?

辞書サイトのように単語を分類するサイトがあるとします。そのため、そのページのキーワードは、ダッシュで区切られたページやURLで終わる可能性があります。

Key-Word = keyword
Co-op-er-at-ive = cooperative
Pho-to-gra-phy = Photography

www.example.com/key-Word/
www.example.com/co-op-er-at-ive/
www.example.com/pho-to-gra-phy/

検索エンジンはダッシュ(少なくともGoogle)をスペースと見なし、複数の単語として理解することを知っています。しかし、英語では、ダッシュで単語を分解することもできます(少なくとも、できると思いますが、できませんか?)。検索エンジンもこれを考慮しますか?私は「小さな」研究を行い、いくつかの単語をグーグルで検索し、ランダムなダッシュを配置し、検索した単語を返しましたが、これはGoogleの検索側のユーザーのタイプミスとみなされる可能性があるため、本当に意図的にできるのか疑問に思っていますキーワードにダッシュを入れて、検索エンジンのスパイダーがダッシュなしで実際の単語としてそのキーワードをまだキャッチしているか?

私は少しグーグルでここでStackoverflowを調べましたが、すべてが複数の単語でダッシュになりました。実際に私が理解しようとしている特定のことではありません。

うまくいけば、それは理にかなっていますが、私はまだSEOの専門家ではありませんが、基本を習得して遊んでいます。

3
NinjaKC

質問に答えました...

Googleを使用してこのページを具体的に検索した後、次のキーワード(またはその他のバリエーション)を使用して

http://webmasters.stackexchange.com :「キーワード」協力的な「写真」

このページが見つかりましたが、結果が少し下がっていることがわかります。 「協力的」と「協力的」である「強い」言葉は、残りを省きます。確実に一致させるには、スペースを「入力」する必要があります。したがって、「Pho-to-gra-phy」!=写真、Wordの各セクションが検索クエリでスペースまたはハイフンで分割された場合、予想どおり一致します。だから、私の質問に答えるのは、もしグーグルができないなら、それ以上試してみても意味がないからです。

あなたのサイトに単語の音節のハイフンを必要とする単語がある場合、または何らかの理由(OF 1 Word SPLIT UP、NOT MULTIPLE WORDS)でハイフンが必要な場合、元のWordのキーワードとしてクロールされません。これは私が知る必要があるすべてです。

プロンプトへの返信に感謝します。

1
NinjaKC

検索エンジンは通常、フレーズ全体ではなく、個別の単語にインデックスを付けます。したがって、あなたの例では、keyWordはインデックスしますが、keywordはインデックスしません。

ただし、検索エンジンは類義語にも精通しているため、Wordのハイフン化されていないバージョンが十分にある場合は、関連する可能性があります。

たとえば、key-Wordを検索すると、Googleは「もしかして:キーワード」と言い、keywordの結果を表示します。さらに、free-standingを検索すると、freestandingのMerriam-Websterの辞書エントリが検索されます。

2
DisgruntledGoat

一般的に言えば検索エンジンはダッシュ/ハイフン(-)を区切り文字として扱うため、指定された単語を複数のトークン(単語とほぼ同等)に分割します。例:

nineteenth-century = [nineteenth] [century]
blue-green = [blue] [green]

どの通常は、「Word」の検索が「key-Word」に一致する可能性があることを意味します。

一般的にハイフンでつながれた単語を見ると、ほとんどの場合、この理由は少し明確になります* ハイフンは、たとえばpigeon-hole vs pigeon holeのように、おそらく意味のある分離語を結合するために使用されます。それらを2つの別個のトークンとしてインデックス付けすると、「緑」での検索が「青緑」と正常に一致するようになります。これはおそらく人々が期待するものです。

多くの検索エンジンには、単語の近接度に基づいて検索を重み付けするために使用される追加のメカニズムがあります。たとえば、「キーワード」を検索すると、「これがキーワード」に対して一致し、 「重要なことは、それらがすべて単語であるということです」に対する一致。

エドが言うように-それは完全に実装にかかっています。

(*)証拠/データがまったくないことに基づいています。

0
Justin