web-dev-qa-db-ja.com

Googleの検索結果にキーワードスタッフィングのないウェブサイトよりもランキングの高いウェブサイトがあるのはなぜですか?

他のいくつかのウェブサイトと同様に、私は他の単語と比較してキーワードのバランスを維持しようとします。これにより、(最適化された)Webサイトと(キーワードが詰められた)競合他社のWebサイトのテストを実行しました SEO tools/Keyword Analyzer

さらにすごいのは、人々が検索する正確なフレーズ( " bloke and 4th ")には、Wordの検索エンジンが無視する単語が含まれていることです。 結果 を見てください。

そして...

Keyword Analysis

ご覧のとおり、上位のWebサイトにはスパムインジケータが添付されていますが、私のサイトにはありません。

それでは、多くのスパムインジケータを備えた1つのWebサイトが、スパムインジケータを備えていないWebサイトよりも上位にランクされるのはなぜですか?グーグルは自分のページに加えたすべての変更で、実際にキーワードの詰め込みを促進し始めていますか?

11
Mike

これは簡単です。キーワード密度は神話です。少なくとも今はそうです。

重要なのは、用語の使用方法であり、用語の使用回数ではありません。 SEOは意図的に問題を混同して、あなたがそれらに依存し続け、ツールとアドバイスにお金を払うようにします。 P.T.バーナムは、かつて毎分生まれた吸盤がありますと言っていました。 SEOでは、サイドショーはすべてのオンラインアドバイスのようです。さらに悲しいことに、SEOはPageRankよりもゆっくりと移動し、サハラ砂漠で成長する草よりもはるかに遅くなります。そもそも彼らが間違っていたとしても、それらは古い概念から簡単に外れません。

これは、サイト上の用語の重み付け方法に関するミニチュートリアルです。これは、一気に説明するものではなく、説明です。 SEOがどのように機能するかをよりよく理解するために取る価値のある旅行です。

セマンティクスを使用してサイトの用語とトピックの重み付けを行う前に、キーワードの重み付けでは、titleタグ、ヘッダータグ、descriptionメタタグなどのタグでの用語の使用と配置、および相互および重要なタグとの近接性、重要性を示すことの一部は、用語、同義語、補完的な用語の使用、およびこれらの用語がどの程度顕著に見えるかでした。これはキーワード密度の概念にいくらか従い、用語の比率はページのトピックを決定するために適用されましたが、用語の高いまたは低い比率ではなく、一般的な用語、反復的な用語、不自然なこれらの用語比率はページごとに自動的に評価され、結果は運用領域内にあるかどうかを決定する計算と一致しました。すべてのことを言い終えると、用語は、後述するセマンティクスを使用してトピックとトピックの範囲を決定しました。しかし、密度は検索ランク自体に影響を与えませんでした」というよりは、むしろトピックと一致する検索意図です。セマンティックリンクを介して決定されたプロファイルに同じ用語が適合し、検索意図の決定に使用されたため、偶発的に特定の密度の用語に一致します。これは、一部はまだ存在するパーサーモデルに従いましたが、モデル全体ではありません。もう違います。

セマンティクスは今日の主要なモデルですが、Webは従来のテキストモデルに従っているため、パーサーモデルを完全に削除することはできません。その理由は簡単です。それはまだ適用され、理にかなっており、非常に便利です。

セマンティクスは、より複雑なセマンティックモデルでは「リレーショナルチェーン」について実際に話している場合でも、「リレーショナルペアリング」として説明できます。これはセマンティックリンクとして知られており、セマンティックリンク間の関係はセマンティックウェブとして知られています。 。説明のために、セマンティクスはかなり速くなりますが、単純なペアのままにします。したがって、私の説明では、かなり物事を単純化しすぎます。

リレーショナルペアリングは、トリプレットの単純な概念です。主語、述語、目的語。述語は、主語と目的語の間の表現である限り、何でもかまいません。

私は初期のPageRankモデルから逸脱します。私に固執してください。適用されます。

Googleが考案されたとき、ページランクの概念は、セマンティクスを使用した信頼ネットワークのかなり単純な表現でした。 1つのページから別のページへのリンクが作成されます。この場合:

Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com

Subject: exampleb.com
Predicate: trusts
Object: examplec.com
Read as: exampleb.com trusts examplec.com therfore examplea.com trusts examplec.com

上記の「したがって」条項は必ずしも真実ではないことがわかっていますが、これは初期のモデルであり、絶対に真実ではありませんが、ある程度真実です。 examplea.comにはexamplec.comの知識がないため、examplec.comを完全に信頼できないことがわかっています。それでも、説明する必要がある関係が存在します。

ページランクという用語の初期の使用は、ページごとに-リンクごとに計算されましたが、サイト全体に適用されました。 exampleb.comの場合、信頼リンクはいくつありますか? PageRankは、サイトのページへのリンクのかなり単純な計算でした。しかし、これには明らかな問題がありました。リンクを作成して、サイトの重要性を人為的に高めることができます。計算にはこれを修正できるかなり標準的な減衰率が含まれていましたが、減衰率自体は新しい問題を提起しました。自然な傾きは計算に曲線を持っているため、単一の減衰率が実際の値を完全に説明できないという点です。

信頼モデルをさらに使用して、ドメインは信頼を示す要因に基づいて重み付けされました。たとえば、最大の信頼指標はサイトの年齢です。一般に、古いサイトは信頼できます。一貫した登録、一貫したIPアドレス、品質レジストラ、品質ネットワーク(ホスト)を備えたサイトには、スパム、ポルノ、フィッシングなどの履歴はありません。すべて信頼を示しています。私は50を超えるドメインの信頼要素を数えているので、これらをスキップし、シンプルに保ちます。

Subject: examplea.com
Predicate: domain trust score
Object: 67

Subject: exampleb.com
Predicate: domain trust score
Object: 54

Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com

別の計算を使用すると、単なるバイナリではなく、あるレベルの信頼を作成できます1つのサイトが別のサイトを信頼する。最初の例が信頼を渡した場合、2番目の例は、計算方法に比例した信頼値を渡します。

ここで、PageRankはページごとに計算され、TrustRankはSiteRankの過半数であり、そのリンク、リンク品質、リンク値はすべて、元よりもはるかに重要ではなく、サイトの信頼スコアよりもはるかに小さいことを理解してください。これを覚えておいてください。

これはページ上のキーワードにどのように適用されますか??

すべてのコンテンツ用語が重み付けされますが、一部のタグ用語のみが重み付けされます。 1つの主な例は、keywordsメタタグです。私たちは皆、このタグ内の用語にまったく重みがないことを知っています。実際、それは完全に無視されます。 1つの誤解は、descriptionメタタグがSEOにカウントされないことです。本当じゃない。このタグ内の用語には重みがありますが、比較的低いです。説明メタタグには価値があります。理由は少しわかります。

古いパーサーモデルにはまだ価値があります。この場合、ページは上から下に読み込まれ、タグとコンテンツブロックは上から下のモデルに従って重要度を評価する値を使用して読み込まれ、重み付けされます。一部のメトリックは静的です。たとえば、titleタグの重要度スコアは、h1タグよりも高く、h2タグなどよりも高くなります。descriptionメタタグの重要度メトリックはかなり高くなります。どうして?なぜなら、それはまだページが何であるかの重要な指標だからです。ただし、タグにある用語にはほとんど重みがありません。これは、検索意図の一致がdescriptionタグおよびh1タグとほぼ同じくらい簡単にtitleメタタグに一致するように行われますが、システムをゲームするためにあまりにも大きく操作することはできません。適用できる条件があることに注意してください。たとえば、検索は、主にdescriptionタグまたはh1タグまたはコンテンツ内で一致しない限り、titleメタタグとは一致しません。

パーサーモデルを続けて、実際のコンテンツの開始点を想像してください。近接度は、さまざまな方法で使用される尺度です。 1つは、用語、タグ、コンテンツブロックなどが、コンテンツの先頭のそのポイントに関連する場所です。ここで、ヘッダータグをサブトピックの指標と考え、ヘッダータグの直後にあるコンテンツの先頭のポイントが次のヘッダータグで終了することを想像してください。再び近接度が測定されます。近接性は、段落内の用語、段落のセット、headerタグなどの間で測定されます。これらの測定値は、用語の使用方法と見かけの重要性の用語の重みとして計算されます。これを超えて、用語、フレーズ、引用、およびコンテンツの実際に類似した部分は、ページモデルとサイト間でわずかに異なるが類似した近接モデルを使用して測定できます。

ページは、ページからページへのリンクと、ホームページまたはリレーションシップクラウドを決定できる他のページからの近接性の両方を使用して関連付けられます。たとえば、SEOのトピックページには、複数のSEOサブトピックページへのリンクを含めることができます。これは、SEOのトピックページがいくつかの類似したトピックページにリンクし、関係クラウドを決定できるという点で重要であることを示します。したがって、SEOサブトピックページの場合、近接度は、SEOトピックページとSEOサブトピックページ間のリンクの数、およびホームページからのリンクの数になります。これで、ページの重要度を計算できます。 SEOトピックページはどれくらい重要ですか?これは、ホームページのナビゲーションリンクからの1つのリンクであり、実際にはすべてのページであり、非常に重要です。ただし、SEOサブトピックページにはナビゲーションからのリンクがないため、SEOトピックページのメトリックから重要度を取得します。これは、PageRankセマンティックリンクトラストネットワークモデルに従います。

元のPageRankモデルに戻ると、リンクがWorld Wide Web全体に価値をもたらすように、ページへのリンク方法でページを評価できます。これはスカルプティングと呼ばれますが、過度の操作的スカルプティングを決定して無視できるので、自然です。これを行うと、これらのページにある用語の重要性も示します。したがって、ページ上の用語は、そのページのどこでどのように使用されているかだけでなく、サイト上のどのように、どこに存在するかでのページの見かけ上の重要性にも重み付けされます。意味を持ち始めていますか?

はい。まあ良いですが、用語はどのように関連しており、セマンティクスはこれにどのように役立ちますか?繰り返しますが、非常にシンプルに保ちます。

車に関するサイトがあります。あなたは英国にいて、自動車に関するサイトを持っています。車と自動車が同じことばであることはかなり明白です。検索エンジンは辞書を使用して、単語とトピックの関係をよりよく理解します。 Googleは早期に自己学習辞書を作成することで差別化を図りました。私はそれには入りませんが、あなたはまだ写真を取得します。セマンティクスの使用:

Subject: cars
Predicate: equals
Object: automobiles

これで、Googleは私のサイトとあなたのサイトがほぼ同じものであることを把握できます。さらに一歩進んでください。

Subject: car
Predicate: is painted
Object: dark red

Subject: automobile
Predicate: is painted
Object: maroon

Subject: deep red
Predicate: equals
Object: maroon

これらの2つのサイトのみが存在すると仮定すると、深紅の自動車を検索すると深紅の自動車および深紅の自動車になりますが、 深紅の自動車はWeb上に存在しません。

SEOの初期には、同義語と用語の複数バージョンを使用することが推奨されていました。これは、セマンティクスが使用されなかったか、同じくらい強力だったときに戻ってきました。今日、単語と使用法との関係はセマンティクスデータベースに保持されているため、これは必要ないことがわかります。

同じモデルを使用しますが、かなり先に進みます。他のいくつかのWebページで引用されている素晴らしい作品を書くと、セマンティクスはこれを引用として認識し、これを私のオリジナルの作品に帰することができます。すべてのページ。この場合、インバウンド(バック)リンクのないページは、単に引用のために、多数のインバウンド(バック)リンクのあるページよりも上位に表示されます。引用は、セマンティックWebをWorld Wide Webに適用する重要な部分です。実際、SEOが魅力的なAuthorRankを追いかけている間、そのようなことはありませんでした。すべてのセマンティクスとデータペアマッチングには入りませんが、たとえばwritten byは著者名がすぐに続くことを示しているため、引用クレジットは作品が引用されている場合、著者に適用されます。

なぜ私はこれをすべて経験したのですか??

簡単にわかるように、サイトの用語を評価するメカニズムははるかに複雑であり、密度に依存しなくなりました。実際、密度はもはや二次的な影響ではありません。この単純な理由。簡単にゲームをプレイでき、元のPageRankスキーマのように減衰率でゲームを補うことはできませんでした。

キーワードを詰め込んだサイトに関しては、セマンティクスがそれらを提供するのは時間の問題です。 Pandaは、これや他の類似のものを測定し、メトリックを調整してSERP内の問題のあるサイトの影響をダウングレードするために特別に設計された定期的なタスクとして始まりました。通常、SiteRankは同じままですが、スパムが見つかったサイトは、TrustRankスコアに違反があったため、SiteRankをわずかにダウングレードします。このメカニズムには、軽微な犯罪を害することなく修正できる重大な要素があると思います。このノックは、問題が解決した場合でも残ります。これは、違反がサイトの履歴に保持されるためです。そのため、SERPの配置は、SERPの配置が再び上昇し始めるが問題のあるサイトがかつて持っていたレベルにまで上昇しなくなるという問題が解決されるまで、配置が低下します。違反の表記。違反が古くなればなるほど、それまでの犯罪が時間の経過とともに悪影響を失うことを許すことが許されます。ちなみに、パンダなどはより頻繁に実行され、現在も継続的なプロセスであると言われていますが、サイトが犯罪者であるかどうかを知るためにセマンティックリンクマップを作成するにはまだ時間がかかります。これは、サイトが一定期間スタッフィングを回避することを意味しますが、セマンティックリンクとメトリックが完全に確立されると最終的に失敗します。同様に、スタッフィングには最初の効果があると確信していますが、セマンティックモデルを使用すると大幅に減少し、副産物のように表面的な効果になります。これは、ページが検出されたときに、セマンティックリンクマップが記入されるまで進むことがほとんどないためです。 Googleは、賢明なことにある程度の猶予を許可しているため、SERP内で適切に配置される前に、最初に重要なシグナル内の用語でページのランクを高くすることができます。信号がセマンティクスに一致すると仮定すると、SERP配置を再計算すると、ページの検出方法に相対的なシフトが生じます。それ以外の場合、信号とセマンティクスが一致しない場合、SERP内の配置はセマンティクスに基づいて行われ、ページの検出方法が変更されます。このため、キーワードとタグを正確かつ正直に使用して、最初に正しい信号を送信することが重要です。

[更新]

この回答をTextRazorにカットアンドペーストしました https://www.textrazor.com/demo で、これが例です。表のコンテンツおよびその他の言語分析の先頭にあるその仮想ポイントに対する相対位置と、右側のトピックスコアが表示されます。この回答のテキスト(このアップデートより上)を切り取り、デモページに貼り付けて少し遊んでみても、同じことができます。私はそれを奨励します。コンテンツがどのように処理されるかを知ることができます。

TextRazor example of this answer.

12
closetnoc