web-dev-qa-db-ja.com

大きな結果セットでの2019年のページネーションの処理に関するコンセンサスは何ですか?

私の調査によると、ページ分割されたURLを1つに統合する古い方法はもう推奨されていません。

古い方法:

rel=prev/nextを使用しますが、

「Rel = prev/nextはもうインデックス信号ではありません」( Google WebmasterBlog

ページ付けされたページでnoindex,followを使用します、ただし:

「このページが検索で実際に使用されたくないと思うよりも長い間noindexが表示される場合は、完全に削除します。その後、リンクをたどることはありません。したがって、noindexとfollowは本質的に、noindex、nofollowと同じです。」 – John Mueller

これらのページはPageRankを配布せず、クロールからも除外される可能性があるため、これらのページの新しいリンクが検出されなくなります。

最初のページにrel = canonicalを使用しています、ただし:

「Googlebotは、チェーンに沿ってさらに表示されるページをインデックスに登録したり、それらのページからリンクされているコンテンツへのシグナルを承認したりしません」 SearchEngineJournal

これはnoindex,nofollow問題のように聞こえます。上記を参照してください。

「すべて表示」ページの使用、ただし:

これは、パフォーマンス上の理由により、何千ものリンクを表示するとしますが、大きなページには適用可能なソリューションではありません。


したがって、大きな結果セットの唯一の方法は、GoogleBotにいくつかのヒントを与えることを除いて、何もしないことです。

  • rel=prev/nextを使用すると、害がありません。
  • page=2などの標準URLパラメータを使用すると、簡単に認識できます。
  • タイトルにヒントを使用して、ページ分割を通知します。 Shoes - Page 2
  • すべてがうまくいくように。

問題:

ドメインに1000のカテゴリがあり、それぞれに20ページがある場合、これにより、古いメソッドを使用する場合の1000ではなく、20000のインデックス付きURLが生成されます。昔はこれは悪いと考えられていました。

今日それを行う方法についてコンセンサスはありますか?私はこれらの新しい開発に適応せず、古い方法に固執する非常に優れたパフォーマンスのドメインを見てきました。

7
rapstacke

私はページネーションを完全に取り除くことを検討します:

  • 検索エンジンには適していません。
    • 2ページを超えてリンクジュースを渡しません。
    • 追加の低品質のページが大量に作成されます。
  • ユーザーにとっては良くありません。
    • ごく一部のユーザー(5%未満)のみがページ分割を使用している
    • ページネーションを使用しているユーザーのうち、数ページを超えるユーザーはいない

検索エンジンとユーザーの両方にとって、大規模な製品カタログを処理するためのより良い方法があります。最新のサイトではページネーションは必要ありません。

ページネーションの代わりに何をすべきですか?

  1. ユーザーが必要とする可能性のある数よりも多くの製品を1ページに配置します。カテゴリーページに100製品を掲載することをお勧めします。
  2. 無限スクロールを実装します。無限スクロールは、ページ付けよりもユーザーにとって簡単です。検索エンジン用に低品質のページを作成することはありません。
  3. サイト検索を提供します。ユーザーは、無限のリストを参照するよりも、検索することを好みます。
  4. ファセットナビゲーションを実装します。ユーザーは、「100ドル未満」、「X機能付き」、「4つ星以上」などの属性で製品にドリルダウンできることを望んでいます。選択した属性が1つだけのファセットページを検索エンジンにクロールさせることができます。
  5. 各製品ページにリンクする他の方法を見つけます。製品ページが相互にリンクしている場合は、検索エンジンにとってはるかに優れています。多くのサイトでは、他の製品を強調するために、製品ページの「関連製品」、「これを購入した顧客も購入」、および「注目製品」セクションを使用しています。これはユーザーには役立ちますが、多くの場合、主に検索エンジンに使用されます。このため、このサイトの左側に「関連する質問」セクションがあります。

あなたがページネーションを実装するなら(そしてそれはおそらくプログラムするのがとても簡単なのでそうするでしょう)私は提案するでしょう:

  • 最初の選択:robots.txtにリストすることで、ロボットが2ページ目以降をクロールしないようにします。これは、これらのURLを/pages/で開始するなど、ページ2+に別個のプレフィックスを使用することを意味する場合があるため、Disallow: /pagesを使用できます。ページネーションはリンクジュースを効果的に渡さないので、これを行うために製品ページのランキングを傷つけることはありません。新しい詳細な製品ページが発見されるのを防ぎます。したがって、これを行う前に、他の製品ページからすべての製品ページへの他のリンクが絶対に必要です。
  • 2番目の選択肢:2+ページでnoindexを使用して、検索エンジンが低品質のページをインデックスに登録しないようにします。ページのクロールを防ぐことができない場合は、少なくともそれらがインデックスに登録されるのを防ぎます。
  • 3番目の選択肢:すべてのページを検索エンジンでクロールしてインデックスに登録します。すべての製品ページへの他のリンクを実装しない場合は、これを使用します。それは実際にあなたのSEOをそれほど傷つけません。検索エンジンがすべてのコンテンツを発見できるようになります。グーグルはおそらくページ付けページが低品質であることに気づき、とにかくそれらを索引付けしないことを選択するでしょう。検索エンジンはあなたのすべての製品ページを発見しますが、それらのほとんどはページネーションだけでインデックスを作成するのに十分なリンクジュースがありません。ほとんどの場合、1ページと2ページにリストされているものだけが索引付けされることを期待してください。 1ページ目以降のリンクのうち、サイトからそれらのページへの他のリンクを取得する方法が見つかるまで、インデックスが作成されても、ランクは低くなります。

ご指摘のとおり、rel=prev/nextはGoogleでは使用されていません。必要に応じて使用できますが、何も変更されません。

rel=noindex,followはGoogleと同じrel=noindex,nofollowになります。これは、Googleがインデックスに含まれていないページにリンクジュースを渡さないためです。私が述べたように、それはとにかく本当に重要ではありません。ページ3には、通過できるリンクジュースがほとんどありません。

最初のページへのrel=canonicalは機能しなくなります。最近Googleは、コンテンツがほぼ重複していないように見える場合、正規のシグナルを無視しています。リストされている製品は異なるため、ページ付けされたページ間の正規のシグナルは無視される可能性があります。

ページネーションとPageRankの詳細

Googleのページランク(PR)は、Googleツールバーを使用して0から10までの対数目盛で測定されていました。一般に、インデックスを付けるにはツールバーのページランク(tPR)が必要であり、競合する末尾の用語をランク付けするには2が必要です。 PRの計算を簡単にするために、私は通常線形リンクジュースユニット(LLJ)で作業します。

  • 0 tPR = 1 LLJ
  • 1 tPR = 10 LLJ
  • 2 tPR = 100 LLJ
  • 3 tPR = 1,000 LLJ
  • 4 tPR = 10,000 LLJ
  • ...

ページネーションがページ2を超えてPageRankを渡さないと言うとき、ページネーションの各ページは次のページにのみリンクしていると想定しています。その場合、何が起こるかを確認するのは非常に簡単です。ページ1のカテゴリページのtPRが3であるとします。LLJの1,000単位があり、そのうちの900は(PageRankダンピング係数により)通過できます。ページ1にちょうど21のリンク(製品への20とページ2へのリンク)がある場合、他の各ページのLLJは43またはtPRは1.6です。十分にインデックス化され、適切にランク付けされます。

ページ2には、合格するLLJが43あります。リンク先の各ページは、1.8 LLJまたは0.3 tPRのみを取得します。おそらく、製品ページを索引付けするのに十分ではありません。確かに、ページ3のPageRankは、意味のあるものをまったく渡すには不十分です。

すべてのページに10ページ区切りリンクを導入すると、計算にフィードバックループが存在するため、計算がはるかに困難になります。リンクグラフを作成し、それを介して複数の反復でフローを計算する必要があります。あなたも同様の状況に陥ります。ページ1からかなりの量のPageRankを取得する20の製品があります。ページ付け2〜11ページは同様の量のPageRankを取得し、それらがインデックスにリンクする200の製品を取得できる可能性があります。 10ページを超えると、シングルリンクモデルの3ページに似ています。

結局のところ、PRの計算は、ほとんどが学術的な演習です。 Googleが品質が低いと特定したものなど、他の要因が最終的に大きな役割を果たすことになります。 Googleは、ページングされたページが適切なランディングページにならないため、インデックスに登録しないことを選択する可能性があります。私の経験では、インデックスに登録されていないページは、noindexメタタグがある場合と同様に扱われるようです。つまり、PRを取得できたとしても、Googleがインデックスに登録したくないかどうかは問題ではありません。 PageRankを通過させることにはなりません。

6