web-dev-qa-db-ja.com

プログラムで生成されたコンテンツでWebページのインデックスを作成する

そのため、サーバーレスブログを作成していますが、構成に基づいて発生する可能性のあるインデックス作成の問題を心配しています。私はインデックス作成の概念と技術にかなり精通していますが、クローラーが記事を確実にヒットできるようにする方法が心配です。

DynamoDBにアクセスし、記事(およびその他のメタデータ)の保存場所を示すテーブルにアクセスするホームページを作成し、各記事のホームページにカードを作成します。

問題は(すべてを正しく理解している場合)、サイトのXMLインデックスを作成するときに、記事へのリンクがプログラムでページに表示されるため、Googleに表示されないことです。リンクは、「そのまま」のHTMLページ(jsがまだページに入力していない)には含まれていません。

これは、スパイダーが私の記事に到達しないことを意味します。あなたの記事を見せたい場合は明らかに悪いです。

私の質問は:

私によるこの推測は正しいですか?これを回避する方法はありますか?新しい記事があるたびにホームページのHTMLを継続的に更新する必要はありません。他のブログはこれらのリンクを常にどのように維持しますか?特に長い間存在し、数百または数千の記事があるブログでは、機能を通じてコン​​テンツを埋める必要があります。

3
LindCloud

GoogleはJavaScriptを実行します ですので、JSで異常に奇抜なことをしているのでなければ、ページのレンダリングとインデックス作成は問題なく行われます。

ただし、あまり洗練されていない他の検索エンジンの場合は、プレーンHTMLで使用できるように、 コンテンツサーバー側の事前レンダリング が必要です。それ以外の方法はありません。