web-dev-qa-db-ja.com

GoogleサイトリンクがPDFリンクに対して意味不明なのはなぜですか?

Googleがサイトリンクと共に適切にリストするWebサイトがあります。サイトリンクの1つ-PDFファイルへのリンク-は、人間以外のちんぷんかんぷんな

67,8;45:: 56 83 @7<1. (7/0;,*;: /59( (7/0;,;<7, <7)(60:4 (9<7 /+ +2, VU

PDFのタイトルプロパティが原因であると考えたため、変更しました。ただし、サイトリンクは改善されていません。

他のPDFサイトリンクは問題なく、必要に応じてtitleプロパティを表示します。

誰が私がこの問題を修正する方法を知っていますか、または原因は何ですか?私の知らない推測は、コードと表示テキストの間の音訳の問題であり、PDFファイルを何らかの方法で再調整する必要があることを意味します。わからない。

2
Tom

一部のPDFは、コンテンツの抽出を非常に困難にする方法で生成されます。通常、テキストの一部を強調表示して、テキストファイルにコピーアンドペーストすることで確認できます。このファイルでそれを行うと、同じ意味不明なものが表示されます。 PDFを再生成するだけで役立つ可能性があり、別のPDF作成者/ドライバーを使用する可能性があります。

以下に古い、関連するスレッドがあります(コピー&ペーストで意味不明です) https://stackoverflow.com/questions/2926159/copypasting-text-from-pdf-results-in-garbage - https://superuser.com/questions/137824/pdf-has-garbled-text-when-copy-pasting

このPDFを再生成できない場合、または再生成したくない場合は、Googleの検索結果から削除することをお勧めします。これは、サイトにとって実際には有用な結果ではないためです。これを行う簡単な方法は、 Webmaster ToolsのURL削除ツール を使用することです。

3
John Mueller