web-dev-qa-db-ja.com

googlebotがSSHサーバーからrobots.txtを要求するのはなぜですか?

サーバーでossecを実行すると、定期的に次のような警告が表示されます。

Received From: myserver->/var/log/auth.log
Rule: 5701 fired (level 8) -> "Possible attack on the ssh server (or version gathering)."
Portion of the log(s):

Nov 19 14:26:33 myserver sshd[2105]: Bad protocol version identification 'GET /robots.txt HTTP/1.1' from 66.249.73.226

IPアドレスは常にグーグルクローラーに対応します。しかし、なぜ世界でgooglebotがSSHサーバーのインデックスを作成しようとしているのでしょうか。 SSHは標準のよく知られたポート(22)で実行されるため、GoogleはそこでWebサーバーを探すよりもよく知っているようです。そして、私たちは間違いなく、そうでないことを信じさせるようなリンクを公開していません。

3
Brian

グーグルで<Your IP>:22を検索しましたか?あなたが言うようにあなたはそれをどこにも公開していないと確信していますが、古い馬鹿なら誰でもgooglebotが気付くことができる場所へのリンクを張ることができます。しばらくの間、このIPブロックを使用しましたか?

グーグルが以前に話していた「ダークウェブ」について何かを始めている可能性ははるかに低いようです(一般的にファイアウォールのないポートでステルスウェブサーバーを検索しています)。

役に立たない答えがあります 質問 数年前のGoogleのフォーラムで、誰かがメールサーバーでそれを見ていました。

3
Bill McGonigle