На моем веб-сайте есть раздел, доступ к которому ограничен для пользователей, зарегистрировавшихся с действительным адресом электронной почты. У меня есть запросы с поддельными электронными письмами, и я хочу избегать отправки электронных писем на несуществующие адреса, чтобы они не увеличили показатель отказов и не навредили моей репутации отправителей.
Электронные письма:
[email protected]
[email protected]
кВтQcHVzn%40ypEcDvh.NwB
У последнего есть %40
, объект HTML для @
. Электронные письма представляют собой усечения одной и той же последовательности символов.
Проверяя IP-адреса запросов с обратным DNS, все три запроса исходят от cache.google.com
. Если запросы исходят от поискового робота Google, я ожидаю, что эти адреса электронной почты будут задокументированы, но я не смог найти никаких ссылок.
В случае, если это поисковый робот Google, я хочу, чтобы он проиндексировал веб-сайт, избегая при этом отправки адресов электронной почты на поддельные адреса. Я уже реализовал фильтрацию по адресу в поисках этой последовательности символов.
Существует ли список поддельных адресов, которые поисковые роботы используют для доступа и индексации скрытых страниц?
Обновлять
После ответа и комментария, указывающего на проверка того, что Googlebot является поисковым роботом, я подтвердил, что это не так:
$ хост 212.113.167.197
197.167.113.212.in-addr.arpa указатель доменного имени cache.google.com.
$ host cache.google.com
Хост cache.google.com не найден: 3 (NXDOMAIN)
Так что действительно, это выглядит как злонамеренный пользователь, что объясняет, почему этот адрес электронной почты не задокументирован как исходящий от Google.