Почему ваш сайт тормозит и теряет SEO позиции: проблема, о которой молчат - Блог eByeBots

Вы можете вкладываться в SEO, улучшать контент, работать над скоростью сайта — но при этом всё равно видеть падение позиций. Причина часто скрыта от глаз: как заблокировать ИИ-ботов на сайте — этот вопрос всё чаще задают владельцы ресурсов, сталкиваясь с необъяснимой нагрузкой. На первый взгляд всё выглядит нормально: есть трафик, идут переходы. Но если копнуть глубже, выясняется, что значительная часть посещений — вовсе не от людей.

В 2026 году сайты всё чаще сталкиваются с потоком ботов: парсеры, сканеры и нейросети. Они создают нагрузку, искажают аналитику и напрямую влияют на SEO.

Особенно опасно то, что эту проблему сложно заметить сразу. Метрики могут выглядеть “живыми”, но при этом:

растёт показатель отказов
падает конверсия
ухудшаются позиции в поиске

Отдельная история — боты нейросетей. Они массово собирают контент для обучения, практически ничего не отдавая взамен. В результате сайт тратит ресурсы, но не получает реальной пользы.

И главное — стандартные способы защиты, которые раньше работали, сегодня либо неэффективны, либо требуют сложной и рискованной настройки.

В этой статье разберём:

кто на самом деле заходит на ваш сайт
почему боты — это не просто нагрузка, а реальные потери
какие методы защиты используют и где они не справляются
и какой подход действительно работает сейчас

Доля бот-трафика и реальных пользователей на сайте в процентном соотношении — Сравнение доли ботов и реальных пользователей на сайте

Кто на самом деле заходит на ваш сайт и почему это важно

Вы открываете Яндекс Метрику: визиты, просмотры, время на сайте — вроде бы всё гладко. Но спросите себя: сколько из этих цифр — реальные люди, а сколько — роботы?

Проблема в том, что Яндекс Метрика показывает далеко не всех. Боты без JavaScript — а это почти все краулеры нейросетей (GPTBot, Claude, PerplexityBot) — просто не загружают счётчик. Они сканируют ваш сайт тысячами запросов, грузят сервер, воруют контент, но в отчётах вы их не видите.

Одновременно с этим в Метрику попадают другие ИИ-боты — те, что запускают полноценный браузер (например, ChatGPT-User в режиме просмотра страниц, некоторые парсеры с Headless Chrome). Они создают видимость активности: кликают по ссылкам, «читают» текст, но не приносят заказов. Ещё хуже — боты для накрутки поведенческих факторов (ПФ). Они имитируют действия человека: скроллят страницу, задерживаются на ней, иногда даже «кликают» на кнопки. В результате Метрика показывает хороший «вовлечённый» трафик, но конверсия при этом стремится к нулю.

Итог — полная иллюзия:

Вы видите растущие метрики — радуетесь.
На деле — нагрузка на сервер, искажённая аналитика и падение реальных продаж.

ИИ-боты потребляют ресурсы сервера, практически не возвращая посетителей. Давайте приведу наглядное сравнение:

Инфографика «Сравнение нагрузки ИИ-ботов и реальных визитов» в светлом дизайне. Слева приведен список ботов в двух категориях: «Боты нейросетей (высокая нагрузка, скрыты)» (ClaudeBot, GPTBot, PerplexityBot) и «Традиционные поисковики (полезный трафик, видимы)» (Microsoft Bing, Яндекс, Поиск Google) — Сравнение нагрузки от ИИ-ботов и традиционных поисковиков: колоссальная разница в эффективности. Эта инфографика наглядно демонстрирует диспропорцию между ресурсами, потребляемыми ботами нейросетей, и реальным трафиком, который они приносят.

Почему попытки заблокировать ботов вручную — это лотерея с негарантированным результатом

Увидев в логах сервера (ведь в Метрике вы их не замечали) тысячи запросов от ClaudeBot или GPTBot, большинство вебмастеров делают одно и то же: гуглят «как заблокировать бота нейросети» и получают советы добавить IP‑диапазоны в .htaccess или прописать правила в Nginx.

Выглядит просто. Но на практике это путь к хронической усталости, потерянному времени и, что хуже, — к реальным сбоям сайта.

Подход 1: Героический, но самоубийственный — .htaccess

Вот типичный сценарий:

Вы находите «свежий» список IP‑сетей OpenAI (например, 132.196.86.0/24, 172.182.202.0/25…). Копируете 20–30 строк в .htaccess.
Через пару дней замечаете, что сайт стал ощутимо тормозить. Потому что при каждом запросе Apache теперь проверяет IP посетителя против всех этих диапазонов.
Вы добавляете ещё 50 правил для ClaudeBot — тормоза усиливаются. На shared‑хостинге сайт может начать выдавать timeout.
Случайно ошибаетесь в синтаксисе (забыли Deny from или поставили лишний пробел) — и весь сайт падает с ошибкой 500. Восстановление: лезть в FTP, править файл, надеяться, что хостинг не наложил блокировку.

Результат: сайт медленный, хрупкий, а боты всё равно пролезают — они меняют IP быстрее, чем вы обновляете списки. А про DDoS‑атаки на уровне L3/L4 можно забыть — .htaccess их не остановит.

Скриншот системного сообщения «500 Внутренняя ошибка сервера» на белом фоне с текстом на русском языке о возможной проблеме в файле .htaccess. — Типичный вид ошибки 500 при возникновении критического сбоя на стороне сервера, например, из-за опечатки в конфигурационном файле\

Подход №2: Для «продвинутых» — Nginx на VPS

Вы переезжаете на VPS, ставите Nginx и начинаете писать правила. Это уже не .htaccess, но проблем меньше не становится.

Пример блокировки по User-Agent (самый наивный способ):

if ($http_user_agent ~* (GPTBot|ClaudeBot|PerplexityBot|CCBot)) {
return 403;
}

На первый взгляд просто. Но боты быстро меняют User-Agent на «Mozilla/5.0…» — и правило перестаёт работать. Накрутчики ПФ и вовсе используют реальные браузеры с подменой fingerprint.

Пример блокировки по IP-диапазонам (чуть надёжнее, но муторно):

location / {
deny 132.196.86.0/24;
deny 172.182.202.0/25;
deny 172.182.204.0/24;
# … и так ещё 200+ строк для одного только GPTBot
allow all;
}

Списки IP у OpenAI, Anthropic, Perplexity обновляются регулярно. Вам нужно:

Мониторить официальные источники
Скачивать новые диапазоны.
Вручную вносить их в конфиг.
Перезагружать Nginx.

Одна опечатка в CIDR — и вы либо пропускаете бота, либо случайно блокируете обычного пользователя.

Бот DeepSeek с человеком подобным User-Agent

Многие ИИ-боты, вроде GPTBot, используют уникальные User-Agent (например, Mozilla/5.0 (compatible; GPTBot/1.2; +https://openai.com/gptbot)), что позволяет легко их идентифицировать и заблокировать.

DeepSeek действует иначе и гораздо опаснее. Этот бот намеренно маскируется под обычного пользователя, подменяя свой User-Agent на стандартный браузерный. Обнаружить его стандартными методами по заголовкам практически невозможно.

К тому же, DeepSeekBot — это распределённая система. Его запросы могут идти не с одного IP, а из огромного пула адресов по всему миру. Хотя большая часть трафика идёт из Гонконга, известны случаи, когда активность фиксировалась и с IP-адресов из Сингапура.

Давайте посмотрим с каким данными заходит этот бот:

Даем задачу DeepSeek зайти на наш сайт, чтобы посмотреть его данные — Сейчас узнаем с какого айпи и User Agents заходит бот

Вот что у нас получилось, бот зашел на несуществующую страницу:

Отображения бота DeepSeek в логах аналитики eByeBots — С такими данными отображается бот DeepSeek

Юзер агент Mozilla/5.0 (X11; Linux x86_64; rv:142.0) Gecko/20100101 Firefox/142.0
Айпи: 94.74.125.208
Название провайдера: Huawei-Cloud-HK
Хост: ecs-94-74-125-208.compute.hwclouds-dns.com
ASN: 136907

При правильном подходе можно заблокировать по:

ASN сеть / страну — на сервере должна быть база GeoLite2 (в нашем сервисе она есть)

диапазону айпи — скачать тут: https://2ip.ru/as/136907.json через тот же ИИ можно создать список в формате:

deny айпи
deny сеть

заблокировать по user agent — Linux совпадению, если сайт у Вас не на IT тематику, то обычно все сидят с ОС Windows
или воспользоваться нашим сервисом — где под ключ настроим фильтрацию от спам ботов в короткие сроки

Топ-25 ботов, создающих нагрузку на сайт

Важно: Meta Platforms Inc. (владелец Facebook и Instagram) признана экстремистской организацией и запрещена на территории РФ.

Боты ИИ (AI Crawlers)

Бот (Оператор)	Назначение (источник нагрузки)	Полный User-Agent (UA) строка
GPTBot (OpenAI)	Сбор обучающих данных для моделей GPT. Может генерировать до 98.8% всего трафика, создавая огромную нагрузку.	`Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.3; +https://openai.com/gptbot)`
ChatGPT-User (OpenAI)	Выполнение прямых запросов пользователей ChatGPT в реальном времени (RAG). Частота запросов выше, чем у GPTBot.	`Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot`
ClaudeBot (Anthropic)	Сбор данных для обучения моделей Claude. Жалобы на почти миллион запросов в день, что равно всему обычному трафику сайта.	`Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com)`
Meta-ExternalAgent (Meta*)	Сбор данных для обучения ИИ-моделей Meta (LLaMA). По данным Fastly, на долю Meta приходится 52% всего AI-трафика в сети.	`meta-externalagent/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler)`
Bytespider (ByteDance)	Индексация для поисковых сервисов ByteDance (TikTok). Известен агрессивным краулингом, иногда превышающим 1.4 млн запросов в день.	`Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; spider-feedback@bytedance.com)`
CCBot (Common Crawl)	Архивация веба. Данные этого некоммерческого архива используются почти всеми LLM для обучения. Блокируя одного этого бота, вы отсекаете десятки моделей.	`CCBot/2.0 (https://commoncrawl.org/faq/)`
PerplexityBot (Perplexity AI)	Индексация для ИИ-поисковика Perplexity. Сканирует сайты для генерации ответов с цитированием источников.	`Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)`

SEO-сканеры (SEO Crawlers)

Бот (Оператор)	Назначение (источник нагрузки)	Полный User-Agent (UA) строка
MJ12bot (Majestic)	Массовое сканирование для построения карты ссылок (бэклинков). Самый блокируемый SEO-бот в мире (6.49% сайтов).	`Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/)`
SemrushBot (SEMrush)	Сбор SEO-данных (ключевые слова, структура сайта) для конкурентного анализа. Входит в тройку самых блокируемых ботов.	`Mozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html)`
AhrefsBot (Ahrefs)	Сбор данных для индекса бэклинков и SEO-инструментов Ahrefs. Очень активный crawler, входит в топ-3 по частоте блокировок.	`Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/)`
BLEXBot (WebMeUp/Blex)	Сбор данных для обратного индексирования ссылок. Владельцы сайтов жалуются на «постоянное, бесконечное» сканирование.	`Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/)`
DotBot (Moz)	Сбор данных для индекса ссылок Moz, расчета метрик Domain Authority и Page Authority. Входит в топ-5 блокируемых ботов.	`Mozilla/5.0 (compatible; DotBot/1.2; +https://opensiteexplorer.org/dotbot; help@moz.com)`
DataForSeoBot (DataForSEO)	Сбор SEO-данных для сервисов клиентов. Активность этого бота не всегда очевидна, но он постоянно присутствует в логах.	`DataForSeoBot`
Barkrowler (Babbar.tech)	SEO-анализ: сбор данных о структуре страниц и метаданных для построения графа ссылок.	`Mozilla/5.0 (compatible; Barkrowler/0.9; +https://babbar.tech/crawler)`

Специализированные и прочие боты

Бот (Оператор)	Назначение (источник нагрузки)	Полный User-Agent (UA) строка
PetalBot (Huawei)	Поисковый робот, который может «наводнять» сайты запросами, предоставляя мало контроля для веб-мастеров.	`Mozilla/5.0 (Linux; Android 7.0;) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; PetalBot; +https://webmaster.huawei.com/portal/help/faq?id=petalBot)`
Amazonbot (Amazon)	Робот для индексации контента, используемый сервисами Alexa и Amazon. Может генерировать миллионы запросов, создавая значительную нагрузку.	`Mozilla/5.0 (compatible; Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)`
Applebot-Extended (Apple)	Сбор данных для обучения Apple Intelligence. Создает дополнительную нагрузку, сравнимую с другими крупными AI-ботами.	`Mozilla/5.0 (Device; OS_version) AppleWebKit/WebKit_version (KHTML, like Gecko) Version/Safari_version Safari/Safari_version (Applebot-Extended/0.1; +http://www.apple.com/go/applebot)`
cohere-ai (Cohere)	Сбор данных для RAG (Retrieval-Augmented Generation) и ответов чат-бота. Создает всплески запросов каждые 5–7 дней.	`cohere-ai`
AI2Bot (AI2)	Сбор данных для разработки открытых языковых моделей. Относится к «хорошим» ботам, но всё же создает нагрузку.	`Mozilla/5.0 (compatible; AI2Bot; +https://allenai.org/policies/ai2bot)`
Diffbot (Diffbot)	Преобразование веб-страниц в структурированные данные. Активность этого бота может сильно нагружать сервер.	`Mozilla/5.0 (compatible; Diffbot; +http://www.diffbot.com)`
ImagesiftBot (Imagesift)	Специализированный парсинг и индексация изображений. Может стать проблемой для сайтов с большим количеством графики.	`Mozilla/5.0 (compatible; ImagesiftBot; +imagesift.com)`
Pinterestbot (Pinterest)	Индексация изображений и контента для рекомендаций. Создает дополнительную нагрузку на сервер, особенно на сайтах с картинками.	`Pinterest/0.2 (+https://www.pinterest.com/bot.html)`
BLEXBot (WebMeUp/Blex)	Сбор данных для обратного индексирования ссылок. Владельцы сайтов жалуются на «постоянное, бесконечное» сканирование.	`Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/)`
rogerbot (Moz)	Еще один бот от Moz, используемый для краулинга при SEO-аудите сайтов.	`rogerbot/1.0 (http://moz.com/rogerbot)`
SiteAuditBot (Semrush)	Специализированный бот от Semrush для проведения технических аудитов сайта.	`Mozilla/5.0 (compatible; SiteAuditBot/1.0; +http://www.semrush.com/bot.html)`

Обратите внимание

Эта таблица — отличный инструмент для анализа ваших логов, но важно понимать:

Боты-маскировщики: Некоторые боты, такие как DeepSeek, намеренно подменяют свой User-Agent на обычный браузерный, чтобы их было невозможно идентифицировать и заблокировать этим методом. Они будут скрываться в вашей статистике под видом реальных посетителей.
Это гонка вооружений: Компании могут менять строки User-Agent без предварительного уведомления, поэтому для 100% защиты этого списка недостаточно.

Надежно отсечь весь этот «мусор» вручную практически невозможно. Именно поэтому гораздо эффективнее использовать комплексное решение, которое анализирует не то, кем бот представился, а как он себя ведет.

Почему Cloudflare не спасает российские сайты

Ещё пару лет назад Cloudflare был стандартом индустрии: мощная защита от DDoS, глобальная CDN-сеть и щедрый бесплатный тариф. Многие веб-мастера до сих пор по привычке подключают к нему сайт и считают себя в безопасности.

Но для российского интернета этот сервис сейчас неактуален, а сам Cloudflare официально признал, что не может восстановить надёжный доступ к своим продуктам на территории РФ

История конфликта: от рекомендаций до разрыва

Проблемы начались не вчера. Всё развивалось поэтапно.

1. Технологический конфликт из-за TLS ECH
В октябре 2024 года Cloudflare по умолчанию включил поддержку протокола TLS Encrypted Client Hello (ECH), который шифрует метаданные соединения — это серьёзный шаг вперёд с точки зрения конфиденциальности, но на практике он мешает системам глубокого анализа трафика (DPI) фильтровать запрещённый контент. Уже в начале 2025 года Роскомнадзор публично порекомендовал владельцам российских интернет-ресурсов отказаться от использования Cloudflare, поскольку протокол ECH позволяет обходить установленные в РФ ограничения доступа к информации.

2. Юридический удар: Cloudflare стал «организатором»
19 февраля 2025 года Роскомнадзор принудительно внёс компанию Cloudflare, Inc. в реестр организаторов распространения информации (ОРИ). Причиной послужило повторное игнорирование требований ведомства: Cloudflare дважды не уведомила о начале своей деятельности в этом статусе, за что была оштрафована сначала на 100 тысяч рублей, а затем на 1 миллион.

Этот статус — уже не просто «рекомендация», а включение компании в государственную систему контроля. Теоретически, это подразумевает обязанность хранить данные пользователей на территории РФ, но для западного провайдера это практически невыполнимо.

3. Техническая изоляция: что происходит на деле
Кульминация наступила 9 июня 2025 года. В официальном блоге Cloudflare сообщили, что российские провайдеры начали системно ограничивать трафик к защищённым сервисам. Это коснулось всех крупных операторов: Ростелекома, МТС, Мегафона, Вымпелкома (Билайн) и МГТС.

Как это выглядит для обычного пользователя

Рекомендации и статусы — это полбеды. Гораздо важнее, что в итоге происходит с вашим сайтом. Вот три ключевых последствия, которые вы увидите в своей статистике.

Тактика «16-килобайтного занавеса». Провайдеры начали обрывать соединение, как только загружено 16 килобайт данных с серверов Cloudflare. Этого объёма хватает лишь на то, чтобы браузер начал загружать страницу, показал шапку сайта, но всё основное содержимое — текст, изображения, стили — так и не появится. Cloudflare прямо заявил, что такое ограничение делает «большую часть веб-навигации невозможной». Ваш сайт превращается в бесконечно грузящуюся пустышку.
Массовая потеря трафика. Cloudflare Radar зафиксировал падение российского трафика на 30% с начала июня 2025 года. Это означает, что почти каждый третий ваш потенциальный клиент, который пользуется интернетом через крупных провайдеров, физически не может до вас достучаться.
Ухудшение SEO и рост отказов. Даже если пользователь всё же смог открыть страницу, огромные задержки и постоянные обрывы соединения гарантированно увеличивают процент отказов. Поисковые системы фиксируют это и закономерно понижают сайт в выдаче.

Cloudflare больше не может служить надёжной защитой для сайта, ориентированного на российскую аудиторию. Вместо щита он становится барьером, который мешает реальным клиентам вас найти.

Именно поэтому мы в eByeBots пошли другим путём. Мы не пытаемся конкурировать с глобальными CDN-гигантами. Наша специализация — глубокая фильтрация паразитного бот-трафика через reverse proxy в российской инфраструктуре.

Защита сайта от ботов — прокси-сервер eByeBots

После того как мы разобрали все риски ручных настроек и ограничения облачных сервисов, остаётся один логичный вопрос: что же делать, чтобы реально защитить сайт, не рискуя его работоспособностью и не теряя клиентов?

Ответ — прокси-сервер с фильтрацией трафика (reverse proxy). Это архитектура, при которой весь трафик к вашему сайту идёт не напрямую, а через выделенный сервер-посредник. Он принимает запросы, анализирует их, отсеивает ботов и только потом передаёт «чистый» трафик на ваш хостинг или VPS.

Как это работает на практике

Подробный механизм описан в другой статье:

Как работает защита eByeBots

Схема максимально прозрачная:

Вы меняете A-запись домена — вместо IP вашего сервера указываете IP нашего прокси.
Все запросы (и от людей, и от ботов) сначала приходят на прокси-сервер eByeBots.
Прокси фильтрует:
- проверяет IP по чёрным/белым спискам;
- анализирует User-Agent, fingerprint, поведение;
- отсекает DDoS-атаки на уровнях L3/L4/L7* (*нужно заказать VPS с защитой от L7);
- блокирует парсеров, накрутчиков ПФ, ИИ-краулеров.
На ваш сервер попадают только реальные пользователи и легитимные боты (Яндекс, Google, Bing).

Ваш настоящий IP-адрес остаётся скрытым — атаки идут на прокси, а не на ваш сайт.

Что именно мы фильтруем

Мы настроили фильтрацию так, чтобы вы не думали о каждом конкретном боте. Но для понимания — вот кого eByeBots блокирует по умолчанию (и вы это видите в веб-панели):

Все ИИ-краулеры — GPTBot, ClaudeBot, Bytespider, Meta-ExternalAgent, CCBot, PerplexityBot, ChatGPT-User, Applebot-Extended, cohere-ai, AI2Bot и другие.
SEO-сканеры — MJ12bot, AhrefsBot, SemrushBot, DotBot, BLEXBot, DataForSeoBot, Barkrowler, rogerbot, SiteAuditBot.
Специализированные боты — PetalBot, Amazonbot, Diffbot, ImagesiftBot, Pinterestbot.
Парсеры и накрутчики ПФ — в том числе те, что маскируются под реальных пользователей (DeepSeek и аналоги).
DDoS-атаки на всех уровнях — сетевом (L3), транспортном (L4) и прикладном (L7).

При этом поисковые роботы Яндекса и Google проходят без задержек — мы не мешаем индексации.

Веб-панель аналитики — вы видите всё

Ручная настройка оставляет вас «слепым»: только сырые логи, которые нужно парсить часами. Мы даём готовую веб-панель (доступна на тарифах Стандарт и выше, 7 дней бесплатного пробного периода).

Что вы увидите в панели:

Заблокированные и пропущенные запросы — графики в реальном времени.
Детальные логи по каждому запросу: IP, User-Agent, Referer, URL, fingerprint отпечаток.
404 ошибки — находите битые ссылки и улучшаете SEO.
Свои правила — добавляете чёрные/белые списки за пару кликов (без правки конфигов).
Интеграция с Яндекс Метрикой — IP и fingerprint заблокированных прямо в отчётах.

Пример веб панели Аналитика eByeBots — Плохие боты блокируются, пользователи заходят на сайт

Аналитика превращает борьбу с ботами из гадания в точную науку. Вы точно знаете: кто приходил, кого заблокировали, почему, и как это влияет на ваш трафик.

Почему eByeBots лучше ручной настройки и Cloudflare

Сравним в таблице — так нагляднее.

Критерий	.htaccess на хостинге	Nginx на VPS	Cloudflare	eByeBots (прокси + панель)
Сложность настройки	Высокая (ручное копирование IP)	Очень высокая (знание конфигов)	Низкая (но не работает в РФ)	Низкая (настройка под ключ)
Риск «положить» сайт	Высокий (ошибка в .htaccess)	Высокий (ошибка в конфиге)	Средний (проблемы с доступом)	Отсутствует (прокси отдельно)
Защита от DDoS L3/L4	Нет	Нет	Есть (но с перебоями в РФ)	Есть (полная)
Блокировка ИИ-ботов и парсеров	Только по IP/UA (бесполезно)	Сложные regexp, но маскировку не ловит	Частично	Поведенческий анализ + fingerprint
Аналитика и логи	Сырые логи	Сырые логи	Общая статистика + графики	Готовая веб-панель
Скрытие IP сайта	Нет	Нет	Да (но с проблемами)	Да
Работа в России	Да (но медленно)	Да (но сложно)	Нестабильно, потеря трафика до 30%	Стабильно (российская инфраструктура)
Обновление баз ботов	Нет (вручную)	Нет (вручную)	Частично	Да (автоматически)

Подробнее о защите, на нашей специальной странице — читать здесь

Когда боты — это хорошо: примеры

Сайты с технической документацией

Если у вас — документация для разработчиков, API-справочник, база знаний по IT-продукту, то доступ к вашему контенту для ИИ-ботов может приносить пользу. Чем больше моделей обучены на ваших мануалах, тем чаще их ответы будут ссылаться на ваш ресурс. Это бесплатный трафик и рост авторитета.

Онлайн-сервисы и SaaS-платформы

Если ваш сервис помогает пользователям решать задачи, то интеграция с ИИ-ассистентами (например, через RAG) может быть прямым каналом привлечения клиентов. Пользователь задаёт вопрос ChatGPT или Claude, бот находит ответ в вашей документации или базе знаний — и пользователь идёт к вам.

IT-сайты, блоги, образовательные платформы

Для сайтов с обучающим контентом, туториалами, разборами технологий — быть источником для ИИ-моделей означает, что ваш контент начинает работать на вас ещё и через ассистентов. Это дополнительный канал охвата, который не требует рекламного бюджета.

Узкие ниши, где вы — номер один

Если вы лидер в своей нише (например, юридическая база, медицинский справочник, производственный каталог), то чем чаще ваш контент используется для обучения ИИ, тем прочнее закрепляется ваше лидерство. Вы становитесь не просто сайтом, а источником истины для нейросетей.

Каким сайта боты не помогут и даже навредят

Есть целые категории сайтов, где присутствие ИИ-ботов и SEO-сканеров не даёт абсолютно никакой пользы, а только создаёт нагрузку, искажает аналитику и ворует контент.

Интернет-магазины

Товарные карточки, цены, описания, остатки на складе — это коммерческая информация, которая устаревает быстро. Если GPTBot или ClaudeBot скачают ваш каталог сегодня, а завтра вы изменили цену или акцию — бот уже опоздал. Покупатель, который получит ответ от нейросети с вашей старой ценой, либо уйдёт к конкуренту, либо придёт к вам и будет требовать скидку.

Реальность: боты генерируют 90% запросов к карточкам товаров, но 0% покупок. При этом грузят сервер, особенно если у вас 10 000+ товаров с картинками в разных размерах.

Вывод: интернет-магазинам ИИ-боты не нужны категорически. Блокировать всех.

Новостные порталы и СМИ

Новость живёт сутки, максимум двое. Пока ИИ-бот её просканирует, обработает и выдаст пользователю в ответе — новость уже устарела. Плюс нейросети часто пересказывают ваш эксклюзив без ссылки на источник, а иногда и с искажениями.

Реальность: вы теряете эксклюзив, не получая ни трафика, ни денег. Только нагрузка на сервер в момент пиковых новостей (когда и так всё на пределе).

Вывод: новостным сайтам боты не приносят пользы. Блокировать.

Сайты услуг (туризм, недвижимость, юристы, клиники)

Здесь всё строится на актуальности и личном контакте. Предложение «сдам квартиру» или «запись к стоматологу» действует ограниченное время. Если нейросеть выдаст пользователю ваше предложение, которое уже неактуально, — вы получите не клиента, а раздражённого человека, который потратил время.

Реальность: боты не могут записать на приём, не могут рассчитать стоимость тура, не могут проконсультировать по юридическому вопросу. Они просто забирают контент.

Вывод: сайтам услуг боты бесполезны. Блокировать.

Портфолио, творческие проекты, эксклюзивный контент

Фотографы, дизайнеры, художники, музыканты, авторы платных статей — ваш контент ваша главная ценность. Когда его скачивают для обучения нейросетей, вы теряете эксклюзивность. А конкуренты могут сгенерировать «похожий» контент бесплатно, используя ваши же наработки.

Реальность: вы не получаете от ботов ничего. Ни переходов, ни заказов, ни подписок. Только риск обесценивания вашего творчества.

Вывод: творческим проектам нужна полная блокировка ИИ-краулеров.

Сайты с платным контентом (курсы, подписки, клубы)

Если ваш контент находится за платным доступом, но превью или тизеры открыты для всех, — боты всё равно скачают достаточно, чтобы нейросеть могла пересказать суть. Пользователь получит ответ от ChatGPT и не захочет платить за полную версию.

Реальность: боты обесценивают вашу платную модель монетизации.

Вывод: сайтам с подпиской нужна точечная блокировка ботов от всех крупных ИИ-провайдеров.