Вы можете вкладываться в SEO, улучшать контент, работать над скоростью сайта — но при этом всё равно видеть падение позиций. Причина часто скрыта от глаз: как заблокировать ИИ-ботов на сайте — этот вопрос всё чаще задают владельцы ресурсов, сталкиваясь с необъяснимой нагрузкой. На первый взгляд всё выглядит нормально: есть трафик, идут переходы. Но если копнуть глубже, выясняется, что значительная часть посещений — вовсе не от людей.
В 2026 году сайты всё чаще сталкиваются с потоком ботов: парсеры, сканеры и нейросети. Они создают нагрузку, искажают аналитику и напрямую влияют на SEO.
Особенно опасно то, что эту проблему сложно заметить сразу. Метрики могут выглядеть “живыми”, но при этом:
- растёт показатель отказов
- падает конверсия
- ухудшаются позиции в поиске
Отдельная история — боты нейросетей. Они массово собирают контент для обучения, практически ничего не отдавая взамен. В результате сайт тратит ресурсы, но не получает реальной пользы.
И главное — стандартные способы защиты, которые раньше работали, сегодня либо неэффективны, либо требуют сложной и рискованной настройки.
В этой статье разберём:
- кто на самом деле заходит на ваш сайт
- почему боты — это не просто нагрузка, а реальные потери
- какие методы защиты используют и где они не справляются
- и какой подход действительно работает сейчас

Кто на самом деле заходит на ваш сайт и почему это важно
Вы открываете Яндекс Метрику: визиты, просмотры, время на сайте — вроде бы всё гладко. Но спросите себя: сколько из этих цифр — реальные люди, а сколько — роботы?
Проблема в том, что Яндекс Метрика показывает далеко не всех. Боты без JavaScript — а это почти все краулеры нейросетей (GPTBot, Claude, PerplexityBot) — просто не загружают счётчик. Они сканируют ваш сайт тысячами запросов, грузят сервер, воруют контент, но в отчётах вы их не видите.
Одновременно с этим в Метрику попадают другие ИИ-боты — те, что запускают полноценный браузер (например, ChatGPT-User в режиме просмотра страниц, некоторые парсеры с Headless Chrome). Они создают видимость активности: кликают по ссылкам, «читают» текст, но не приносят заказов. Ещё хуже — боты для накрутки поведенческих факторов (ПФ). Они имитируют действия человека: скроллят страницу, задерживаются на ней, иногда даже «кликают» на кнопки. В результате Метрика показывает хороший «вовлечённый» трафик, но конверсия при этом стремится к нулю.
Итог — полная иллюзия:
Вы видите растущие метрики — радуетесь.
На деле — нагрузка на сервер, искажённая аналитика и падение реальных продаж.
ИИ-боты потребляют ресурсы сервера, практически не возвращая посетителей. Давайте приведу наглядное сравнение:

Почему попытки заблокировать ботов вручную — это лотерея с негарантированным результатом
Увидев в логах сервера (ведь в Метрике вы их не замечали) тысячи запросов от ClaudeBot или GPTBot, большинство вебмастеров делают одно и то же: гуглят «как заблокировать бота нейросети» и получают советы добавить IP‑диапазоны в .htaccess или прописать правила в Nginx.
Выглядит просто. Но на практике это путь к хронической усталости, потерянному времени и, что хуже, — к реальным сбоям сайта.
Подход 1: Героический, но самоубийственный — .htaccess
Вот типичный сценарий:
Вы находите «свежий» список IP‑сетей OpenAI (например, 132.196.86.0/24, 172.182.202.0/25…). Копируете 20–30 строк в
.htaccess.Через пару дней замечаете, что сайт стал ощутимо тормозить. Потому что при каждом запросе Apache теперь проверяет IP посетителя против всех этих диапазонов.
Вы добавляете ещё 50 правил для ClaudeBot — тормоза усиливаются. На shared‑хостинге сайт может начать выдавать timeout.
Случайно ошибаетесь в синтаксисе (забыли
Deny fromили поставили лишний пробел) — и весь сайт падает с ошибкой 500. Восстановление: лезть в FTP, править файл, надеяться, что хостинг не наложил блокировку.
Результат: сайт медленный, хрупкий, а боты всё равно пролезают — они меняют IP быстрее, чем вы обновляете списки. А про DDoS‑атаки на уровне L3/L4 можно забыть — .htaccess их не остановит.

Подход №2: Для «продвинутых» — Nginx на VPS
Вы переезжаете на VPS, ставите Nginx и начинаете писать правила. Это уже не .htaccess, но проблем меньше не становится.
Пример блокировки по User-Agent (самый наивный способ):
if ($http_user_agent ~* (GPTBot|ClaudeBot|PerplexityBot|CCBot)) {
return 403;
}На первый взгляд просто. Но боты быстро меняют User-Agent на «Mozilla/5.0…» — и правило перестаёт работать. Накрутчики ПФ и вовсе используют реальные браузеры с подменой fingerprint.
Пример блокировки по IP-диапазонам (чуть надёжнее, но муторно):
location / {
deny 132.196.86.0/24;
deny 172.182.202.0/25;
deny 172.182.204.0/24;
# … и так ещё 200+ строк для одного только GPTBot
allow all;
}
Списки IP у OpenAI, Anthropic, Perplexity обновляются регулярно. Вам нужно:
Мониторить официальные источники
Скачивать новые диапазоны.
Вручную вносить их в конфиг.
Перезагружать Nginx.
Одна опечатка в CIDR — и вы либо пропускаете бота, либо случайно блокируете обычного пользователя.
Бот DeepSeek с человеком подобным User-Agent
Многие ИИ-боты, вроде GPTBot, используют уникальные User-Agent (например, Mozilla/5.0 (compatible; GPTBot/1.2; +https://openai.com/gptbot)), что позволяет легко их идентифицировать и заблокировать.
DeepSeek действует иначе и гораздо опаснее. Этот бот намеренно маскируется под обычного пользователя, подменяя свой User-Agent на стандартный браузерный. Обнаружить его стандартными методами по заголовкам практически невозможно.
К тому же, DeepSeekBot — это распределённая система. Его запросы могут идти не с одного IP, а из огромного пула адресов по всему миру. Хотя большая часть трафика идёт из Гонконга, известны случаи, когда активность фиксировалась и с IP-адресов из Сингапура.
Давайте посмотрим с каким данными заходит этот бот:

Вот что у нас получилось, бот зашел на несуществующую страницу:

- Юзер агент Mozilla/5.0 (X11; Linux x86_64; rv:142.0) Gecko/20100101 Firefox/142.0
- Айпи: 94.74.125.208
- Название провайдера: Huawei-Cloud-HK
- Хост: ecs-94-74-125-208.compute.hwclouds-dns.com
- ASN: 136907
При правильном подходе можно заблокировать по:
ASN сеть / страну — на сервере должна быть база GeoLite2 (в нашем сервисе она есть)
диапазону айпи — скачать тут: https://2ip.ru/as/136907.json через тот же ИИ можно создать список в формате:
deny айпи
deny сеть
- заблокировать по user agent — Linux совпадению, если сайт у Вас не на IT тематику, то обычно все сидят с ОС Windows
- или воспользоваться нашим сервисом — где под ключ настроим фильтрацию от спам ботов в короткие сроки
Топ-25 ботов, создающих нагрузку на сайт
Важно: Meta Platforms Inc. (владелец Facebook и Instagram) признана экстремистской организацией и запрещена на территории РФ.
Боты ИИ (AI Crawlers)
| Бот (Оператор) | Назначение (источник нагрузки) | Полный User-Agent (UA) строка |
|---|---|---|
| GPTBot (OpenAI) | Сбор обучающих данных для моделей GPT. Может генерировать до 98.8% всего трафика, создавая огромную нагрузку. | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.3; +https://openai.com/gptbot) |
| ChatGPT-User (OpenAI) | Выполнение прямых запросов пользователей ChatGPT в реальном времени (RAG). Частота запросов выше, чем у GPTBot. | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot |
| ClaudeBot (Anthropic) | Сбор данных для обучения моделей Claude. Жалобы на почти миллион запросов в день, что равно всему обычному трафику сайта. | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; ClaudeBot/1.0; +claudebot@anthropic.com) |
| Meta-ExternalAgent (Meta*) | Сбор данных для обучения ИИ-моделей Meta (LLaMA). По данным Fastly, на долю Meta приходится 52% всего AI-трафика в сети. | meta-externalagent/1.1 (+https://developers.facebook.com/docs/sharing/webmasters/crawler) |
| Bytespider (ByteDance) | Индексация для поисковых сервисов ByteDance (TikTok). Известен агрессивным краулингом, иногда превышающим 1.4 млн запросов в день. | Mozilla/5.0 (Linux; Android 5.0) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; Bytespider; spider-feedback@bytedance.com) |
| CCBot (Common Crawl) | Архивация веба. Данные этого некоммерческого архива используются почти всеми LLM для обучения. Блокируя одного этого бота, вы отсекаете десятки моделей. | CCBot/2.0 (https://commoncrawl.org/faq/) |
| PerplexityBot (Perplexity AI) | Индексация для ИИ-поисковика Perplexity. Сканирует сайты для генерации ответов с цитированием источников. | Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot) |
SEO-сканеры (SEO Crawlers)
| Бот (Оператор) | Назначение (источник нагрузки) | Полный User-Agent (UA) строка |
|---|---|---|
| MJ12bot (Majestic) | Массовое сканирование для построения карты ссылок (бэклинков). Самый блокируемый SEO-бот в мире (6.49% сайтов). | Mozilla/5.0 (compatible; MJ12bot/v1.4.8; http://mj12bot.com/) |
| SemrushBot (SEMrush) | Сбор SEO-данных (ключевые слова, структура сайта) для конкурентного анализа. Входит в тройку самых блокируемых ботов. | Mozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html) |
| AhrefsBot (Ahrefs) | Сбор данных для индекса бэклинков и SEO-инструментов Ahrefs. Очень активный crawler, входит в топ-3 по частоте блокировок. | Mozilla/5.0 (compatible; AhrefsBot/7.0; +http://ahrefs.com/robot/) |
| BLEXBot (WebMeUp/Blex) | Сбор данных для обратного индексирования ссылок. Владельцы сайтов жалуются на «постоянное, бесконечное» сканирование. | Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/) |
| DotBot (Moz) | Сбор данных для индекса ссылок Moz, расчета метрик Domain Authority и Page Authority. Входит в топ-5 блокируемых ботов. | Mozilla/5.0 (compatible; DotBot/1.2; +https://opensiteexplorer.org/dotbot; help@moz.com) |
| DataForSeoBot (DataForSEO) | Сбор SEO-данных для сервисов клиентов. Активность этого бота не всегда очевидна, но он постоянно присутствует в логах. | DataForSeoBot |
| Barkrowler (Babbar.tech) | SEO-анализ: сбор данных о структуре страниц и метаданных для построения графа ссылок. | Mozilla/5.0 (compatible; Barkrowler/0.9; +https://babbar.tech/crawler) |
Специализированные и прочие боты
| Бот (Оператор) | Назначение (источник нагрузки) | Полный User-Agent (UA) строка |
|---|---|---|
| PetalBot (Huawei) | Поисковый робот, который может «наводнять» сайты запросами, предоставляя мало контроля для веб-мастеров. | Mozilla/5.0 (Linux; Android 7.0;) AppleWebKit/537.36 (KHTML, like Gecko) Mobile Safari/537.36 (compatible; PetalBot; +https://webmaster.huawei.com/portal/help/faq?id=petalBot) |
| Amazonbot (Amazon) | Робот для индексации контента, используемый сервисами Alexa и Amazon. Может генерировать миллионы запросов, создавая значительную нагрузку. | Mozilla/5.0 (compatible; Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot) |
| Applebot-Extended (Apple) | Сбор данных для обучения Apple Intelligence. Создает дополнительную нагрузку, сравнимую с другими крупными AI-ботами. | Mozilla/5.0 (Device; OS_version) AppleWebKit/WebKit_version (KHTML, like Gecko) Version/Safari_version Safari/Safari_version (Applebot-Extended/0.1; +http://www.apple.com/go/applebot) |
| cohere-ai (Cohere) | Сбор данных для RAG (Retrieval-Augmented Generation) и ответов чат-бота. Создает всплески запросов каждые 5–7 дней. | cohere-ai |
| AI2Bot (AI2) | Сбор данных для разработки открытых языковых моделей. Относится к «хорошим» ботам, но всё же создает нагрузку. | Mozilla/5.0 (compatible; AI2Bot; +https://allenai.org/policies/ai2bot) |
| Diffbot (Diffbot) | Преобразование веб-страниц в структурированные данные. Активность этого бота может сильно нагружать сервер. | Mozilla/5.0 (compatible; Diffbot; +http://www.diffbot.com) |
| ImagesiftBot (Imagesift) | Специализированный парсинг и индексация изображений. Может стать проблемой для сайтов с большим количеством графики. | Mozilla/5.0 (compatible; ImagesiftBot; +imagesift.com) |
| Pinterestbot (Pinterest) | Индексация изображений и контента для рекомендаций. Создает дополнительную нагрузку на сервер, особенно на сайтах с картинками. | Pinterest/0.2 (+https://www.pinterest.com/bot.html) |
| BLEXBot (WebMeUp/Blex) | Сбор данных для обратного индексирования ссылок. Владельцы сайтов жалуются на «постоянное, бесконечное» сканирование. | Mozilla/5.0 (compatible; BLEXBot/1.0; +http://webmeup-crawler.com/) |
| rogerbot (Moz) | Еще один бот от Moz, используемый для краулинга при SEO-аудите сайтов. | rogerbot/1.0 (http://moz.com/rogerbot) |
| SiteAuditBot (Semrush) | Специализированный бот от Semrush для проведения технических аудитов сайта. | Mozilla/5.0 (compatible; SiteAuditBot/1.0; +http://www.semrush.com/bot.html) |
Обратите внимание
Эта таблица — отличный инструмент для анализа ваших логов, но важно понимать:
Боты-маскировщики: Некоторые боты, такие как DeepSeek, намеренно подменяют свой User-Agent на обычный браузерный, чтобы их было невозможно идентифицировать и заблокировать этим методом. Они будут скрываться в вашей статистике под видом реальных посетителей.
Это гонка вооружений: Компании могут менять строки User-Agent без предварительного уведомления, поэтому для 100% защиты этого списка недостаточно.
Надежно отсечь весь этот «мусор» вручную практически невозможно. Именно поэтому гораздо эффективнее использовать комплексное решение, которое анализирует не то, кем бот представился, а как он себя ведет.
Почему Cloudflare не спасает российские сайты
Ещё пару лет назад Cloudflare был стандартом индустрии: мощная защита от DDoS, глобальная CDN-сеть и щедрый бесплатный тариф. Многие веб-мастера до сих пор по привычке подключают к нему сайт и считают себя в безопасности.
Но для российского интернета этот сервис сейчас неактуален, а сам Cloudflare официально признал, что не может восстановить надёжный доступ к своим продуктам на территории РФ

История конфликта: от рекомендаций до разрыва
Проблемы начались не вчера. Всё развивалось поэтапно.
1. Технологический конфликт из-за TLS ECH
В октябре 2024 года Cloudflare по умолчанию включил поддержку протокола TLS Encrypted Client Hello (ECH), который шифрует метаданные соединения — это серьёзный шаг вперёд с точки зрения конфиденциальности, но на практике он мешает системам глубокого анализа трафика (DPI) фильтровать запрещённый контент. Уже в начале 2025 года Роскомнадзор публично порекомендовал владельцам российских интернет-ресурсов отказаться от использования Cloudflare, поскольку протокол ECH позволяет обходить установленные в РФ ограничения доступа к информации.
2. Юридический удар: Cloudflare стал «организатором»
19 февраля 2025 года Роскомнадзор принудительно внёс компанию Cloudflare, Inc. в реестр организаторов распространения информации (ОРИ). Причиной послужило повторное игнорирование требований ведомства: Cloudflare дважды не уведомила о начале своей деятельности в этом статусе, за что была оштрафована сначала на 100 тысяч рублей, а затем на 1 миллион.
Этот статус — уже не просто «рекомендация», а включение компании в государственную систему контроля. Теоретически, это подразумевает обязанность хранить данные пользователей на территории РФ, но для западного провайдера это практически невыполнимо.
3. Техническая изоляция: что происходит на деле
Кульминация наступила 9 июня 2025 года. В официальном блоге Cloudflare сообщили, что российские провайдеры начали системно ограничивать трафик к защищённым сервисам. Это коснулось всех крупных операторов: Ростелекома, МТС, Мегафона, Вымпелкома (Билайн) и МГТС.
Как это выглядит для обычного пользователя
Рекомендации и статусы — это полбеды. Гораздо важнее, что в итоге происходит с вашим сайтом. Вот три ключевых последствия, которые вы увидите в своей статистике.
Тактика «16-килобайтного занавеса». Провайдеры начали обрывать соединение, как только загружено 16 килобайт данных с серверов Cloudflare. Этого объёма хватает лишь на то, чтобы браузер начал загружать страницу, показал шапку сайта, но всё основное содержимое — текст, изображения, стили — так и не появится. Cloudflare прямо заявил, что такое ограничение делает «большую часть веб-навигации невозможной». Ваш сайт превращается в бесконечно грузящуюся пустышку.
Массовая потеря трафика. Cloudflare Radar зафиксировал падение российского трафика на 30% с начала июня 2025 года. Это означает, что почти каждый третий ваш потенциальный клиент, который пользуется интернетом через крупных провайдеров, физически не может до вас достучаться.
Ухудшение SEO и рост отказов. Даже если пользователь всё же смог открыть страницу, огромные задержки и постоянные обрывы соединения гарантированно увеличивают процент отказов. Поисковые системы фиксируют это и закономерно понижают сайт в выдаче.
Cloudflare больше не может служить надёжной защитой для сайта, ориентированного на российскую аудиторию. Вместо щита он становится барьером, который мешает реальным клиентам вас найти.
Именно поэтому мы в eByeBots пошли другим путём. Мы не пытаемся конкурировать с глобальными CDN-гигантами. Наша специализация — глубокая фильтрация паразитного бот-трафика через reverse proxy в российской инфраструктуре.
Защита сайта от ботов — прокси-сервер eByeBots
После того как мы разобрали все риски ручных настроек и ограничения облачных сервисов, остаётся один логичный вопрос: что же делать, чтобы реально защитить сайт, не рискуя его работоспособностью и не теряя клиентов?
Ответ — прокси-сервер с фильтрацией трафика (reverse proxy). Это архитектура, при которой весь трафик к вашему сайту идёт не напрямую, а через выделенный сервер-посредник. Он принимает запросы, анализирует их, отсеивает ботов и только потом передаёт «чистый» трафик на ваш хостинг или VPS.
Как это работает на практике
Подробный механизм описан в другой статье:
Схема максимально прозрачная:
Вы меняете A-запись домена — вместо IP вашего сервера указываете IP нашего прокси.
Все запросы (и от людей, и от ботов) сначала приходят на прокси-сервер eByeBots.
Прокси фильтрует:
проверяет IP по чёрным/белым спискам;
анализирует User-Agent, fingerprint, поведение;
отсекает DDoS-атаки на уровнях L3/L4/L7* (*нужно заказать VPS с защитой от L7);
блокирует парсеров, накрутчиков ПФ, ИИ-краулеров.
На ваш сервер попадают только реальные пользователи и легитимные боты (Яндекс, Google, Bing).
Ваш настоящий IP-адрес остаётся скрытым — атаки идут на прокси, а не на ваш сайт.
Что именно мы фильтруем
Мы настроили фильтрацию так, чтобы вы не думали о каждом конкретном боте. Но для понимания — вот кого eByeBots блокирует по умолчанию (и вы это видите в веб-панели):
Все ИИ-краулеры — GPTBot, ClaudeBot, Bytespider, Meta-ExternalAgent, CCBot, PerplexityBot, ChatGPT-User, Applebot-Extended, cohere-ai, AI2Bot и другие.
SEO-сканеры — MJ12bot, AhrefsBot, SemrushBot, DotBot, BLEXBot, DataForSeoBot, Barkrowler, rogerbot, SiteAuditBot.
Специализированные боты — PetalBot, Amazonbot, Diffbot, ImagesiftBot, Pinterestbot.
Парсеры и накрутчики ПФ — в том числе те, что маскируются под реальных пользователей (DeepSeek и аналоги).
DDoS-атаки на всех уровнях — сетевом (L3), транспортном (L4) и прикладном (L7).
При этом поисковые роботы Яндекса и Google проходят без задержек — мы не мешаем индексации.
Веб-панель аналитики — вы видите всё
Ручная настройка оставляет вас «слепым»: только сырые логи, которые нужно парсить часами. Мы даём готовую веб-панель (доступна на тарифах Стандарт и выше, 7 дней бесплатного пробного периода).
Что вы увидите в панели:
Заблокированные и пропущенные запросы — графики в реальном времени.
Детальные логи по каждому запросу: IP, User-Agent, Referer, URL, fingerprint отпечаток.
404 ошибки — находите битые ссылки и улучшаете SEO.
Свои правила — добавляете чёрные/белые списки за пару кликов (без правки конфигов).
Интеграция с Яндекс Метрикой — IP и fingerprint заблокированных прямо в отчётах.

Аналитика превращает борьбу с ботами из гадания в точную науку. Вы точно знаете: кто приходил, кого заблокировали, почему, и как это влияет на ваш трафик.
Почему eByeBots лучше ручной настройки и Cloudflare
Сравним в таблице — так нагляднее.
| Критерий | .htaccess на хостинге | Nginx на VPS | Cloudflare | eByeBots (прокси + панель) |
|---|---|---|---|---|
| Сложность настройки | Высокая (ручное копирование IP) | Очень высокая (знание конфигов) | Низкая (но не работает в РФ) | Низкая (настройка под ключ) |
| Риск «положить» сайт | Высокий (ошибка в .htaccess) | Высокий (ошибка в конфиге) | Средний (проблемы с доступом) | Отсутствует (прокси отдельно) |
| Защита от DDoS L3/L4 | Нет | Нет | Есть (но с перебоями в РФ) | Есть (полная) |
| Блокировка ИИ-ботов и парсеров | Только по IP/UA (бесполезно) | Сложные regexp, но маскировку не ловит | Частично | Поведенческий анализ + fingerprint |
| Аналитика и логи | Сырые логи | Сырые логи | Общая статистика + графики | Готовая веб-панель |
| Скрытие IP сайта | Нет | Нет | Да (но с проблемами) | Да |
| Работа в России | Да (но медленно) | Да (но сложно) | Нестабильно, потеря трафика до 30% | Стабильно (российская инфраструктура) |
| Обновление баз ботов | Нет (вручную) | Нет (вручную) | Частично | Да (автоматически) |
Подробнее о защите, на нашей специальной странице — читать здесь
Когда боты — это хорошо: примеры

Сайты с технической документацией
Если у вас — документация для разработчиков, API-справочник, база знаний по IT-продукту, то доступ к вашему контенту для ИИ-ботов может приносить пользу. Чем больше моделей обучены на ваших мануалах, тем чаще их ответы будут ссылаться на ваш ресурс. Это бесплатный трафик и рост авторитета.
Онлайн-сервисы и SaaS-платформы
Если ваш сервис помогает пользователям решать задачи, то интеграция с ИИ-ассистентами (например, через RAG) может быть прямым каналом привлечения клиентов. Пользователь задаёт вопрос ChatGPT или Claude, бот находит ответ в вашей документации или базе знаний — и пользователь идёт к вам.
IT-сайты, блоги, образовательные платформы
Для сайтов с обучающим контентом, туториалами, разборами технологий — быть источником для ИИ-моделей означает, что ваш контент начинает работать на вас ещё и через ассистентов. Это дополнительный канал охвата, который не требует рекламного бюджета.
Узкие ниши, где вы — номер один
Если вы лидер в своей нише (например, юридическая база, медицинский справочник, производственный каталог), то чем чаще ваш контент используется для обучения ИИ, тем прочнее закрепляется ваше лидерство. Вы становитесь не просто сайтом, а источником истины для нейросетей.
Каким сайта боты не помогут и даже навредят
Есть целые категории сайтов, где присутствие ИИ-ботов и SEO-сканеров не даёт абсолютно никакой пользы, а только создаёт нагрузку, искажает аналитику и ворует контент.

Интернет-магазины
Товарные карточки, цены, описания, остатки на складе — это коммерческая информация, которая устаревает быстро. Если GPTBot или ClaudeBot скачают ваш каталог сегодня, а завтра вы изменили цену или акцию — бот уже опоздал. Покупатель, который получит ответ от нейросети с вашей старой ценой, либо уйдёт к конкуренту, либо придёт к вам и будет требовать скидку.
Реальность: боты генерируют 90% запросов к карточкам товаров, но 0% покупок. При этом грузят сервер, особенно если у вас 10 000+ товаров с картинками в разных размерах.
Вывод: интернет-магазинам ИИ-боты не нужны категорически. Блокировать всех.
Новостные порталы и СМИ
Новость живёт сутки, максимум двое. Пока ИИ-бот её просканирует, обработает и выдаст пользователю в ответе — новость уже устарела. Плюс нейросети часто пересказывают ваш эксклюзив без ссылки на источник, а иногда и с искажениями.
Реальность: вы теряете эксклюзив, не получая ни трафика, ни денег. Только нагрузка на сервер в момент пиковых новостей (когда и так всё на пределе).
Вывод: новостным сайтам боты не приносят пользы. Блокировать.
Сайты услуг (туризм, недвижимость, юристы, клиники)
Здесь всё строится на актуальности и личном контакте. Предложение «сдам квартиру» или «запись к стоматологу» действует ограниченное время. Если нейросеть выдаст пользователю ваше предложение, которое уже неактуально, — вы получите не клиента, а раздражённого человека, который потратил время.
Реальность: боты не могут записать на приём, не могут рассчитать стоимость тура, не могут проконсультировать по юридическому вопросу. Они просто забирают контент.
Вывод: сайтам услуг боты бесполезны. Блокировать.
Портфолио, творческие проекты, эксклюзивный контент
Фотографы, дизайнеры, художники, музыканты, авторы платных статей — ваш контент ваша главная ценность. Когда его скачивают для обучения нейросетей, вы теряете эксклюзивность. А конкуренты могут сгенерировать «похожий» контент бесплатно, используя ваши же наработки.
Реальность: вы не получаете от ботов ничего. Ни переходов, ни заказов, ни подписок. Только риск обесценивания вашего творчества.
Вывод: творческим проектам нужна полная блокировка ИИ-краулеров.
Сайты с платным контентом (курсы, подписки, клубы)
Если ваш контент находится за платным доступом, но превью или тизеры открыты для всех, — боты всё равно скачают достаточно, чтобы нейросеть могла пересказать суть. Пользователь получит ответ от ChatGPT и не захочет платить за полную версию.
Реальность: боты обесценивают вашу платную модель монетизации.
Вывод: сайтам с подпиской нужна точечная блокировка ботов от всех крупных ИИ-провайдеров.

