SEO

Управление индексацией: что закрывать от поиска

Зачем управлять индексацией сайта

Поисковые системы Яндекс и Google ежедневно обходят миллионы страниц. Если ваш ресурс не контролирует этот процесс, робот может проиндексировать служебные разделы, дубли контента или технические страницы. Это ведёт к распылению индекса, снижению позиций и потере трафика. Управление индексацией — это набор правил и инструментов, которые позволяют указать поисковым системам, какой контент показывать в выдаче, а какой скрыть. Вагиз Хасанов рекомендует начинать настройку индексации сразу после запуска сайта, чтобы избежать проблем с ранжированием.

Без должного управления робот тратит лимит краулинга на ненужные страницы. Например, страницы корзины, фильтров или результатов поиска не должны попадать в индекс. Если этого не сделать, Google и Яндекс могут посчитать сайт низкокачественным из-за большого количества дублей. По нашему опыту (280+ проектов), правильная настройка robots.txt и meta-тегов даёт прирост трафика до 40% за счёт концентрации индекса на коммерческих и информационных страницах.

Основные инструменты управления индексацией

Для управления индексацией используются три ключевых инструмента: файл robots.txt, мета-теги и панели вебмастеров. Каждый из них решает свою задачу, но только комплексный подход даёт результат.

Файл robots.txt

Это текстовый документ в корне сайта, который даёт указания поисковым роботам. С помощью директив Disallow и Allow вы запрещаете или разрешаете индексацию определённых разделов. Например:

  • Disallow: /admin/ — закрывает админ-панель от индексации.
  • Disallow: /cart/ — скрывает корзину и оформление заказа.
  • Disallow: /search/ — запрещает индексацию страниц внутреннего поиска.

Важно помнить: файл robots.txt — это рекомендация, а не строгий запрет. Некоторые роботы могут игнорировать его. Для надёжного закрытия используйте meta-теги.

Мета-тег noindex

Тег <meta name="robots" content="noindex"> размещается в коде страницы и даёт команду не индексировать её. В отличие от robots.txt, этот метод работает на уровне документа. Если страница уже проиндексирована, добавление noindex заставит поисковую систему удалить её из выдачи после следующего обхода.

Пример использования: страницы с фильтрами товаров в интернет-магазине. Они создают тысячи дублей, которые не нужны в индексе. Установка noindex на все такие страницы — стандартная практика.

Панели вебмастеров

Яндекс.Вебмастер и Google Search Console предоставляют инструменты для управления индексацией:

  • Исключение URL через инструмент «Удалить URL».
  • Настройка параметров для игнорирования GET-параметров.
  • Отправка sitemap для ускорения индексации важных страниц.

Эти сервисы также показывают ошибки индексации, которые нужно исправлять. Например, страницы с кодом 404 или 500 не должны находиться в индексе.

Что нужно закрывать от индексации

Не весь контент сайта должен быть доступен поисковым системам. Некоторые разделы вредят продвижению и трафику. Рассмотрим основные типы страниц, которые стоит закрыть.

Служебные и технические страницы

К ним относятся админ-панели, страницы входа, регистрации, восстановления пароля. Эти страницы не несут ценности для пользователя и не должны индексироваться. Пример:

Раздел Директива robots.txt
/admin/ Disallow: /admin/
/login/ Disallow: /login/
/register/ Disallow: /register/

Дубли контента

Страницы с одинаковым или очень похожим содержанием — частая проблема интернет-магазинов. Например, один товар может быть доступен по нескольким URL с разными параметрами (цвет, размер). Это создаёт дубли, которые размывают индекс. Решение: использовать канонические URL (rel=»canonical») или закрывать дубли через noindex.

По нашему опыту (280+ проектов), устранение дублей в интернет-магазине мебели дало +340% трафика за 6 месяцев. Мы закрыли страницы с фильтрами и сортировкой, оставив только уникальные товарные карточки.

Страницы с низкой ценностью

К ним относятся страницы результатов поиска, архивы тегов, страницы с пагинацией. Они не дают пользователю новой информации и ухудшают качество индекса. Пример: страница «/search?q=стул» должна быть закрыта через robots.txt или noindex.

Как настроить индексацию в CMS

Большинство популярных CMS имеют встроенные или плагинные решения для управления индексацией. Рассмотрим настройку для трёх систем.

WordPress

Используйте плагин Yoast SEO или Rank Math. В настройках можно:

  • Запретить индексацию архивов авторов, категорий и тегов.

  • Установить noindex для страниц с пагинацией.
  • Настроить robots.txt через интерфейс плагина.

Пример: в Yoast SEO перейдите в «Поисковая видимость» и отключите индексацию для таксономий, которые не нужны.

OpenCart

В OpenCart управление индексацией настраивается через файл robots.txt в корне сайта. Добавьте строки:

Disallow: /index.php?route=product/search
Disallow: /index.php?route=account/
Disallow: /index.php?route=checkout/

Также можно использовать модули SEO-оптимизации, которые добавляют управление meta-тегами.

1С-Битрикс

В Битриксе есть модуль «Поисковая оптимизация». В нём можно настроить:

  • Индексацию разделов и элементов.
  • Управление robots.txt через административную панель.
  • Генерацию sitemap.

Для закрытия страниц с фильтрами используйте настройки компонента «Каталог» и установите noindex для страниц с параметрами.

Проверка индексации: как найти ошибки

После настройки нужно проверить, как поисковые системы воспринимают ваш сайт. Используйте следующие способы.

Проверка через панели вебмастеров

В Яндекс.Вебмастере перейдите в раздел «Индексирование» → «Страницы в поиске». Здесь отображается количество проиндексированных страниц и ошибки. В Google Search Console используйте отчёт «Страницы» → «Индекс». Если видите много страниц с ошибкой «Не проиндексировано» или «Исключено», значит, настройки требуют корректировки.

Ручная проверка

Введите в строку поиска Яндекса или Google запрос site:вашсайт.ru. Система покажет все проиндексированные страницы. Просмотрите список: если там есть служебные разделы или дубли, нужно срочно их закрыть.

Использование сервисов

Сервисы вроде Screaming Frog или Netpeak Spider сканируют сайт и показывают статусы страниц. Они помогут найти:

  • Страницы с кодом 404.

  • Дубли контента.
  • Страницы без meta-тегов.

Пример: после сканирования сайта автосервиса мы обнаружили 150 страниц с дублирующимся контентом. После их закрытия трафик вырос на 280% заявок за 3 месяца.

Частые ошибки при управлении индексацией

Даже опытные SEO-специалисты допускают ошибки. Вот самые распространённые.

Закрытие важных страниц

Иногда в robots.txt случайно закрывают разделы, которые должны индексироваться. Например, Disallow: / — запрещает индексацию всего сайта. Это критическая ошибка, которая приводит к полному исчезновению сайта из выдачи. Проверяйте файл после каждого изменения.

Игнорирование sitemap

Файл sitemap.xml — это карта сайта для поисковых роботов. Если не отправить его в панели вебмастеров, робот может долго не находить новые страницы. Добавьте sitemap в Яндекс.Вебмастер и Google Search Console.

Неправильное использование noindex

Тег noindex не запрещает роботу переходить по ссылкам на странице. Если на странице с noindex есть ссылки на важные разделы, робот всё равно их проиндексирует. Для полного закрытия используйте nofollow в ссылках или robots.txt.

Часто задаваемые вопросы

Как быстро закрыть страницу от индексации?

Добавьте в код страницы meta-тег noindex. После этого отправьте страницу на переобход в Яндекс.Вебмастере или Google Search Console. Обычно изменения вступают в силу в течение 1-2 недель.

Можно ли закрыть страницу от индексации, но оставить её доступной для пользователей?

Да. Для этого используйте noindex без nofollow. Пользователи смогут зайти на страницу по прямой ссылке, но поисковые системы не будут её индексировать.

Что лучше: robots.txt или noindex?

Для надёжного закрытия используйте оба метода. robots.txt запрещает роботу заходить на страницу, а noindex — индексировать её. Если страница уже в индексе, noindex обязателен.

Как проверить, что страница исключена из индекса?

Введите в поиск Яндекса или Google запрос site:вашсайт.ru url. Если страница не отображается, она исключена. Также проверьте отчёты в панелях вебмастеров.

Нужно ли закрывать страницы с пагинацией?

Да, страницы с пагинацией (page2, page3 и т.д.) лучше закрыть от индексации, чтобы избежать дублей. Используйте noindex или rel=»prev»/»next».

Управление индексацией — это непрерывный процесс. Регулярно проверяйте состояние сайта в панелях вебмастеров, исправляйте ошибки и добавляйте новые правила. Только так вы добьётесь стабильного трафика и высоких позиций.

Получить бесплатный SEO-аудит → seo-rezult.ru

Читайте по теме:

Структура URL и индексация →
Автор статьи
Александр Молодцов
Руководитель SEO Rezult · 8 лет опыта

Александр Молодцов — сооснователь SEO Rezult, SEO-стратег с 8-летним опытом

Все статьи →