С продвижением
сайта тесно связаны два процесса: индексация и ранжирование. За индексирование отдельных
страниц в сети отвечают поисковые боты.
Робот – это элемент поисковой
системы, который отвечает за индексацию интернет ресурсов. Простыми
словами, это программа, которая сканирует содержание сайта и
передает данные для дальнейшей обработки.
У каждой поисковой системы свой набор роботов (например, у Яндекса
есть следующие боты: основной, индексатор картинок, быстроробот для страниц с часто
обновляемым контентом и робот-зеркальщик
для работы с зеркалами сайта). Несмотря на различия, ключевая задача любого
краулера (другое название поискового бота) – создать базу данных (индекс), которая используется для формирования
релевантной выдачи.
Поисковый бот состоит из двух
частей: первая просматривает и «запоминает» контент
страницы (например, текст, картинки, видео и т.д.), а вторая –
направляет работу робота путем поиска ссылок на другие ресурсы.
С краулером можно взаимодействовать через файлы robots.txt и sitemap.xml, прописывая определенные рекомендации,
которые помогут в продвижении сайта (например, можно скрыть часть страниц или
задать частоту обновления).