Robots.txt

Robots.txt (в русскоязычной транслитерации - "роботс") - файл, позволяющий регулировать индексацию веб-ресурса ведущими поисковиками. Этот текстовый документ размещается в основной директории сайта.

файл robots txt что

Общая информация и принципы работы

Первым делом поисковые боты, оказываясь на сайте, обращаются к файлу роботс, который позволяет им узнать, какие страницы, разделы и иные категории необходимо проигнорировать. Тут же робот получает данные о расположении карты сайта в формате XML и сведения о динамических параметрах в URL-адресах.

С помощью Robots.txt можно исключить из поиска дубликаты веб-страниц, все страницы ошибок, что позволит не только улучшить ранжирование ресурса, но и поднять на новый уровень комфорт пользователя в процессе посещения сайта.

Создать этот текстовый документ можно в любом редакторе, задав ему это имя. Но его содержание должно удовлетворять имеющимся требованиям и правилам. Подготовленный с учетом всех особенностей файл загружается в корень сайта на хостинге или сервере.

Важные директивы:

User-agent. С помощью данного файла можно управлять доступом к веб-сайту различных поисковых роботов - Яндекса, Гугла и т.д. После нахождения записи User-agent осуществляется поиск подстроки с названием соответствующего поисковика. Так, для Яндекса задаются такие значения - Yandex, YandexBot или *. В первом случае файл будет использоваться всеми поисковыми роботами, во втором - только основным ботом индексации, а в третьем - не будет индексироваться роботами вообще.

Disallow. Этой директивой определяется запрет доступа к ресурсу в целом или отдельным его элементам. Значение "/" - полный запрет, "/cgi-bin" - запрет индексации только для страниц, которые начинаются с /cgi-bin.

Host. С помощью этой директивы можно указать имя главного зеркала, если у сайта есть дополнительные зеркала. Для этого напротив Host указывается нужный URL-адрес. При доступе по защищенному каналу также нужно задать HTTPS и при необходимости номер порта.

Пример robots.txt

Вот несколько примеров использования robots.txt для сайта www.example.com :

URL файла robots.txt: www.example.com/robots.txt

Блокирование доступа всех поисковых роботов к любому контенту

Пользовательский агент: * Disallow: /

Использование этого синтаксиса в файле robots.txt укажет всем поисковым роботам не сканировать никакие страницы на www.example.com , включая домашнюю страницу.

Предоставление всем поисковым роботам доступа ко всему контенту

Пользовательский агент: * Disallow:

Использование этого синтаксиса в файле robots.txt указывает поисковым роботам сканировать все страницы на www.example.com, включая главную.

Блокировка определенного поискового робота из определенной папки

Пользовательский агент: Googlebot Disallow: / example-subfolder /

Этот синтаксис указывает только поисковому роботу Google (имя агента пользователя Googlebot) не сканировать страницы, содержащие строку URL www.example.com/example-subfolder/ .

Блокирование определенного поискового робота с определенной веб-страницы

Пользовательский агент: Bingbot Disallow: /example-subfolder/blocked-page.html

Этот синтаксис указывает только сканеру Bing (имя пользовательского агента Bing) избегать сканирования определенной страницы по адресу www.example.com/example-subfolder/blocked-page.html.

Как работает robots.txt?

У поисковых систем есть две основные задачи:

Сканирование Интернета для обнаружения контента;
Индексирование этого контента, чтобы его могли обслуживать искатели, ищущие информацию.

Чтобы сканировать сайты, поисковые системы переходят по ссылкам с одного сайта на другой - в конечном итоге просматривая многие миллиарды ссылок и веб-сайтов. Такое ползание иногда называют «пауками».

После перехода на веб-сайт, но перед его просмотром, поисковый робот будет искать файл robots.txt. Если он найдет его, сканер сначала прочитает этот файл, прежде чем продолжить просмотр страницы. Поскольку файл robots.txt содержит информацию о том, как поисковая система должна сканировать, найденная там информация будет указывать на дальнейшие действия сканера на этом конкретном сайте. Если файл robots.txt не содержит директив, запрещающих действия агента пользователя (или если на сайте нет файла robots.txt), он продолжит сканирование другой информации на сайте.

Что такое RSS

RSS (син. РСС) — особый формат передачи информации с сайта, кратко отображающий содержимое.

Трансляция контента в ленту новостей - для сайта плюс в карму, потому что просмотр новой информации в виде ленты прост для пользователя.

Оцените статью: 5.0 (3)

Быстро определяем причины проседания трафика: пошаговая инструкция

Чем нужно научиться управлять на сайте для повышения эффективности SEO

Технический аудит веб-ресурса

Оптимизация структуры, перелинковка и пагинация сайта

При заказе
продвижения

Скидка на
разработку
сайта

Заказать

Приведи
друга

получи
скидку

Подробнее

Специальное
предложение

против
вируса

Получить кп

Как вам статья?

Вообще не айсНормульШикардос!

SEO на экспорт

Эта книга о том, для чего, кому и как именно нужно выходить за рамки Рунета. В книге мы рассмотрели практические аспекты продвижения сайта в Буржунете, раскрыли характерные отличия от «раскрутки» сайта в России.

Читайте онлайн Скачать

SEO на экспорт

В книге вы найдете развенчание некоторых распространенных мифов, ответы на основные вопросы о том, где брать англоязычный контент, как работает Google за рубежом, тонкости работы с инструментарием продвижения, будущее ссылочного ранжирования и многое другое.

Последний SEO-чеклист

Эта книга - самый обширный и затрагивающий ключевые аспекты работы сеошника чек-лист. С одной стороны - это пособие для обучения и проверки собственных знаний в сфере SEO-оптимизации и продвижения. С другой - это должностная инструкция и инструмент контроля для руководителя, который легко поймет, что нужно требовать от квалифицированного SEO-специалиста.

Читайте онлайн Скачать

Последний SEO-чеклист

В книге предложены чек-листы по основным видам работ в сфере поискового продвижения, включая подготовительную работу, формирование семантики, техническую оптимизацию, наращивание ссылочной массы, проверку коммерческих факторов, контент-маркетинг и базовые моменты SMM.

Черная книга про белый PR

Это книга об управлении репутацией в интернете, в которой рассмотрены главные технологии этого направления деятельности, затронуты этические и глобальные аспекты современного информационного общества. В ней рассмотрена работа с основными сервисами мониторинга, раскрыты правила отработки негатива и создания позитива о бренде, главные инструменты SERM, предложен чек-лист для самостоятельной работы и многое другое.

Читайте онлайн Скачать

Черная книга про белый PR

Книга будет интересна владельцам бизнеса и публичным людям, пиарщикам, маркетологам, SEO-специалистам и всем пользователям сети, которые задумываются о вопросах имиджа и репутации.

Обучение основам копирайтинга

Об эре контента в интернете не рассказывают только ленивые. Без адекватных текстов сегодня не станут успешны как информационные порталы, так и интернет-магазины в большинстве ниш.

Читайте онлайн Скачать

Обучение основам копирайтинга

Вместе с тем большой спрос на копирайтеров и перспективы солидных заработков настолько велики, что обучаться профессии хотят чуть ли не все от мала (старшеклассников и выпускников школ) до велика (пенсионеров и пожилых людей, освоивших азы владения ПК).

Комментарии

Показать сначала:

Новые Старые

Роман

28.09.2021, 14:54

+ 0

– 0

Как плохо в наше время иметь свой сайт и не иметь представления о том, что такоефайл robots txt . Приходиться доверять разработчикам практически вслепую. Но дело не в том, что существует риск обмана. А в возникающей необходимости что-то исправить в этом самом файле. Хорошо, когда команда работает долго и без сбоев, хоть через месяц или год можно прийти и попросить сделать новый правильный файл. И это одна из причин, почему я никогда не обращаюсь за помощью к фрилансерам..

Ответить

Юлия

25.09.2017, 18:40

+ 0

– 0

Рассмотрен один из немаловажных этапов продвижения. Вполне понятно и доступно написано. Ясно теперь назначение этого этапа в раскрутке.

Ответить

Влад

27.12.2015, 15:18

+ 0

– 0

Довольно познавательно. Благодарю автора за лаконичное описание принципов работы робота, очень долго не мог понять, как же вся эта система работает, но статья-таки творит чудеса! Так же, отдельное спасибо хотел сказать за оформление сайта - удобен в использовании....

Ответить

Написать комментарий

Новые исследования

2025-02-27 00:00:00

GPT-4.5: Умнее, человечнее, безопаснее — куда ведёт нас OpenAI?

Открывая системную карту GPT-4.5 от OpenAI, датированную 27 февраля 2025 года, вы ждёте технических деталей, но находите нечто большее — окно в эру умного и чуткого ИИ. Читатели хотят знать: насколько она точна, безопасна и человечна? Этот документ обещает не только цифры, но и историю о балансе между прорывом и ответственностью. Готовьтесь к открытиям

Читать 441

2022-12-16 00:00:00

Вы не поверите: что случилось с Яндексом и загадочным Ya.ru

Тяжело проглотить пилюлю, но траектория развития SERP и оптимизации Яндексом своих поисковых алгоритмов окончательно сошла на нет. Почти невозможно представить, что когда-то давно они стремились разработать алгоритмы и инструменты машинного обучения для улучшения результатов поиска. А, помните этот милый слоган: «Яндекс — найдется все»? Да, теперь он остался в прошлом; это было более простое время… время, когда Яндекс был главным помощником во всем, что касалось поиска. Увы, после 25 лет новаторского прогресса эпоха Яндекса закончилась.

Читать 7

Больше исследований

Интервью и мнения SEO-гуру

Для глубокого погружения в профессию оптимизатора, мы настоятельно рекомендуем совмещать чтение с просмотром видео.

Евгений Аралов: главные прогнозы на 2020 (сервисы и методы)

Далеко не каждый специалист может быстро и качественно продвинуть сайт в непростой тематике. Например, букмекерская площадка для ставок в спорте, где SEO чуть ли не ед...

Анализ SEO для СМИ: ведущий эксперт отрасли Галина Бакушева

Для одних Галина Бакушева ассоциируется с каналом Телеграм «Сеошница», для других, она создатель собственного ТВ на фейсбук. Однако такая популярность не г...

Ксения Пескова: качественный продукт приятно рассматривать даже краулерам

Всего два года потребовалось, чтобы стажер SiteClinic, Ксения Пескова, стала не просто тимлидом компании, но и трастовым экспертом в области SEO. Все началось почти ср...

Кирилл Рамирас: лучшие рекомендации по ведению блога для ИМ

Кирилл Рамирас интересен владельцам бизнеса в сети своими успешными проектами, опытом работы в SEO с 2007 года. Регулярное обновление публикаций на Altblog.ru &nd...

Алексей Алексеич: рост и боль в продвижении 2020 - какие прогнозы сбылись?

Сам о себе говорит, что он точно не Андрей, любит котов и смотрит «Битву Престолов». Если серьезно, эксперту 25 лет и с 2011 года основательно занимается с...

Андрей Буйлов: проблемы seo клиента не волнуют!

Андрей Буйлов – известный в сети эксперт по SEO продвижению сайтов. Свою карьеру начинал в конце 90-х. Тогда будущий спикер разнообразных конференций, семинаров ...

Все интервью

Нам доверяют крупные международные компании