Формат и семантика файла /robots.txt
следующие:
Файл должен содержать одну
или несколько записей (records), разделенных одной или несколькими
пустыми строками (оканчивающимися CR, CR/NL или NL). Каждая
запись должна содержать строки (lines) в форме:
"<field>:<optional_space><value><optional_space>".
Поле <field> является регистронезависимым.
Комментарии могут быть включены
в файл в обычной для UNIX форме: символ # означает начало
комментария, конец строки - конец комментария.
Запись должна начинаться с
одной или нескольких строк User-Agent, следом должна быть
одна или несколько строк Disallow, формат которых приведен
ниже. Нераспознанные строки игнорируются.
User-Agent значением
<value> этого поля должно являться имя поискового робота,
которому в этой записи устанавливаются права доступа. Если
в записи указано более одного имени робота, то права доступа
распространяются для всех указанных имен.
заглавные или строчные символы роли не играют если в качестве
значения этого поля указан символ "*", то заданные
в этой записи права доступа распространяются на любых поисковых
роботов, запросивших файл /robots.txt
Disallow значением
<value> этого поля должен являться частичный URL, который
не должен индексироваться. Это может быть полный путь или
частичный; любой URL, начинающийся с такого пути не должен
индексироваться.
Например, Disallow: /help закрывает и /help.html,
и /help/index.html, тогда как Disallow: /help/- только /help/index.html.
Если значение Disallow не указано, то это означает,
что индексируется все дерево каталогов сервера.
Любая запись (record) должна состоять
хотя бы из одной строки (line) User-Agent и одной – Disallow
Если файл /robots.txt пуст,
или не отвечает заданному формату и семантике, или его не
существует, любой поисковый робот будет работать по своему
алгоритму.
|