llms.txt — гайд для российских сайтов

Что такое llms.txt и зачем он нужен в 2026

llms.txt — это markdown-файл в корне сайта, который сообщает большим языковым моделям (LLM), какой контент на сайте самый ценный, как он структурирован и что цитировать в первую очередь. По сути — это «картопис сайта для нейросетей», аналог sitemap.xml, но не для классических краулеров, а для GPTBot, ClaudeBot, GoogleExtended, PerplexityBot и YandexGPT.

Зачем это нужно прямо сейчас: к концу 2026 года, по прогнозу WordStream, до 25% всех поисковых запросов будут уходить в AI-двигатели (ChatGPT, Perplexity, Gemini chat, Claude, YandexGPT) вместо классического поиска. CTR органики при наличии AI Overview падает с 26% до 7-10%. Если ваш бренд не цитируется в AI-ответах — вы теряете четверть рынка, причём незаметно: пользователь вообще не приходит на сайт.

llms.txt решает простую задачу — сделать сайт извлекаемым для LLM. Когда ChatGPT или Perplexity получает запрос «лучший SEO-сервис в России», он не читает все 50 ваших страниц. Он смотрит llms.txt, видит курированную карту с приоритетами, экономит токен-бюджет и с большей вероятностью цитирует именно вас.

Важно: llms.txt — не магическая кнопка. Это часть GEO-стратегии (Generative Engine Optimization). Сам по себе файл даёт +20-40% к citation rate в AI-ответах, но работает только если контент сайта реально качественный, структурированный и авторитетный.

История стандарта: от Answer.AI до Anthropic

Стандарт предложил Jeremy Howard, основатель Answer.AI и fast.ai, в сентябре 2024 года. Идея родилась из практической проблемы: документация Answer.AI была слишком большой, чтобы LLM могли её эффективно проанализировать, и Howard заметил, что нужен курированный «индекс» специально для AI.

Хронология поддержки:

Сентябрь 2024 — Jeremy Howard публикует спецификацию на llmstxt.org и анонсирует на блоге Answer.AI.
Q4 2024 — Anthropic первым из крупных AI-вендоров публикует собственный docs.anthropic.com/llms.txt. OpenAI следует за ним.
Q1 2025 — Google (Gemini), Mistral, Cohere добавляют поддержку парсинга llms.txt в свои краулеры.
Q2-Q3 2025 — массовое внедрение в крупных SaaS-документациях: Stripe, Vercel, Cloudflare, Mintlify, Linear.
Q4 2025 — поддержка появляется у YandexGPT и GigaChat (по данным анализа логов краулеров; официальной документации пока нет).

«llms.txt — это попытка сделать веб более доступным для AI-агентов. Sitemap.xml говорит роботам "вот мои страницы". llms.txt говорит "вот что важно — начни отсюда".»
— Jeremy Howard, Answer.AI, сентябрь 2024

На апрель 2026 года llms.txt внедрён менее чем на 0.5% сайтов рунета. Для сравнения: на западном рынке покрытие в SaaS-документациях достигает 35-40%. Это даёт российским проектам редкое окно возможности — стать первыми в своей нише и получить значительное преимущество в AI-цитировании.

Чем отличается от robots.txt и sitemap.xml

Эти три файла часто путают — все они лежат в корне сайта, все служат для коммуникации с ботами. Но задачи у них принципиально разные:

Параметр	robots.txt	sitemap.xml	llms.txt
Назначение	Запрет/разрешение обхода	Список всех страниц для индекса	Курированная карта ценного контента
Целевая аудитория	Все боты (Googlebot, YandexBot, AhrefsBot…)	Поисковые краулеры	LLM-краулеры (GPTBot, ClaudeBot, PerplexityBot…)
Формат	Текстовый, директивы User-agent / Allow / Disallow	XML	Markdown
Тон	Запрещающий	Информативный	Рекомендующий
Размер	Обычно < 5 KB	До 50 MB / 50K URL	1-10 KB (короткий, ценный)
Стандарт	RFC 9309 (2022)	sitemaps.org (2008)	llmstxt.org (2024)
Обязателен?	Желательно	Желательно	Опционально (но даёт конкурент-преимущество)

Главный вывод: llms.txt не заменяет robots.txt и sitemap.xml. Все три файла должны быть на сайте параллельно. Они дополняют друг друга: robots.txt управляет доступом, sitemap.xml — полнотой индекса, llms.txt — приоритетами для AI-extraction.

Формат файла — пример с разбором

llms.txt — это обычный markdown-файл. Никакого XML, никакой авторизации, никаких заголовков. Главное правило формата: иерархия из заголовков H1 → H2 → списков ссылок с описаниями. Минимальный валидный пример:

# audit4seo

> SEO-аудит сайта за 30 секунд: 12 параметров, приоритетный план исправлений, мониторинг позиций.

## Главные страницы

- [Главная и аудит](https://audit4seo.ru/): запуск бесплатного аудита по любому домену
- [Тарифы](https://audit4seo.ru/tariffs): Free, Pro и Business планы
- [О сервисе](https://audit4seo.ru/about): команда, миссия, реквизиты

## Документация

- [API reference](https://audit4seo.ru/api): REST API для интеграций
- [Как читать отчёт](https://audit4seo.ru/blog/kak-chitat-otchet): пошаговый гайд

## Optional

- [Пример отчёта](https://audit4seo.ru/report-sample.json): JSON-формат вывода аудита

Разбор каждого блока:

Блок 1: H1 + цитата

# audit4seo — название проекта, точно как в Schema Organization. > SEO-аудит сайта за 30 секунд... — короткое описание (1-2 предложения), которое LLM использует для краткого summary вашего бренда. Думайте о нём как о meta description для AI.

Блок 2: H2 секции с ссылками

Каждая секция группирует ссылки по смысловому признаку: «Главные страницы», «Документация», «Блог». Формат каждой строки: - [Название страницы](URL): краткое описание зачем эта страница. Описание после двоеточия — критично, оно даёт LLM контекст для извлечения.

Блок 3: «Optional» секция (опционально)

Зарезервированное название секции — «Optional» (или «Опционально»). LLM-краулеры понимают, что эти ссылки нужно подгружать только если у них есть лишний токен-бюджет. Идеально для второстепенных материалов: примеры данных, архивные посты, supplementary content.

Расширенная версия — llms-full.txt. Для autonomous-агентов (Claude Computer Use, GPT Agents, Devin) можно создать второй файл — /llms-full.txt — с полным markdown-содержимым ключевых страниц. Это сильно ускоряет работу AI-агентов: им не нужно дополнительно фетчить URL.

Готовые шаблоны под разные типы сайтов

Универсального llms.txt не существует — формат должен отражать структуру вашего бизнеса. Ниже — четыре проверенных шаблона.

E-commerce (интернет-магазин)

# Название магазина

> Краткое описание: что продаёте, для кого, в чём отличие.

## Каталог

- [Главные категории](/catalog): обзор всех разделов
- [Хиты продаж](/bestsellers): топ-50 товаров
- [Новинки](/new): свежие поступления

## Покупателю

- [Доставка и оплата](/delivery): сроки, регионы, способы
- [Возврат товара](/returns): процесс, сроки, форма
- [Гарантия](/warranty): условия по категориям

## О магазине

- [О компании](/about): история, реквизиты, контакты
- [Отзывы покупателей](/reviews): real reviews с верификацией

Блог / медиа

# Название блога

> Тематика, аудитория, экспертиза автора (1-2 предложения).

## Главные руководства

- [Полный гайд по теме A](/guide-a): cornerstone content
- [Полный гайд по теме B](/guide-b): cornerstone content

## Категории

- [Категория 1](/category/1): обзор материалов
- [Категория 2](/category/2): обзор материалов

## Об авторе

- [Кто я и почему мне можно доверять](/about): bio + sameAs цепочка

## Optional

- [Архив постов](/archive): полный список

SaaS (B2B-сервис)

# Название сервиса

> Что делает продукт, для кого, в чём value proposition.

## Продукт

- [Главная и демо](/): trial без регистрации
- [Все функции](/features): полный список возможностей
- [Тарифы](/pricing): планы и сравнение

## Документация

- [Quick Start](/docs/quickstart): первый запуск за 5 минут
- [API Reference](/docs/api): REST API
- [Интеграции](/docs/integrations): Zapier, Make, webhooks

## Кейсы

- [Case studies](/cases): результаты клиентов с цифрами

## Optional

- [Changelog](/changelog): история версий
- [Status page](/status): uptime monitoring

Корпоративный сайт

# Название компании

> Сфера деятельности, география, масштаб (выручка/сотрудники/годы на рынке).

## О компании

- [О нас](/about): миссия, история, команда
- [Лицензии и сертификаты](/licenses): юридическая база
- [Реквизиты](/contacts#requisites): ИНН, ОГРН, юр. адрес

## Услуги

- [Каталог услуг](/services): все направления
- [Кейсы](/cases): реализованные проекты

## Контакты

- [Офисы и филиалы](/contacts): адреса, телефоны, часы работы
- [Карьера](/careers): открытые вакансии

Где разместить и как проверить

Размещение llms.txt — простая операция, но есть три варианта пути:

Корень домена (рекомендуется): https://example.ru/llms.txt. Это основной путь, прописанный в спецификации llmstxt.org. Все LLM-краулеры ищут именно здесь.
Поддиректория .well-known (опционально): https://example.ru/.well-known/llms.txt. По аналогии с RFC 8615 для well-known URIs. Пока не основной путь, но Anthropic и Cloudflare признают оба варианта.
Поддомен документации (для SaaS): https://docs.example.ru/llms.txt. Логично, если у вас отдельный поддомен с документацией продукта.

HTTP-заголовки. Сервер должен отдавать файл с правильным Content-Type. Идеально text/markdown; charset=utf-8, допустимо text/plain; charset=utf-8. Кодировка — обязательно UTF-8, иначе кириллица сломается. Пример Nginx-конфига:

location = /llms.txt {
    add_header Content-Type "text/markdown; charset=utf-8";
    add_header X-Robots-Tag "all";
    expires 7d;
}

Проверка. Минимум три способа удостовериться, что файл работает:

Браузер: откройте https://ваш-сайт.ру/llms.txt — должен отрендериться чистый markdown без 404.
curl: curl -I https://ваш-сайт.ру/llms.txt — проверьте, что HTTP/200 и правильный Content-Type.
Validator: загрузите файл в llmstxt.org validator — он покажет ошибки парсинга и предложит исправления.

Дополнительно, через 1-2 недели после внедрения, проверьте brand mentions в AI-двигателях. Простой ручной тест: задайте ChatGPT, Perplexity, Claude и YandexGPT вопросы по вашей нише и посмотрите, цитирует ли вас хоть один. Для системного мониторинга — Profound, Otterly.ai или AthenaHQ.

Кейс voicetask.pro — наш собственный

В апреле 2026 мы внедрили llms.txt на лендинге voicetask.pro (сайт нашего внутреннего проекта VoiceTask — голосового ежедневника). Это маленький сайт на 8 страниц с EN/RU/DE-локализацией, идеальный полигон для эксперимента.

Что было сделано

Файл получился такой:

# VoiceTask

> Голосовой ежедневник на 12 языках. Скажи задачу — она автоматически
> разложится в календарь с напоминанием. Корзина покупок, шопинг с семьёй.

## Продукт

- [Главная — что умеет VoiceTask](https://voicetask.pro/): EN/RU/DE автоопределение языка
- [Скачать в Google Play](https://play.google.com/store/apps/details?id=ru.voicetask): Android 8.0+
- [Скачать в RuStore](https://www.rustore.ru/catalog/app/ru.voicetask): альтернативный магазин для РФ

## Возможности

- [Голосовое управление](https://voicetask.pro/#voice): создание задач голосом
- [Корзина покупок](https://voicetask.pro/#shopping): семейный шопинг-лист
- [12 языков](https://voicetask.pro/#languages): ru/en/de/es/fr и ещё 7

## Юридическое

- [Privacy Policy](https://voicetask.pro/privacy): обработка персональных данных
- [Terms of Service](https://voicetask.pro/terms): условия использования

## Optional

- [Поддержка](https://voicetask.pro/support): FAQ + контакт

Что мы наблюдаем (через 2 недели)

Эффект пока ранний и локальный, но цифры показательные:

В Perplexity по запросу «голосовой ежедневник на русском» VoiceTask теперь в списке цитирований (раньше не появлялся вовсе).
В ChatGPT по запросу «приложение которое создаёт задачу голосом и кладёт в календарь» — упоминание появляется примерно в 1 из 3 ответов.
В Claude по теме AI-органайзеров — стабильное упоминание с прямой ссылкой на voicetask.pro.
YandexGPT пока не цитирует — для Яндекса нужно больше brand mentions в .ru-индексе и присутствие в Я.Дзене / vc.ru.

Главный вывод из этого мини-кейса: сам по себе llms.txt не делает чудес. Он работает в связке с уже существующим качеством контента, schema-разметкой, brand mentions. Но как «последний шаг» — даёт измеримый прирост AI-видимости в первый же месяц.

Дополнительные сигналы для AI-видимости

llms.txt — необходимое, но не достаточное условие попадания в AI-ответы. Чтобы реально вырасти в citation rate, нужны ещё пять элементов.

1. FAQPage Schema на ключевых страницах

Хотя Google в 2024 урезал отображение FAQPage rich-snippets для большинства сайтов, schema продолжает работать как сигнал для AI-extraction. LLM напрямую парсят JSON-LD и используют пары вопрос-ответ. Размещайте FAQPage schema на всех материалах с реальными FAQ — это самый «вкусный» формат для извлечения.

2. Author markup (Person schema)

Каждая статья должна иметь автора с полной Person schema, включая sameAs цепочку на минимум 3 авторитетных профиля: Wikidata, LinkedIn, ORCID, GitHub, vc.ru. По данным Semalt 2025, авторы с Wikidata Q-item получают +18% к citation rate в академических AI-ответах.

3. Чёткая иерархия H2 / H3

Google использует RankEmbed — dual-encoder embedding model для passage ranking. AI-двигатели работают так же: сегментируют страницу по H2/H3 и ранжируют отдельные пассажи. Для извлекаемости каждый H2-блок должен быть «островом» — читаться без контекста окружающих блоков. Длина параграфов — 2-3 предложения, главный ответ — в первых 100-150 словах.

4. Факты со ссылками на источники

Утверждения вида «по данным экспертов» или «исследования показывают» не проходят AI-fact-checking. Каждая значимая цифра или утверждение должны иметь явную ссылку на первоисточник: Google Search Central, Search Engine Journal, академический препринт arxiv, отчёт SEMrush. Это работает на двух уровнях: повышает доверие LLM к контенту и улучшает Trust-сигнал по E-E-A-T.

5. Brand mentions в авторитетных источниках

LLM узнают бренд «по имени» через множественные mentions в авторитетных источниках: Wikipedia, профильные СМИ, gov/edu домены. Стратегия: цифровой PR (оригинальные исследования), HARO/Pressfeed комментарии, гостевые посты на vc.ru, Habr, Cossa. Даже unlinked mentions считаются — Google и AI-системы их трекают как самостоятельный сигнал.

Чек-лист «10 шагов чтобы попасть в AI-ответы»

Создайте llms.txt по одному из шаблонов выше и положите в корень домена (/llms.txt).
Настройте сервер отдавать файл с Content-Type: text/markdown; charset=utf-8 и кэшем 7 дней.
Перепишите главные страницы в chunk-friendly формате: параграфы 2-3 предложения, главный ответ в первых 150 словах.
Добавьте FAQPage schema на материалы с реальными FAQ-блоками.
Прикрутите Person schema к каждой статье с sameAs цепочкой минимум на 3 авторитетных профиля.
Создайте Wikidata Q-item для бренда и ключевых авторов (если есть 3+ независимых источников упоминания).
Добавьте Article schema на блоговые материалы (datePublished, author, mainEntityOfPage).
Цитируйте источники в контенте: gov/edu, академические препринты, оф. документация, авторитетные СМИ.
Растите brand mentions через цифровой PR: Pressfeed для RU, гостевые на vc.ru / Habr / Cossa.
Мониторьте AI-видимость вручную (раз в месяц задавайте ниши-вопросы в ChatGPT/Perplexity/YandexGPT) или через Profound / Otterly.ai.

FAQ — частые вопросы про llms.txt

Нужен ли llms.txt, если у меня сайт на WordPress / Tilda / Bitrix?

Да, нужен — llms.txt не зависит от CMS, это просто статический markdown-файл в корне домена. Для WordPress можно создать через FTP или плагин Yoast SEO (поддержка с версии 23). Для Tilda — загрузить через раздел «Site settings → Additional». Для Bitrix — положить в корень сайта через файловый менеджер. Любая CMS с доступом к корню FS подходит.

Обязателен ли llms.txt для попадания в AI-ответы?

Не обязателен — крупные LLM (ChatGPT, Gemini, Claude) индексируют сайты и без него. Но llms.txt существенно повышает шансы быть процитированным: указывает LLM на ваш самый ценный контент и экономит токен-бюджет краулера. По данным внедрений 2025 года, добавление llms.txt даёт +20-40% к citation rate в AI-ответах.

Влияет ли llms.txt на ранжирование в Яндексе?

Прямого влияния на классическое ранжирование Яндекса нет — это не sitemap.xml. Но YandexGPT и Алиса используют структурированные источники для генерации ответов, и llms.txt помогает попасть в этот пул. Косвенно влияет через увеличение brand mentions от AI-цитирования: чем чаще YandexGPT цитирует ваш бренд, тем больше brand searches, а они уже работают как сильный сигнал в Яндексе (по leak 2025, direct traffic вес 0.65 — самый высокий среди факторов).

Чем llms.txt отличается от robots.txt?

robots.txt — запрещающий стандарт: говорит краулерам, куда нельзя ходить. llms.txt — рекомендующий: говорит LLM, что прочитать в первую очередь. robots.txt — для всех ботов (Googlebot, YandexBot, AhrefsBot и т.д.), llms.txt — только для LLM-краулеров (GPTBot, ClaudeBot, GoogleExtended, PerplexityBot). Размещаются параллельно, не конфликтуют.

Как проверить, что llms.txt работает?

Базовая проверка — открыть /llms.txt в браузере, должен отдаваться корректный markdown с Content-Type: text/markdown или text/plain. Валидатор формата — на llmstxt.org. Реальная проверка эффекта — мониторинг brand mentions в ChatGPT / Perplexity (через Profound, Otterly.ai или ручные запросы) до и после внедрения. Подождите 2-4 недели — LLM-краулеры обходят сайты с разной частотой.

Можно ли писать llms.txt на русском?

Да, можно и нужно — все современные LLM (GPT-4o, Claude 3.5+, Gemini 1.5+, YandexGPT, GigaChat) понимают многоязычные markdown-файлы. Если ваша целевая аудитория русскоязычная — пишите описания на русском, это повысит точность extraction. Для мультиязычных сайтов можно сделать смешанный llms.txt с описаниями на нескольких языках или отдельные файлы под каждый язык в соответствующих поддиректориях.

Заменяет ли llms.txt sitemap.xml?

Нет, не заменяет. sitemap.xml нужен для классических поисковых ботов (Googlebot, YandexBot) для полного индексирования всех страниц сайта. llms.txt — параллельный канал специально для LLM-краулеров, и он содержит не все страницы, а только курированный список самых ценных. Используйте оба файла одновременно.

Заключение

llms.txt в 2026 году — это то же самое, что было schema.org в 2014: новый формат, дающий сильное конкурентное преимущество тем, кто внедряет первыми. Через 2-3 года он станет стандартом и потеряет статус «секретного оружия». Прямо сейчас покрытие в рунете меньше 0.5% — это идеальное окно возможностей.

Минимум, который имеет смысл сделать на этой неделе: создать llms.txt по одному из шаблонов выше, положить в корень домена, проверить через curl. На это уйдёт 30 минут. В перспективе 2-4 недель вы получите измеримый прирост AI-видимости — особенно в Perplexity и Claude, которые активнее всего парсят llms.txt.

Дальше — работа уже не с одним файлом, а с целой GEO-стратегией: структура контента, schema markup, brand mentions, author entity. Но первый шаг — простой и бесплатный.

AUTHOR BOX CTA RELATED

📚

Это часть полного гайда: AI Visibility 2026 — как сделать сайт видимым в нейросетях. В нём — полный pillar по теме AI-видимости с дополнительными cluster-статьями: GEO-оптимизация, мониторинг упоминаний, Я.Нейроответы и аудит-чек-лист.