Что такое llms.txt и зачем он нужен в 2026
llms.txt — это markdown-файл в корне сайта, который сообщает большим языковым моделям (LLM), какой контент на сайте самый ценный, как он структурирован и что цитировать в первую очередь. По сути — это «картопис сайта для нейросетей», аналог sitemap.xml, но не для классических краулеров, а для GPTBot, ClaudeBot, GoogleExtended, PerplexityBot и YandexGPT.
Зачем это нужно прямо сейчас: к концу 2026 года, по прогнозу WordStream, до 25% всех поисковых запросов будут уходить в AI-двигатели (ChatGPT, Perplexity, Gemini chat, Claude, YandexGPT) вместо классического поиска. CTR органики при наличии AI Overview падает с 26% до 7-10%. Если ваш бренд не цитируется в AI-ответах — вы теряете четверть рынка, причём незаметно: пользователь вообще не приходит на сайт.
llms.txt решает простую задачу — сделать сайт извлекаемым для LLM. Когда ChatGPT или Perplexity получает запрос «лучший SEO-сервис в России», он не читает все 50 ваших страниц. Он смотрит llms.txt, видит курированную карту с приоритетами, экономит токен-бюджет и с большей вероятностью цитирует именно вас.
Важно: llms.txt — не магическая кнопка. Это часть GEO-стратегии (Generative Engine Optimization). Сам по себе файл даёт +20-40% к citation rate в AI-ответах, но работает только если контент сайта реально качественный, структурированный и авторитетный.
История стандарта: от Answer.AI до Anthropic
Стандарт предложил Jeremy Howard, основатель Answer.AI и fast.ai, в сентябре 2024 года. Идея родилась из практической проблемы: документация Answer.AI была слишком большой, чтобы LLM могли её эффективно проанализировать, и Howard заметил, что нужен курированный «индекс» специально для AI.
Хронология поддержки:
- Сентябрь 2024 — Jeremy Howard публикует спецификацию на llmstxt.org и анонсирует на блоге Answer.AI.
- Q4 2024 — Anthropic первым из крупных AI-вендоров публикует собственный docs.anthropic.com/llms.txt. OpenAI следует за ним.
- Q1 2025 — Google (Gemini), Mistral, Cohere добавляют поддержку парсинга llms.txt в свои краулеры.
- Q2-Q3 2025 — массовое внедрение в крупных SaaS-документациях: Stripe, Vercel, Cloudflare, Mintlify, Linear.
- Q4 2025 — поддержка появляется у YandexGPT и GigaChat (по данным анализа логов краулеров; официальной документации пока нет).
«llms.txt — это попытка сделать веб более доступным для AI-агентов. Sitemap.xml говорит роботам "вот мои страницы". llms.txt говорит "вот что важно — начни отсюда".»
— Jeremy Howard, Answer.AI, сентябрь 2024
На апрель 2026 года llms.txt внедрён менее чем на 0.5% сайтов рунета. Для сравнения: на западном рынке покрытие в SaaS-документациях достигает 35-40%. Это даёт российским проектам редкое окно возможности — стать первыми в своей нише и получить значительное преимущество в AI-цитировании.
Чем отличается от robots.txt и sitemap.xml
Эти три файла часто путают — все они лежат в корне сайта, все служат для коммуникации с ботами. Но задачи у них принципиально разные:
| Параметр | robots.txt | sitemap.xml | llms.txt |
|---|---|---|---|
| Назначение | Запрет/разрешение обхода | Список всех страниц для индекса | Курированная карта ценного контента |
| Целевая аудитория | Все боты (Googlebot, YandexBot, AhrefsBot…) | Поисковые краулеры | LLM-краулеры (GPTBot, ClaudeBot, PerplexityBot…) |
| Формат | Текстовый, директивы User-agent / Allow / Disallow | XML | Markdown |
| Тон | Запрещающий | Информативный | Рекомендующий |
| Размер | Обычно < 5 KB | До 50 MB / 50K URL | 1-10 KB (короткий, ценный) |
| Стандарт | RFC 9309 (2022) | sitemaps.org (2008) | llmstxt.org (2024) |
| Обязателен? | Желательно | Желательно | Опционально (но даёт конкурент-преимущество) |
Главный вывод: llms.txt не заменяет robots.txt и sitemap.xml. Все три файла должны быть на сайте параллельно. Они дополняют друг друга: robots.txt управляет доступом, sitemap.xml — полнотой индекса, llms.txt — приоритетами для AI-extraction.
Формат файла — пример с разбором
llms.txt — это обычный markdown-файл. Никакого XML, никакой авторизации, никаких заголовков. Главное правило формата: иерархия из заголовков H1 → H2 → списков ссылок с описаниями. Минимальный валидный пример:
# audit4seo
> SEO-аудит сайта за 30 секунд: 12 параметров, AI-план исправлений, мониторинг позиций.
## Главные страницы
- [Главная и аудит](https://audit4seo.ru/): запуск бесплатного аудита по любому домену
- [Тарифы](https://audit4seo.ru/tariffs): Free, Pro и Business планы
- [О сервисе](https://audit4seo.ru/about): команда, миссия, реквизиты
## Документация
- [API reference](https://audit4seo.ru/api): REST API для интеграций
- [Как читать отчёт](https://audit4seo.ru/blog/kak-chitat-otchet): пошаговый гайд
## Optional
- [Пример отчёта](https://audit4seo.ru/report-sample.json): JSON-формат вывода аудита
Разбор каждого блока:
Блок 1: H1 + цитата
# audit4seo — название проекта, точно как в Schema Organization. > SEO-аудит сайта за 30 секунд... — короткое описание (1-2 предложения), которое LLM использует для краткого summary вашего бренда. Думайте о нём как о meta description для AI.
Блок 2: H2 секции с ссылками
Каждая секция группирует ссылки по смысловому признаку: «Главные страницы», «Документация», «Блог». Формат каждой строки: - [Название страницы](URL): краткое описание зачем эта страница. Описание после двоеточия — критично, оно даёт LLM контекст для извлечения.
Блок 3: «Optional» секция (опционально)
Зарезервированное название секции — «Optional» (или «Опционально»). LLM-краулеры понимают, что эти ссылки нужно подгружать только если у них есть лишний токен-бюджет. Идеально для второстепенных материалов: примеры данных, архивные посты, supplementary content.
Расширенная версия — llms-full.txt. Для autonomous-агентов (Claude Computer Use, GPT Agents, Devin) можно создать второй файл — /llms-full.txt — с полным markdown-содержимым ключевых страниц. Это сильно ускоряет работу AI-агентов: им не нужно дополнительно фетчить URL.
Готовые шаблоны под разные типы сайтов
Универсального llms.txt не существует — формат должен отражать структуру вашего бизнеса. Ниже — четыре проверенных шаблона.
E-commerce (интернет-магазин)
# Название магазина
> Краткое описание: что продаёте, для кого, в чём отличие.
## Каталог
- [Главные категории](/catalog): обзор всех разделов
- [Хиты продаж](/bestsellers): топ-50 товаров
- [Новинки](/new): свежие поступления
## Покупателю
- [Доставка и оплата](/delivery): сроки, регионы, способы
- [Возврат товара](/returns): процесс, сроки, форма
- [Гарантия](/warranty): условия по категориям
## О магазине
- [О компании](/about): история, реквизиты, контакты
- [Отзывы покупателей](/reviews): real reviews с верификацией
Блог / медиа
# Название блога
> Тематика, аудитория, экспертиза автора (1-2 предложения).
## Главные руководства
- [Полный гайд по теме A](/guide-a): cornerstone content
- [Полный гайд по теме B](/guide-b): cornerstone content
## Категории
- [Категория 1](/category/1): обзор материалов
- [Категория 2](/category/2): обзор материалов
## Об авторе
- [Кто я и почему мне можно доверять](/about): bio + sameAs цепочка
## Optional
- [Архив постов](/archive): полный список
SaaS (B2B-сервис)
# Название сервиса
> Что делает продукт, для кого, в чём value proposition.
## Продукт
- [Главная и демо](/): trial без регистрации
- [Все функции](/features): полный список возможностей
- [Тарифы](/pricing): планы и сравнение
## Документация
- [Quick Start](/docs/quickstart): первый запуск за 5 минут
- [API Reference](/docs/api): REST API
- [Интеграции](/docs/integrations): Zapier, Make, webhooks
## Кейсы
- [Case studies](/cases): результаты клиентов с цифрами
## Optional
- [Changelog](/changelog): история версий
- [Status page](/status): uptime monitoring
Корпоративный сайт
# Название компании
> Сфера деятельности, география, масштаб (выручка/сотрудники/годы на рынке).
## О компании
- [О нас](/about): миссия, история, команда
- [Лицензии и сертификаты](/licenses): юридическая база
- [Реквизиты](/contacts#requisites): ИНН, ОГРН, юр. адрес
## Услуги
- [Каталог услуг](/services): все направления
- [Кейсы](/cases): реализованные проекты
## Контакты
- [Офисы и филиалы](/contacts): адреса, телефоны, часы работы
- [Карьера](/careers): открытые вакансии
Где разместить и как проверить
Размещение llms.txt — простая операция, но есть три варианта пути:
- Корень домена (рекомендуется):
https://example.ru/llms.txt. Это основной путь, прописанный в спецификации llmstxt.org. Все LLM-краулеры ищут именно здесь. - Поддиректория .well-known (опционально):
https://example.ru/.well-known/llms.txt. По аналогии с RFC 8615 для well-known URIs. Пока не основной путь, но Anthropic и Cloudflare признают оба варианта. - Поддомен документации (для SaaS):
https://docs.example.ru/llms.txt. Логично, если у вас отдельный поддомен с документацией продукта.
HTTP-заголовки. Сервер должен отдавать файл с правильным Content-Type. Идеально text/markdown; charset=utf-8, допустимо text/plain; charset=utf-8. Кодировка — обязательно UTF-8, иначе кириллица сломается. Пример Nginx-конфига:
location = /llms.txt {
add_header Content-Type "text/markdown; charset=utf-8";
add_header X-Robots-Tag "all";
expires 7d;
}
Проверка. Минимум три способа удостовериться, что файл работает:
- Браузер: откройте
https://ваш-сайт.ру/llms.txt— должен отрендериться чистый markdown без 404. - curl:
curl -I https://ваш-сайт.ру/llms.txt— проверьте, что HTTP/200 и правильный Content-Type. - Validator: загрузите файл в llmstxt.org validator — он покажет ошибки парсинга и предложит исправления.
Дополнительно, через 1-2 недели после внедрения, проверьте brand mentions в AI-двигателях. Простой ручной тест: задайте ChatGPT, Perplexity, Claude и YandexGPT вопросы по вашей нише и посмотрите, цитирует ли вас хоть один. Для системного мониторинга — Profound, Otterly.ai или AthenaHQ.
Кейс voicetask.pro — наш собственный
В апреле 2026 мы внедрили llms.txt на лендинге voicetask.pro (сайт нашего внутреннего проекта VoiceTask — голосового ежедневника). Это маленький сайт на 8 страниц с EN/RU/DE-локализацией, идеальный полигон для эксперимента.
Что было сделано
Файл получился такой:
# VoiceTask
> Голосовой ежедневник на 12 языках. Скажи задачу — она автоматически
> разложится в календарь с напоминанием. Корзина покупок, шопинг с семьёй.
## Продукт
- [Главная — что умеет VoiceTask](https://voicetask.pro/): EN/RU/DE автоопределение языка
- [Скачать в Google Play](https://play.google.com/store/apps/details?id=ru.voicetask): Android 8.0+
- [Скачать в RuStore](https://www.rustore.ru/catalog/app/ru.voicetask): альтернативный магазин для РФ
## Возможности
- [Голосовое управление](https://voicetask.pro/#voice): создание задач голосом
- [Корзина покупок](https://voicetask.pro/#shopping): семейный шопинг-лист
- [12 языков](https://voicetask.pro/#languages): ru/en/de/es/fr и ещё 7
## Юридическое
- [Privacy Policy](https://voicetask.pro/privacy): обработка персональных данных
- [Terms of Service](https://voicetask.pro/terms): условия использования
## Optional
- [Поддержка](https://voicetask.pro/support): FAQ + контакт
Что мы наблюдаем (через 2 недели)
Эффект пока ранний и локальный, но цифры показательные:
- В Perplexity по запросу «голосовой ежедневник на русском» VoiceTask теперь в списке цитирований (раньше не появлялся вовсе).
- В ChatGPT по запросу «приложение которое создаёт задачу голосом и кладёт в календарь» — упоминание появляется примерно в 1 из 3 ответов.
- В Claude по теме AI-органайзеров — стабильное упоминание с прямой ссылкой на voicetask.pro.
- YandexGPT пока не цитирует — для Яндекса нужно больше brand mentions в .ru-индексе и присутствие в Я.Дзене / vc.ru.
Главный вывод из этого мини-кейса: сам по себе llms.txt не делает чудес. Он работает в связке с уже существующим качеством контента, schema-разметкой, brand mentions. Но как «последний шаг» — даёт измеримый прирост AI-видимости в первый же месяц.
Дополнительные сигналы для AI-видимости
llms.txt — необходимое, но не достаточное условие попадания в AI-ответы. Чтобы реально вырасти в citation rate, нужны ещё пять элементов.
1. FAQPage Schema на ключевых страницах
Хотя Google в 2024 урезал отображение FAQPage rich-snippets для большинства сайтов, schema продолжает работать как сигнал для AI-extraction. LLM напрямую парсят JSON-LD и используют пары вопрос-ответ. Размещайте FAQPage schema на всех материалах с реальными FAQ — это самый «вкусный» формат для извлечения.
2. Author markup (Person schema)
Каждая статья должна иметь автора с полной Person schema, включая sameAs цепочку на минимум 3 авторитетных профиля: Wikidata, LinkedIn, ORCID, GitHub, vc.ru. По данным Semalt 2025, авторы с Wikidata Q-item получают +18% к citation rate в академических AI-ответах.
3. Чёткая иерархия H2 / H3
Google использует RankEmbed — dual-encoder embedding model для passage ranking. AI-двигатели работают так же: сегментируют страницу по H2/H3 и ранжируют отдельные пассажи. Для извлекаемости каждый H2-блок должен быть «островом» — читаться без контекста окружающих блоков. Длина параграфов — 2-3 предложения, главный ответ — в первых 100-150 словах.
4. Факты со ссылками на источники
Утверждения вида «по данным экспертов» или «исследования показывают» не проходят AI-fact-checking. Каждая значимая цифра или утверждение должны иметь явную ссылку на первоисточник: Google Search Central, Search Engine Journal, академический препринт arxiv, отчёт SEMrush. Это работает на двух уровнях: повышает доверие LLM к контенту и улучшает Trust-сигнал по E-E-A-T.
5. Brand mentions в авторитетных источниках
LLM узнают бренд «по имени» через множественные mentions в авторитетных источниках: Wikipedia, профильные СМИ, gov/edu домены. Стратегия: цифровой PR (оригинальные исследования), HARO/Pressfeed комментарии, гостевые посты на vc.ru, Habr, Cossa. Даже unlinked mentions считаются — Google и AI-системы их трекают как самостоятельный сигнал.
Чек-лист «10 шагов чтобы попасть в AI-ответы»
- Создайте llms.txt по одному из шаблонов выше и положите в корень домена (
/llms.txt). - Настройте сервер отдавать файл с
Content-Type: text/markdown; charset=utf-8и кэшем 7 дней. - Перепишите главные страницы в chunk-friendly формате: параграфы 2-3 предложения, главный ответ в первых 150 словах.
- Добавьте FAQPage schema на материалы с реальными FAQ-блоками.
- Прикрутите Person schema к каждой статье с sameAs цепочкой минимум на 3 авторитетных профиля.
- Создайте Wikidata Q-item для бренда и ключевых авторов (если есть 3+ независимых источников упоминания).
- Добавьте Article schema на блоговые материалы (datePublished, author, mainEntityOfPage).
- Цитируйте источники в контенте: gov/edu, академические препринты, оф. документация, авторитетные СМИ.
- Растите brand mentions через цифровой PR: Pressfeed для RU, гостевые на vc.ru / Habr / Cossa.
- Мониторьте AI-видимость вручную (раз в месяц задавайте ниши-вопросы в ChatGPT/Perplexity/YandexGPT) или через Profound / Otterly.ai.
FAQ — частые вопросы про llms.txt
Нужен ли llms.txt, если у меня сайт на WordPress / Tilda / Bitrix?
Да, нужен — llms.txt не зависит от CMS, это просто статический markdown-файл в корне домена. Для WordPress можно создать через FTP или плагин Yoast SEO (поддержка с версии 23). Для Tilda — загрузить через раздел «Site settings → Additional». Для Bitrix — положить в корень сайта через файловый менеджер. Любая CMS с доступом к корню FS подходит.
Обязателен ли llms.txt для попадания в AI-ответы?
Не обязателен — крупные LLM (ChatGPT, Gemini, Claude) индексируют сайты и без него. Но llms.txt существенно повышает шансы быть процитированным: указывает LLM на ваш самый ценный контент и экономит токен-бюджет краулера. По данным внедрений 2025 года, добавление llms.txt даёт +20-40% к citation rate в AI-ответах.
Влияет ли llms.txt на ранжирование в Яндексе?
Прямого влияния на классическое ранжирование Яндекса нет — это не sitemap.xml. Но YandexGPT и Алиса используют структурированные источники для генерации ответов, и llms.txt помогает попасть в этот пул. Косвенно влияет через увеличение brand mentions от AI-цитирования: чем чаще YandexGPT цитирует ваш бренд, тем больше brand searches, а они уже работают как сильный сигнал в Яндексе (по leak 2025, direct traffic вес 0.65 — самый высокий среди факторов).
Чем llms.txt отличается от robots.txt?
robots.txt — запрещающий стандарт: говорит краулерам, куда нельзя ходить. llms.txt — рекомендующий: говорит LLM, что прочитать в первую очередь. robots.txt — для всех ботов (Googlebot, YandexBot, AhrefsBot и т.д.), llms.txt — только для LLM-краулеров (GPTBot, ClaudeBot, GoogleExtended, PerplexityBot). Размещаются параллельно, не конфликтуют.
Как проверить, что llms.txt работает?
Базовая проверка — открыть /llms.txt в браузере, должен отдаваться корректный markdown с Content-Type: text/markdown или text/plain. Валидатор формата — на llmstxt.org. Реальная проверка эффекта — мониторинг brand mentions в ChatGPT / Perplexity (через Profound, Otterly.ai или ручные запросы) до и после внедрения. Подождите 2-4 недели — LLM-краулеры обходят сайты с разной частотой.
Можно ли писать llms.txt на русском?
Да, можно и нужно — все современные LLM (GPT-4o, Claude 3.5+, Gemini 1.5+, YandexGPT, GigaChat) понимают многоязычные markdown-файлы. Если ваша целевая аудитория русскоязычная — пишите описания на русском, это повысит точность extraction. Для мультиязычных сайтов можно сделать смешанный llms.txt с описаниями на нескольких языках или отдельные файлы под каждый язык в соответствующих поддиректориях.
Заменяет ли llms.txt sitemap.xml?
Нет, не заменяет. sitemap.xml нужен для классических поисковых ботов (Googlebot, YandexBot) для полного индексирования всех страниц сайта. llms.txt — параллельный канал специально для LLM-краулеров, и он содержит не все страницы, а только курированный список самых ценных. Используйте оба файла одновременно.
Заключение
llms.txt в 2026 году — это то же самое, что было schema.org в 2014: новый формат, дающий сильное конкурентное преимущество тем, кто внедряет первыми. Через 2-3 года он станет стандартом и потеряет статус «секретного оружия». Прямо сейчас покрытие в рунете меньше 0.5% — это идеальное окно возможностей.
Минимум, который имеет смысл сделать на этой неделе: создать llms.txt по одному из шаблонов выше, положить в корень домена, проверить через curl. На это уйдёт 30 минут. В перспективе 2-4 недель вы получите измеримый прирост AI-видимости — особенно в Perplexity и Claude, которые активнее всего парсят llms.txt.
Дальше — работа уже не с одним файлом, а с целой GEO-стратегией: структура контента, schema markup, brand mentions, author entity. Но первый шаг — простой и бесплатный.
Запустите бесплатный SEO-аудит — проверим готовность к AI-ответам
Проверим наличие llms.txt, FAQPage schema, Author markup, чёткость иерархии H2/H3 и ещё 8 параметров AI-видимости. Без регистрации, за 30 секунд.