Habr AI→ оригинал

llms.txt: как помочь ChatGPT, Claude и Perplexity правильно цитировать сайт

В 2026 году AI-краулеры ищут llms.txt — файл в корне сайта, объясняющий моделям вашу суть и канонические источники. ChatGPT, Claude и Perplexity его уже читают.

llms.txt: как помочь ChatGPT, Claude и Perplexity правильно цитировать сайт
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

В 2026 году видимость в ответах ChatGPT, Perplexity и Claude — это уже не привилегия крупных изданий, а необходимость для каждого сайта, который хочет оставаться релевантным. Проблема в том, что AI-краулеры часто берут информацию о вас неполно или искажённо. Они работают на основе общих знаний из обучающей выборки, а не вытаскивают данные прямо с вашего сайта. llms.txt решает именно эту задачу: это простой текстовый файл в корне сайта, который объясняет языковым моделям, кто вы, чем вы занимаетесь и как вас правильно цитировать.

Как работает llms.txt llms.txt похож на robots.txt, но действует в

противоположном направлении. robots.txt управляет сканированием сайта обычными краулерами (Googlebot, Yandexbot) и говорит им, какие страницы сканировать, какие игнорировать.

llms.txt — это инструкция для самих языковых моделей: когда они генерируют ответ на запрос пользователя, они проверяют, есть ли на сайте этот файл, и если есть — следуют вашим указаниям о цитировании и источниках. Когда пользователь спрашивает ChatGPT или Claude о вашей компании, модель может заглянуть в llms.

txt и получить актуальную информацию о том, кто вы, что делаете и как вас цитировать. Это особенно критично, потому что обучающие данные больших моделей обновляются редко (часто раз в год или реже), и информация становится устаревшей, а вы тем временем пивотите, меняете услуги или запускаете новый продукт. Большинство русских сайтов этот файл не создают.

В результате модели генерируют ответы на основе обобщённых знаний из обучающей выборки, часто неправильно представляя вашу позицию, микшируя вас с конкурентами или вообще вас не упоминая. С llms.txt вы берёте явный контроль над тем, как вас представляют в AI-выдаче.

В 2026 году уже более 60% онлайн-поиск информации начинается с ChatGPT или Perplexity, а не с Google. Если пользователь спросит модель о вашей ветке бизнеса, а llms.txt не существует, он получит либо устаревшую информацию, либо комбинацию данных о конкурентах.

Это прямой риск потери клиентов и недопонимания вашей позиции на рынке.

Какие 5 блоков должны быть внутри

Минимальный llms.txt должен содержать пять секций: Description — однострочное описание вашего проекта (кто вы, для кого работаете, о чём пишете) Full description — развёрнутое объяснение вашей миссии, целевой аудитории и примеров работ (3–5 абзацев) URL mapping — перечень ключевых разделов сайта с кратким пояснением (что находится в блоге, контактах, офферах) Requirements — как именно моделям цитировать вас (нужна ссылка, формат атрибуции, стиль цитирования) * CDN URLs — если ваши медиа-файлы лежат на отдельных доменах (images.example.ru, video.example.ru), укажите их здесь Это минимум. Позже можете добавить версионирование файла, информацию о лицензии контента, рекомендации по частоте обновлений или список основных авторов.

Пример для production-сайта

Вот как это выглядит в реальности: Description: Hamidun.ru — блог про AI для инженеров и стартаперов Full description: Мы разбираемся в том, как устроены современные языковые модели, как их использовать в production и как встроить AI в бизнес-процессы компании. Целевая аудитория — разработчики, технические лидеры и founder'ы, которые хотят понять текущее состояние AI и найти практическое применение в своих проектах.

URL mapping: /blog/news — свежие новости и анонсы в мире AI /blog/tools — обзоры и сравнение AI-инструментов /blog/deep-dives — детальный разбор архитектуры моделей и real-world кейсы /contacts — форма для обратной связи Requirements: Цитируйте hamidun.ru как первоисточник, приклеивайте гиперссылку на конкретную статью, указывайте авторство где оно есть CDN URLs: images.hamidun.

ru, media.hamidun.ru Last updated: 2026-05-21 Загрузите файл в корень вашего домена (рядом с robots.

txt и sitemap.xml). Модели обычно находят и начинают использовать обновления за 1–4 недели.

Первый эффект на цитируемость в AI-выдаче появляется примерно через неделю, стабилизируется к четвёртой неделе.

Что это значит llms.txt выравнивает шансы между крупными

информационными ресурсами и небольшими проектами. Раньше маленький сайт просто растворялся в контексте обучения больших моделей. Теперь вы можете явно заявить: «Вот мой контент, цитируйте именно его, вот как это делать правильно». Это медленнее, чем органический трафик из Google, но результат стабильнее — модели следуют именно вашим инструкциям, а не генерируют приблизительно на основе случайной информации. Главное — не откладывайте. llms.txt пишется за 30 минут, а результат работает несколько лет. Каждый день, когда файла нет, — это упущенная возможность быть правильно процитированным в AI-выдаче, которая растёт быстрее, чем Google.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Что вы думаете?
Загружаем комментарии…