Граундинг (заземление ответов)
Граундинг — привязка ответов языковой модели к верифицированным внешним источникам (документам, базам данных, API), снижающая вероятность галлюцинаций и обеспечивающая фактическую достоверность и прослеживаемость генерируемого текста.
Граундинг — архитектурный приём, при котором LLM вырабатывает ответ не только на основе параметрических знаний, зафиксированных в весах при обучении, но и опираясь на явно предоставленный контекст из надёжных внешних источников. Цель — сделать каждое утверждение прослеживаемым до конкретного документа или записи.
Технически граундинг реализуется через RAG (Retrieval-Augmented Generation): перед генерацией система извлекает релевантные фрагменты из базы знаний и добавляет их в промпт. Модели дополнительно назначается инструкция отвечать только в рамках предоставленного контекста и цитировать источники. Более строгий вариант — постфактум-верификация: отдельная модель или детерминированный алгоритм проверяет каждое утверждение ответа против исходных источников и помечает непоодтверждённые факты.
Без граундинга LLM воспроизводит знания из обучающих данных, которые могут быть устаревшими или ошибочными, и генерирует несуществующие факты с высокой уверенностью. В корпоративных, медицинских и юридических приложениях, где цена ошибки высока, граундинг является обязательным архитектурным требованием.
В 2026 году граундинг поддерживается на уровне API у всех крупных провайдеров: Google Gemini предлагает «grounding with Google Search», Microsoft Copilot использует Bing для актуальных данных, Anthropic и OpenAI — встроенные инструменты веб-поиска. Метрика «grounding score» — доля утверждений, подкреплённых источником, — стала стандартной при оценке RAG-систем.