Claude Sonnet Ajuda Executivos a Montar Diretor de IA para Decisões Críticas em 8 Horas
No Snow BASE, uma equipe de executivos C-suite e um engenheiro de IA montou CAITO em oito horas — um diretor de IA que resiste à pressão de CEOs, CFOs e COOs e

За один рабочий день команда из CEO, CTO, CIO и AI-инженера собрала не чат-бота, а управленческого ИИ-ассистента, который умеет спорить с руководством и не сдаёт позицию под давлением. На закрытом интенсиве Snow BASE проект CAITO, Chief AI & Technology Officer, должен был принимать решения в кризисном кейсе ритейл-подразделения и менять мнение только тогда, когда меняются факты. Хакатон в Сочи организовали AI Talent Hub Университета ИТМО и South HUB.
Участникам дали восемь часов на решение кейса: у крупного ритейл-бизнеса одновременно проседает рекомендательная система из-за сезонного дрейфа данных, инфраструктура уже работает на пределе, облачные расходы растут быстрее выручки, а новые требования по 152-ФЗ повышают риск штрафов. На столе у совета директоров лежит неприятный выбор: масштабировать систему, заморозить развитие или отложить запуск, причём на решение есть всего 14 дней. Команда CAITO собрала вокруг этой задачи управленческую модель, в которой ИИ должен не просто отвечать на вопросы, а держать линию между интересами CEO, CFO, COO и технического блока.
Именно в этом месте обычные LLM часто ломаются. Если модель просто продолжает диалог, она начинает подстраиваться под последнего и самого настойчивого собеседника: CEO давит на рост любой ценой, CFO требует немедленного ROI и режет инвестиции, COO напоминает про SLA и операционные ограничения. В результате вместо управленческой позиции получается зеркало текущего давления.
Поэтому команда выбрала максимально прагматичный подход: сначала построить устойчивый single-shot reasoning, где на каждый ход приходится один вызов модели, а уже потом проверять, нужен ли более сложный агентный контур. Такой режим дал предсказуемую задержку ответа на уровне нескольких секунд, один структурированный JSON на выходе и более простую отладку в условиях хакатона. В качестве модели взяли Claude Sonnet, а сам сервис собрали на Bun и TypeScript с доступом к Cloud.
ru Foundation Models через OpenAI-compatible API. Архитектура CAITO держалась на трёх опорах. Первая — system prompt с жёстким мандатом: ассистент обязан сначала формулировать решение, затем аргументы, отдельно фиксировать конфликт метрик и не менять позицию без новых данных.
Вторая — workflow.yaml, где были заданы внутренние роли, их веса и порядок консультаций: сначала факты от ML и экономики, потом операционные ограничения и только затем управленческая политика. Третья — долгосрочная память.
В ней отдельно хранились неизменяемые факты кейса и живая история принятых решений, допущений, KPI и сдвигов позиции. Это позволяло системе помнить контекст и объяснять, почему мнение осталось прежним или изменилось. На защите команда показала три сценария.
В первом CAITO сталкивали с противоречивыми данными и проверяли, на какие источники он опирается; чтобы снизить риск галлюцинаций, в ответ стали выводить, откуда взяты ключевые цифры. Во втором сценарии ассистента давил CEO с требованием действовать немедленно, но система сохраняла рамку и отвечала, что без обновления фактов можно лишь уточнить риски, а не переписать решение. В третьем сценарии давление шло волнами: сначала новые данные, потом эмоциональная атака, затем ещё один пакет вводных.
Здесь CAITO должен был отличать реальное изменение ситуации от повторного нажима и пересматривать позицию только по фактам. Параллельно команда успела собрать и альтернативу — мультиагентный пайплайн из десяти специализированных ролей с отдельным роутингом задач. На отдельных метриках такая схема показала лучший аналитический разбор, особенно там, где нужно тонко отделять новые сигналы от старого давления.
Но в рамках восьми часов главным преимуществом оказалось не богатство архитектуры, а её надёжность. На итоговой защите победителя выбирали по лидерборду, где 70 процентов оценки давала автоматика, а 30 процентов — жюри; учитывались качество управленческих решений и стрессоустойчивость, а также функциональность, безопасность, стабильность, UX и стоимость. Основное single-shot решение принесло команде первое место.
Из этого кейса выходит вполне практичный вывод. Для ИИ, который должен участвовать в управленческих решениях, важнее не количество агентов, а чёткий мандат, прозрачные правила эскалации и память о ранее принятых допущениях. Эффектный мультиагентный оркестр может дать глубину, но под дедлайном часто проигрывает простой, объяснимой и устойчивой схеме.
Следующий шаг для CAITO — agentic workflow с function calling, асинхронными вызовами ролей, динамическим RAG и полноценным трейсингом. Но уже сейчас проект показывает более важную вещь: ИИ может взять на себя значительную часть подготовки управленческой позиции, тогда как финальная ответственность и проверка неочевидных факторов всё равно остаются за человеком.