Vanguard construiu um Analista Virtual na AWS seguindo oito princípios de dados AI-ready
Vanguard, que gerencia mais de $9 trilhões em ativos, lançou um Analista Virtual interno alimentado pela AWS. A solução foi construída sobre dados, não redes ne

Vanguard, один из крупнейших мировых управляющих активами с портфелем свыше $9 трлн, опубликовал подробный разбор того, как команда построила Виртуального аналитика — внутреннего AI-инструмента на базе AWS, который отвечает на аналитические вопросы бизнес-команд на естественном языке и без написания кода.
Сначала данные, потом модели
Ключевой вывод из опыта Vanguard: AI-трансформация начинается не с выбора нейросети и не с закупки вычислительных мощностей, а с наведения порядка в данных. Инженеры компании сформулировали восемь принципов AI-ready данных, которые легли в фундамент всего проекта ещё до написания первой строки кода модели. Принципы охватывают полный жизненный цикл — от семантики и структуры до безопасности и мониторинга: Единая таксономия — общий словарь для всех метрик, KPI и бизнес-сущностей, чтобы «доходность» в одном подразделении означала то же, что в другом Data lineage — прослеживаемость каждого показателя от первичного источника до аналитической витрины Своевременность — гарантия актуальности данных в момент каждого запроса Машиночитаемые метаданные — схемы и описания, понятные не только людям, но и автоматике Контроль доступа — гранулярные политики безопасности на уровне строк и столбцов Мониторинг качества — автоматические проверки корректности данных в реальном времени Стандартизированные форматы — единые схемы и соглашения, принятые всеми командами Документация — воспроизводимость каждого датасета и объяснимость каждого вычисления Без этих принципов AI-модели галлюцинируют на некорректных или неоднозначных данных.
Vanguard решал проблему системно, а не точечно — это и стало фундаментом их успеха.
AWS под капотом Для технической реализации Vanguard задействовал связку сервисов AWS.
Amazon S3 служит единым озером данных, в котором консолидированы источники из разных подразделений. AWS Glue Data Catalog берёт на себя ETL-пайплайны и централизованное хранение метаданных — именно здесь живут описания, схемы и бизнес-определения всех наборов данных. Обучение и деплой моделей реализованы на Amazon SageMaker. Оркестрация сложных многошаговых процессов — через AWS Step Functions, мониторинг качества данных и производительности пайплайнов — через Amazon CloudWatch с настроенными алертами и дашбордами для команды. Поверх этой инфраструктуры работает Виртуальный аналитик: он принимает вопросы на естественном языке, транслирует их в запросы к данным и возвращает структурированную аналитику с графиками и текстовыми интерпретациями. Бизнес-команды получают инсайты без SQL, Python и очереди заявок к специалистам по данным.
Результат для бизнеса > «Путь к AI-ready данным — это не разовый
проект, а операционная культура», — подчёркивают авторы кейса в блоге AWS Machine Learning. Vanguard фиксирует конкретный измеримый эффект. Время на подготовку типовых аналитических отчётов сократилось кратно. Команды портфельных менеджеров и риск-аналитиков задают вопросы напрямую системе — вместо того чтобы ставить задачи дата-аналитикам и ждать ответа часами или днями. Важно, что Виртуальный аналитик не подменяет экспертизу людей: он берёт на себя рутинную часть работы — агрегацию, фильтрацию и первичную интерпретацию данных — и освобождает аналитиков для задач более высокого уровня: разработки гипотез и стратегических решений.
Что это значит
Кейс Vanguard — один из наиболее детальных публичных описаний того, как крупная финансовая компания выстраивает AI-аналитику в продакшне. Восемь принципов AI-ready данных — практический чеклист для любой организации, которая хочет получить реальный бизнес-эффект от AI, а не красивый пилот на идеально подготовленных тестовых данных.