AWS Machine Learning Blog→ оригинал

Vanguard construyó un Analista Virtual en AWS siguiendo ocho principios de datos AI-ready

Vanguard, que gestiona más de $9 billones en activos, lanzó un Analista Virtual interno basado en AWS. La solución se construyó sobre datos, no sobre redes neur

Vanguard construyó un Analista Virtual en AWS siguiendo ocho principios de datos AI-ready
Источник: AWS Machine Learning Blog. Коллаж: Hamidun News.

Vanguard, один из крупнейших мировых управляющих активами с портфелем свыше $9 трлн, опубликовал подробный разбор того, как команда построила Виртуального аналитика — внутреннего AI-инструмента на базе AWS, который отвечает на аналитические вопросы бизнес-команд на естественном языке и без написания кода.

Сначала данные, потом модели

Ключевой вывод из опыта Vanguard: AI-трансформация начинается не с выбора нейросети и не с закупки вычислительных мощностей, а с наведения порядка в данных. Инженеры компании сформулировали восемь принципов AI-ready данных, которые легли в фундамент всего проекта ещё до написания первой строки кода модели. Принципы охватывают полный жизненный цикл — от семантики и структуры до безопасности и мониторинга: Единая таксономия — общий словарь для всех метрик, KPI и бизнес-сущностей, чтобы «доходность» в одном подразделении означала то же, что в другом Data lineage — прослеживаемость каждого показателя от первичного источника до аналитической витрины Своевременность — гарантия актуальности данных в момент каждого запроса Машиночитаемые метаданные — схемы и описания, понятные не только людям, но и автоматике Контроль доступа — гранулярные политики безопасности на уровне строк и столбцов Мониторинг качества — автоматические проверки корректности данных в реальном времени Стандартизированные форматы — единые схемы и соглашения, принятые всеми командами Документация — воспроизводимость каждого датасета и объяснимость каждого вычисления Без этих принципов AI-модели галлюцинируют на некорректных или неоднозначных данных.

Vanguard решал проблему системно, а не точечно — это и стало фундаментом их успеха.

AWS под капотом Для технической реализации Vanguard задействовал связку сервисов AWS.

Amazon S3 служит единым озером данных, в котором консолидированы источники из разных подразделений. AWS Glue Data Catalog берёт на себя ETL-пайплайны и централизованное хранение метаданных — именно здесь живут описания, схемы и бизнес-определения всех наборов данных. Обучение и деплой моделей реализованы на Amazon SageMaker. Оркестрация сложных многошаговых процессов — через AWS Step Functions, мониторинг качества данных и производительности пайплайнов — через Amazon CloudWatch с настроенными алертами и дашбордами для команды. Поверх этой инфраструктуры работает Виртуальный аналитик: он принимает вопросы на естественном языке, транслирует их в запросы к данным и возвращает структурированную аналитику с графиками и текстовыми интерпретациями. Бизнес-команды получают инсайты без SQL, Python и очереди заявок к специалистам по данным.

Результат для бизнеса > «Путь к AI-ready данным — это не разовый

проект, а операционная культура», — подчёркивают авторы кейса в блоге AWS Machine Learning. Vanguard фиксирует конкретный измеримый эффект. Время на подготовку типовых аналитических отчётов сократилось кратно. Команды портфельных менеджеров и риск-аналитиков задают вопросы напрямую системе — вместо того чтобы ставить задачи дата-аналитикам и ждать ответа часами или днями. Важно, что Виртуальный аналитик не подменяет экспертизу людей: он берёт на себя рутинную часть работы — агрегацию, фильтрацию и первичную интерпретацию данных — и освобождает аналитиков для задач более высокого уровня: разработки гипотез и стратегических решений.

Что это значит

Кейс Vanguard — один из наиболее детальных публичных описаний того, как крупная финансовая компания выстраивает AI-аналитику в продакшне. Восемь принципов AI-ready данных — практический чеклист для любой организации, которая хочет получить реальный бизнес-эффект от AI, а не красивый пилот на идеально подготовленных тестовых данных.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…