AWS запустила Neuron Agentic Development для автоматизации разработки AI-ядер
AWS анонсировала Neuron Agentic Development — набор AI-агентов, который автоматизирует разработку вычислительных ядер для чипов Trainium и Inferentia. До…
AI-обработка оригинала AWS Machine Learning Blog; редакция Hamidun News
AWS представила Neuron Agentic Development — коллекцию AI-агентов и специализированных инструментов, которые автоматизируют разработку и оптимизацию вычислительных ядер для собственных AI-ускорителей компании: Trainium и Inferentia. Инструментарий уже доступен разработчикам, строящим ML-инфраструктуру на AWS.
Почему ядра — это узкое место
Разработка эффективного AI-приложения на кастомном железе — это не только архитектура модели и качество данных. Чтобы нейросеть действительно использовала мощность AI-ускорителя, нужны вычислительные ядра (kernels): низкоуровневые программные блоки, управляющие тем, как конкретные операции физически выполняются на чипе. До появления Neuron Agentic Development это был сугубо ручной процесс. Инженеры тратили дни и недели на профилирование, изменение параметров тайлинга, векторизации и параллелизма, а затем снова на измерение результата. Особенно трудоёмко это с нестандартными операциями, которые не покрываются готовыми библиотеками: каждая новая архитектура модели требовала отдельного цикла экспертной настройки — а таких специалистов на рынке немного.
Как работают агенты
Neuron Agentic Development — это не единый агент, а набор специализированных, каждый из которых отвечает за конкретный этап цикла разработки: Анализ исходного кода ядра и выявление узких мест производительности Генерация нескольких альтернативных реализаций для каждой операции Автоматическое профилирование вариантов непосредственно на чипах Trainium и Inferentia Итеративное улучшение без участия инженера в каждом цикле измерений * Документирование найденных оптимизаций как воспроизводимых паттернов для переиспользования Агенты интегрированы с AWS Neuron SDK — официальным инструментарием для программирования этих чипов. Это значит, что они понимают аппаратную специфику Trainium и Inferentia и генерируют код, ориентированный именно на эти архитектуры, а не на универсальную абстракцию.
Стратегический контекст: ставка против NVIDIA AWS несколько лет инвестирует в
Trainium и Inferentia как альтернативу GPU NVIDIA для ML-задач. Trainium оптимизирован для обучения больших моделей, Inferentia — для инференса. При определённых нагрузках они экономически выгоднее A100 или H100, но у них есть принципиальный барьер: программировать под них сложнее. Экосистема NVIDIA вокруг CUDA, cuDNN и библиотек вроде Flash Attention строилась годами. Разработчики там чувствуют себя уверенно. AWS нужен способ снизить трение при переходе — и именно здесь AI-агенты могут сыграть роль, которую раньше могли выполнить только редкие специалисты по аппаратной оптимизации.
Что это значит
Neuron Agentic Development — попытка снять один из главных барьеров на пути к более широкому использованию Trainium и Inferentia. Если агенты справляются с задачей на практике, порог входа снижается, и кастомные чипы AWS становятся доступны не только крупным командам с глубокой аппаратной экспертизой, но и компаниям, которые раньше оставались на NVIDIA просто по умолчанию.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.