AWS Machine Learning Blog

AWS показала, как дообучить NVIDIA Nemotron Speech для точного ASR в нишевых сценариях
AWS описала end-to-end схему дообучения речевой модели NVIDIA Nemotron на Amazon EC2: с синтетическими аудиоданными ASR можно точнее подстро

Amazon показала поиск по большим видеоархивам на естественном языке через Nova
AWS описала архитектуру масштабируемого мультимодального поиска по видео: Nova строит эмбеддинги аудио и изображения, OpenSearch индексирует

Amazon Bedrock AgentCore получил Policy для контроля доступа ИИ-агентов
Amazon объяснила, как новый слой Policy в Bedrock AgentCore проверяет каждый запрос агента к инструментам и данным по правилам Cedar, не пол

AWS объяснила, как дообучать Amazon Nova через LLM-судью для сложных корпоративных задач
AWS показала схему reinforcement fine-tuning для Amazon Nova, где отдельная LLM оценивает ответы модели, а в кейсе с договорами Nova 2 Lite

AWS и vLLM внедрили P-EAGLE для ускорения инференса больших LLM до 1,69 раза
AWS показала, как P-EAGLE в vLLM убирает узкое место спекулятивного декодирования, генерирует несколько токенов за один проход и даёт до 1,6

AWS показала, как собрать AI-движок для A/B-тестов на Amazon Bedrock и DynamoDB
AWS опубликовала архитектуру AI-системы для A/B-тестов: Bedrock анализирует контекст пользователя и помогает назначать варианты не вслепую,

AWS показала, как дообучать Amazon Nova через Nova Forge SDK и SageMaker Jobs
AWS выпустила подробный гайд по Nova Forge SDK: от базовой оценки Amazon Nova до SFT, RFT и деплоя в SageMaker, подняв exact match с 13% до

AWS запустила Nova Forge SDK для тонкой настройки моделей Nova в корпоративном AI
AWS представила Nova Forge SDK — набор инструментов, который упрощает кастомизацию моделей Nova для корпоративных команд и снимает часть инф

AWS показала, как Amazon Bedrock AgentCore Gateway подключает приватные API и сервисы
AWS показала, как Bedrock AgentCore Gateway через Resource Gateway дает AI-агентам доступ к приватным API и сервисам внутри VPC в managed и

Amazon показала архитектуру агентной аналитики на базе SageMaker, Athena и Quick
AWS описала архитектуру, в которой Amazon Quick с агентным ИИ поверх SageMaker, Athena и S3 позволяет бизнес-пользователям задавать вопросы

Как Sun Finance и AWS ускорили проверку документов и снизили риск мошенничества
Sun Finance собрала на AWS AI-конвейер для верификации личности: точность извлечения данных выросла до 90,8%, проверка сократилась до менее

AWS представила систему для миграции и апгрейда LLM в продакшене с оптимизацией промптов
AWS представила Generative AI Model Agility Solution — подход для миграции и апгрейда LLM в продакшене с конвертацией промптов, их оптимизац

AWS и Artificial Genius показали способ снизить галлюцинации LLM в финансах и медицине
AWS и Artificial Genius описали гибридный подход, в котором Amazon Nova понимает запрос, а детерминированный слой разрешает отвечать только

AWS объяснила запуск reinforcement fine-tuning в Amazon Bedrock через OpenAI-совместимые API
AWS выпустила пошаговый разбор reinforcement fine-tuning в Amazon Bedrock: с настройкой OpenAI-совместимых API, Lambda-грейдером, обучением

AWS объяснила, как ускорить fine-tuning Llama 3.2 Vision на данных из S3
AWS показала практический сценарий, где SageMaker Unified Studio, Catalog и S3 помогают быстрее дообучать Llama 3.2 11B Vision Instruct на н

AWS запустила Amazon Bedrock в Новой Зеландии с Claude и межрегиональным инференсом
Amazon Bedrock появился в регионе Asia Pacific (New Zealand): теперь компании могут вызывать Claude и Nova из Окленда, а нагрузка распределя

AWS показала, как искать солнечные вспышки в SageMaker AI по данным инструмента ESA STIX
AWS опубликовала разбор, в котором показывает, как обучить и развернуть LSTM-модель в SageMaker AI для поиска солнечных вспышек по данным пр

AWS объяснила, как масштабировать память AI-агентов с namespace-паттернами в AgentCore Memory
AWS опубликовала руководство по namespace-иерархиям, retrieval-паттернам и IAM-контролю доступа для AgentCore Memory — сервиса долгосрочной

Amazon Bedrock AgentCore Runtime теперь поддерживает бессерверные MCP-прокси
AWS показала, как развернуть serverless MCP-прокси в Amazon Bedrock AgentCore Runtime: программируемый слой с политиками безопасности, аудит

Vanguard построил Виртуального аналитика на AWS по восьми принципам AI-ready данных
Vanguard — один из крупнейших мировых управляющих активами — опубликовал кейс о том, как построил Виртуального аналитика на AWS по восьми пр

PwC и AWS показали AI-систему для разбора контрактов с сокращением проверки до 90%
PwC представила на AWS систему AIDA, которая с помощью Amazon Bedrock извлекает условия из договоров, отвечает на вопросы по ним и, по данны

NVIDIA вывела Nemotron 3 Nano Omni в Amazon SageMaker JumpStart в день релиза
NVIDIA добавила Nemotron 3 Nano Omni в Amazon SageMaker JumpStart в день релиза, чтобы компании могли быстрее запускать мультимодальные AI-с

AWS объяснила, как перевести текстового ИИ-агента в голосового ассистента на Nova 2 Sonic
AWS разобрала переход от текстового агента к голосовому ассистенту на Amazon Nova 2 Sonic: что меняется в архитектуре, промптах, инструмента

AWS показала, как Amazon Nova Act автоматизирует мониторинг цен конкурентов
AWS описала систему на Amazon Nova Act, которая параллельно обходит сайты конкурентов, собирает цены и акции в структурированном виде и помо

Rocket Close ускорила обработку ипотечных документов в 15 раз с помощью AWS
Rocket Close вместе с AWS ускорила обработку ипотечных документов в 15 раз, объединив Amazon Textract для OCR и Amazon Bedrock для сегментац

Как TGS и AWS сократили обучение сейсмической ИИ-модели с полугода до пяти дней
TGS вместе с AWS почти линейно масштабировала обучение сейсмической foundation-модели, сократив цикл с шести месяцев до пяти дней и увеличив

Guidesly показала, как Jack AI на AWS превращает медиа поездок в отчеты и маркетинг
Guidesly собрала на AWS конвейер для Jack AI: сервис принимает фото и видео из поездок, дополняет их контекстом, анализирует через CV и LLM

AWS показала, как speculative decoding на Trainium2 ускоряет генерацию в vLLM
AWS объяснила, как speculative decoding на Trainium2 и vLLM помогает ускорить генерацию в LLM-сервисах, снизить стоимость токена и поднять п

Amazon Bedrock добавил формальную верификацию AI-ответов для задач комплаенса
AWS продвигает Automated Reasoning checks в Amazon Bedrock: сервис формально доказывает корректность ответов модели по заданным правилам и у

AWS показала практический гайд по дообучению Amazon Nova через Nova Forge SDK
AWS выпустила практический гайд по дообучению Amazon Nova в Nova Forge SDK: от подготовки данных и их смешивания до обучения модели и провер