AWS Machine Learning Blog
Источник AI-новостей. Материалы автоматически отбираются и адаптируются редакцией Hamidun News.
Последние публикации

AWS показала семантический поиск по видео на Amazon Bedrock с Nova Multimodal Embeddings
AWS опубликовала референсную архитектуру видеопоиска на Amazon Bedrock: сервис режет ролики на сцены, отдельно индексирует картинку, звук и речь и смешивает всё с метаданными.

Amazon Bedrock получил детальный учет затрат на inference по пользователям и приложениям
AWS добавила в Amazon Bedrock детальную атрибуцию расходов: теперь компании могут видеть, кто именно тратит бюджет на inference, по пользователям, ролям, сервисам и tenant-ам.

AWS сократила выпуск маркетинговых страниц с часов до минут с помощью агентного ИИ
AWS вместе с Gradial внедрила агентный ИИ на Amazon Bedrock: теперь сборка и проверка маркетинговых веб-страниц занимает около 10 минут вместо четырёх часов.

AWS открыла мультимодальные BioFM для разработки лекарств и клинической медицины
Amazon Web Services описала, как мультимодальные биологические AI-модели ускоряют поиск новых препаратов, стратификацию пациентов в испытаниях и персонализацию лечения.

Amazon Quick для маркетинга: персональный граф знаний из разрозненных данных
Amazon Quick подключается к инструментам и данным маркетолога, строит персональный граф знаний и превращает хаос из разных систем в стратегические решения.

AWS показала, как дообучить NVIDIA Nemotron Speech для точного ASR в нишевых сценариях
AWS описала end-to-end схему дообучения речевой модели NVIDIA Nemotron на Amazon EC2: с синтетическими аудиоданными ASR можно точнее подстроить под медицину, саппорт и другие узкие домены.

Amazon показала поиск по большим видеоархивам на естественном языке через Nova
AWS описала архитектуру масштабируемого мультимодального поиска по видео: Nova строит эмбеддинги аудио и изображения, OpenSearch индексирует их, а запросы работают за миллисекунды.

Amazon Bedrock AgentCore получил Policy для контроля доступа ИИ-агентов
Amazon объяснила, как новый слой Policy в Bedrock AgentCore проверяет каждый запрос агента к инструментам и данным по правилам Cedar, не полагаясь на логику самой модели.

AWS объяснила, как дообучать Amazon Nova через LLM-судью для сложных корпоративных задач
AWS показала схему reinforcement fine-tuning для Amazon Nova, где отдельная LLM оценивает ответы модели, а в кейсе с договорами Nova 2 Lite обошла более крупные решения.

AWS и vLLM внедрили P-EAGLE для ускорения инференса больших LLM до 1,69 раза
AWS показала, как P-EAGLE в vLLM убирает узкое место спекулятивного декодирования, генерирует несколько токенов за один проход и даёт до 1,69× прироста скорости.

AWS показала, как собрать AI-движок для A/B-тестов на Amazon Bedrock и DynamoDB
AWS опубликовала архитектуру AI-системы для A/B-тестов: Bedrock анализирует контекст пользователя и помогает назначать варианты не вслепую, а с учётом поведения и условий эксперимента.

AWS показала, как дообучать Amazon Nova через Nova Forge SDK и SageMaker Jobs
AWS выпустила подробный гайд по Nova Forge SDK: от базовой оценки Amazon Nova до SFT, RFT и деплоя в SageMaker, подняв exact match с 13% до 78,8% и quasi-EM до 80,6%.

AWS запустила Nova Forge SDK для тонкой настройки моделей Nova в корпоративном AI
AWS представила Nova Forge SDK — набор инструментов, который упрощает кастомизацию моделей Nova для корпоративных команд и снимает часть инфраструктурной рутины.

AWS показала, как Amazon Bedrock AgentCore Gateway подключает приватные API и сервисы
AWS показала, как Bedrock AgentCore Gateway через Resource Gateway дает AI-агентам доступ к приватным API и сервисам внутри VPC в managed и self-managed режимах.

Amazon показала архитектуру агентной аналитики на базе SageMaker, Athena и Quick
AWS описала архитектуру, в которой Amazon Quick с агентным ИИ поверх SageMaker, Athena и S3 позволяет бизнес-пользователям задавать вопросы к lakehouse на естественном языке.

Как Sun Finance и AWS ускорили проверку документов и снизили риск мошенничества
Sun Finance собрала на AWS AI-конвейер для верификации личности: точность извлечения данных выросла до 90,8%, проверка сократилась до менее чем 5 секунд, а стоимость обработки упала на 91%.

AWS представила систему для миграции и апгрейда LLM в продакшене с оптимизацией промптов
AWS представила Generative AI Model Agility Solution — подход для миграции и апгрейда LLM в продакшене с конвертацией промптов, их оптимизацией и контролем качества.

AWS и Artificial Genius показали способ снизить галлюцинации LLM в финансах и медицине
AWS и Artificial Genius описали гибридный подход, в котором Amazon Nova понимает запрос, а детерминированный слой разрешает отвечать только тем, что можно проверить по входным данным.

AWS объяснила запуск reinforcement fine-tuning в Amazon Bedrock через OpenAI-совместимые API
AWS выпустила пошаговый разбор reinforcement fine-tuning в Amazon Bedrock: с настройкой OpenAI-совместимых API, Lambda-грейдером, обучением модели и инференсом без отдельного хостинга.

AWS объяснила, как ускорить fine-tuning Llama 3.2 Vision на данных из S3
AWS показала практический сценарий, где SageMaker Unified Studio, Catalog и S3 помогают быстрее дообучать Llama 3.2 11B Vision Instruct на неструктурированных данных для VQA.

AWS запустила Amazon Bedrock в Новой Зеландии с Claude и межрегиональным инференсом
Amazon Bedrock появился в регионе Asia Pacific (New Zealand): теперь компании могут вызывать Claude и Nova из Окленда, а нагрузка распределяется между Новой Зеландией и Австралией.

AWS показала, как искать солнечные вспышки в SageMaker AI по данным инструмента ESA STIX
AWS опубликовала разбор, в котором показывает, как обучить и развернуть LSTM-модель в SageMaker AI для поиска солнечных вспышек по данным прибора ESA STIX.

AWS объяснила, как масштабировать память AI-агентов с namespace-паттернами в AgentCore Memory
AWS опубликовала руководство по namespace-иерархиям, retrieval-паттернам и IAM-контролю доступа для AgentCore Memory — сервиса долгосрочной памяти AI-агентов.

Amazon Bedrock AgentCore Runtime теперь поддерживает бессерверные MCP-прокси
AWS показала, как развернуть serverless MCP-прокси в Amazon Bedrock AgentCore Runtime: программируемый слой с политиками безопасности, аудитом и observability для AI-агентов.

Vanguard построил Виртуального аналитика на AWS по восьми принципам AI-ready данных
Vanguard — один из крупнейших мировых управляющих активами — опубликовал кейс о том, как построил Виртуального аналитика на AWS по восьми принципам AI-ready данных и получил измеримый бизнес-результат.

PwC и AWS показали AI-систему для разбора контрактов с сокращением проверки до 90%
PwC представила на AWS систему AIDA, которая с помощью Amazon Bedrock извлекает условия из договоров, отвечает на вопросы по ним и, по данным компании, сокращает ручную проверку до 90%.

NVIDIA вывела Nemotron 3 Nano Omni в Amazon SageMaker JumpStart в день релиза
NVIDIA добавила Nemotron 3 Nano Omni в Amazon SageMaker JumpStart в день релиза, чтобы компании могли быстрее запускать мультимодальные AI-сценарии для текста, изображений, аудио и видео.

AWS объяснила, как перевести текстового ИИ-агента в голосового ассистента на Nova 2 Sonic
AWS разобрала переход от текстового агента к голосовому ассистенту на Amazon Nova 2 Sonic: что меняется в архитектуре, промптах, инструментах и пользовательском опыте.

AWS показала, как Amazon Nova Act автоматизирует мониторинг цен конкурентов
AWS описала систему на Amazon Nova Act, которая параллельно обходит сайты конкурентов, собирает цены и акции в структурированном виде и помогает быстрее принимать решения по ценообразованию.

Rocket Close ускорила обработку ипотечных документов в 15 раз с помощью AWS
Rocket Close вместе с AWS ускорила обработку ипотечных документов в 15 раз, объединив Amazon Textract для OCR и Amazon Bedrock для сегментации, классификации и извлечения полей с точностью около 90%.