AWS Machine Learning Blog

AWS mostrou como fazer o fine-tuning do NVIDIA Nemotron Speech para ASR preciso em cenários de nicho
A AWS descreveu uma abordagem end-to-end para o fine-tuning do modelo de fala NVIDIA Nemotron no Amazon EC2: com dados de áudio sintéticos,

Amazon demonstrou busca em grandes arquivos de vídeo em linguagem natural com o Nova
A AWS descreveu a arquitetura de uma busca multimodal escalável por vídeo: o Nova gera embeddings de áudio e imagem, o OpenSearch os indexa,

Amazon Bedrock AgentCore recebe Policy para controle de acesso de agentes de AI
A Amazon explicou como a nova camada Policy no Bedrock AgentCore verifica cada solicitação do agente a ferramentas e dados com base em regra

AWS explicou como fazer fine-tuning do Amazon Nova com um LLM como juiz para tarefas corporativas complexas
A AWS mostrou uma arquitetura de reinforcement fine-tuning para o Amazon Nova em que um LLM separado avalia as respostas do modelo e, em um

AWS e vLLM integraram o P-EAGLE para acelerar a inferência de LLMs de grande porte em até 1,69x
A AWS mostrou como o P-EAGLE no vLLM elimina o gargalo da decodificação especulativa, gera vários tokens em um único forward pass e oferece

AWS mostrou como construir um motor de IA para testes A/B no Amazon Bedrock e DynamoDB
AWS publicou uma arquitetura para um sistema de IA para testes A/B: Bedrock analisa o contexto do usuário e ajuda a atribuir variantes não a

AWS Mostra Como Fazer Fine-Tuning da Amazon Nova via Nova Forge SDK e SageMaker Jobs
AWS lançou um guia detalhado sobre Nova Forge SDK: desde a avaliação baseline da Amazon Nova até SFT, RFT e deployment no SageMaker, elevand

AWS lança o Nova Forge SDK para ajuste fino dos modelos Nova em AI corporativa
A AWS apresentou o Nova Forge SDK, um conjunto de ferramentas que simplifica a customização dos modelos Nova para equipes corporativas e eli

AWS mostrou como o Amazon Bedrock AgentCore Gateway se conecta a APIs e serviços privados
A AWS mostrou como o Bedrock AgentCore Gateway, por meio do Resource Gateway, dá a agentes de AI acesso a APIs e serviços privados dentro de

Amazon apresentou uma arquitetura de análise agêntica baseada em SageMaker, Athena e Quick
A AWS descreveu uma arquitetura na qual o Amazon Quick, com agentic AI sobre SageMaker, Athena e S3, permite que usuários de negócio façam p

Como a Sun Finance e a AWS aceleraram a verificação de documentos e reduziram o risco de fraude
A Sun Finance montou na AWS um pipeline de AI para verificação de identidade: a precisão da extração de dados subiu para 90,8%, o tempo de v

A AWS apresentou um sistema para migração e atualização de LLMs em produção com otimização de prompts
A AWS apresentou a Generative AI Model Agility Solution — uma abordagem para migrar e atualizar LLMs em produção com conversão de prompts, s

AWS e Artificial Genius demonstraram forma de reduzir alucinações de LLM em finanças e medicina
AWS e Artificial Genius descreveram uma abordagem híbrida onde Amazon Nova compreende a solicitação, e uma camada determinística restringe a

AWS explica o lançamento de reinforcement fine-tuning no Amazon Bedrock via APIs compatíveis com OpenAI
AWS lançou um guia passo a passo sobre reinforcement fine-tuning no Amazon Bedrock: com configuração de APIs compatíveis com OpenAI, avaliad

AWS explica como acelerar fine-tuning do Llama 3.2 Vision em dados do S3
AWS demonstrou um cenário prático onde SageMaker Unified Studio, Catalog e S3 permitem ajuste fino mais rápido do Llama 3.2 11B Vision Instr

AWS Lança Amazon Bedrock na Nova Zelândia com Claude e Inferência entre Regiões
Amazon Bedrock agora está disponível na região Ásia Pacífico (Nova Zelândia): empresas podem invocar Claude e Nova de Auckland, com carga di

AWS mostrou como procurar explosões solares no SageMaker AI usando dados do instrumento ESA STIX
AWS publicou uma análise mostrando como treinar e implantar um modelo LSTM no SageMaker AI para detectar explosões solares usando dados do i

AWS explicou como escalar memória de agentes IA com padrões de namespace em AgentCore Memory
AWS publicou um guia sobre hierarquias de namespace, padrões de retrieval e controle de acesso IAM para AgentCore Memory — um serviço de mem

Amazon Bedrock AgentCore Runtime agora suporta MCP-proxies sem servidor
AWS demonstrou como implementar MCP-proxies sem servidor no Amazon Bedrock AgentCore Runtime: uma camada programável com políticas de segura

Vanguard construiu um Analista Virtual na AWS seguindo oito princípios de dados AI-ready
Vanguard — uma das maiores gestoras de ativos do mundo — publicou um case sobre como construiu um Analista Virtual na AWS seguindo oito prin

PwC e AWS demonstram sistema de IA para análise de contratos com redução de verificação até 90%
A PwC apresentou o sistema AIDA na AWS, que utiliza Amazon Bedrock para extrair termos de contratos, responder perguntas sobre eles e, segun

NVIDIA lança Nemotron 3 Nano Omni no Amazon SageMaker JumpStart no dia do lançamento
NVIDIA adicionou Nemotron 3 Nano Omni ao Amazon SageMaker JumpStart no dia do lançamento para permitir que as empresas implantem rapidamente

AWS explicou como converter um agente de IA baseado em texto em um assistente de voz no Nova 2 Sonic
AWS decompôs a transição de um agente de texto para um assistente de voz no Amazon Nova 2 Sonic: o que muda na arquitetura, prompts, ferrame

AWS mostra como Amazon Nova Act automatiza monitoramento de preços dos concorrentes
AWS descreveu um sistema baseado em Amazon Nova Act que visita simultaneamente sites de concorrentes, coleta preços e promoções de forma est

Rocket Close Acelerou o Processamento de Documentos Hipotecários em 15 Vezes com AWS
Rocket Close, em parceria com AWS, acelerou o processamento de documentos hipotecários em 15 vezes, combinando Amazon Textract para OCR e Am

Como TGS e AWS Reduziram o Treinamento de Modelo de IA Sísmica de Seis Meses para Cinco Dias
TGS e AWS alcançaram escalabilidade quase linear no treinamento do modelo foundation sísmica, reduzindo o ciclo de seis meses para cinco dia

Guidesly mostra como Jack AI no AWS transforma mídia de viagens em relatórios e marketing
Guidesly construiu um pipeline no AWS para Jack AI: o serviço recebe fotos e vídeos de viagens, enriquece-os com contexto, analisa por meio

AWS mostra como especulação de decodificação no Trainium2 acelera geração no vLLM
AWS explicou como especulação de decodificação no Trainium2 e vLLM ajuda a acelerar a geração em serviços de LLM, reduzir custo por token e

Amazon Bedrock adicionou verificação formal de respostas de IA para tarefas de conformidade
AWS está promovendo Automated Reasoning checks no Amazon Bedrock: o serviço prova formalmente a correção das respostas do modelo contra regr

AWS Apresentou um Guia Prático para Ajuste Fino do Amazon Nova via Nova Forge SDK
AWS lançou um guia prático sobre ajuste fino do Amazon Nova no Nova Forge SDK: desde a preparação de dados e sua mistura até o treinamento d