Últimas publicações

AWS mostrou busca semântica por vídeo no Amazon Bedrock com Nova Multimodal Embeddings
A AWS publicou uma arquitetura de referência de busca por vídeo no Amazon Bedrock: o serviço divide os vídeos em cenas, indexa separadamente imagem, áudio e fala e combina tudo com metadados.

Amazon Bedrock recebe atribuição detalhada de custos de inference por usuários e aplicações
A AWS adicionou ao Amazon Bedrock uma atribuição detalhada de gastos: agora as empresas podem ver quem exatamente consome o orçamento de inference por usuários, funções, serviços e tenants.

AWS reduziu a produção de páginas de marketing de horas para minutos com AI agêntica
A AWS, junto com a Gradial, implementou AI agêntica no Amazon Bedrock: agora a montagem e a revisão de páginas web de marketing levam cerca de 10 minutos, em vez de quatro horas.

AWS disponibiliza BioFMs multimodais para desenvolvimento de medicamentos e medicina clínica
A Amazon Web Services descreveu como modelos biológicos multimodais de AI aceleram a busca por novos medicamentos, a estratificação de pacientes em ensaios e a personalização do tratamento.

Amazon Quick para marketing: um grafo de conhecimento pessoal a partir de dados dispersos
Amazon Quick se conecta às ferramentas e aos dados do profissional de marketing, cria um grafo de conhecimento pessoal e transforma o caos de diferentes sistemas em decisões estratégicas.

AWS mostrou como fazer o fine-tuning do NVIDIA Nemotron Speech para ASR preciso em cenários de nicho
A AWS descreveu uma abordagem end-to-end para o fine-tuning do modelo de fala NVIDIA Nemotron no Amazon EC2: com dados de áudio sintéticos, o ASR pode ser ajustado com mais precisão para medicina, suporte e outros domíni

Amazon demonstrou busca em grandes arquivos de vídeo em linguagem natural com o Nova
A AWS descreveu a arquitetura de uma busca multimodal escalável por vídeo: o Nova gera embeddings de áudio e imagem, o OpenSearch os indexa, e as consultas funcionam em milissegundos.

Amazon Bedrock AgentCore recebe Policy para controle de acesso de agentes de AI
A Amazon explicou como a nova camada Policy no Bedrock AgentCore verifica cada solicitação do agente a ferramentas e dados com base em regras do Cedar, sem depender da lógica do próprio modelo.

AWS explicou como fazer fine-tuning do Amazon Nova com um LLM como juiz para tarefas corporativas complexas
A AWS mostrou uma arquitetura de reinforcement fine-tuning para o Amazon Nova em que um LLM separado avalia as respostas do modelo e, em um caso de uso de revisão de contratos, o Nova 2 Lite superou soluções maiores.

AWS e vLLM integraram o P-EAGLE para acelerar a inferência de LLMs de grande porte em até 1,69x
A AWS mostrou como o P-EAGLE no vLLM elimina o gargalo da decodificação especulativa, gera vários tokens em um único forward pass e oferece ganho de velocidade de até 1,69x.

AWS mostrou como construir um motor de IA para testes A/B no Amazon Bedrock e DynamoDB
AWS publicou uma arquitetura para um sistema de IA para testes A/B: Bedrock analisa o contexto do usuário e ajuda a atribuir variantes não aleatoriamente, mas considerando o comportamento do usuário e as condições do exp

AWS Mostra Como Fazer Fine-Tuning da Amazon Nova via Nova Forge SDK e SageMaker Jobs
AWS lançou um guia detalhado sobre Nova Forge SDK: desde a avaliação baseline da Amazon Nova até SFT, RFT e deployment no SageMaker, elevando exact match de 13% para 78,8% e quasi-EM para 80,6%.

AWS lança o Nova Forge SDK para ajuste fino dos modelos Nova em AI corporativa
A AWS apresentou o Nova Forge SDK, um conjunto de ferramentas que simplifica a customização dos modelos Nova para equipes corporativas e elimina parte da rotina de infraestrutura.

AWS mostrou como o Amazon Bedrock AgentCore Gateway se conecta a APIs e serviços privados
A AWS mostrou como o Bedrock AgentCore Gateway, por meio do Resource Gateway, dá a agentes de AI acesso a APIs e serviços privados dentro de uma VPC nos modos managed e self-managed.

Amazon apresentou uma arquitetura de análise agêntica baseada em SageMaker, Athena e Quick
A AWS descreveu uma arquitetura na qual o Amazon Quick, com agentic AI sobre SageMaker, Athena e S3, permite que usuários de negócio façam perguntas a um lakehouse em linguagem natural.

Como a Sun Finance e a AWS aceleraram a verificação de documentos e reduziram o risco de fraude
A Sun Finance montou na AWS um pipeline de AI para verificação de identidade: a precisão da extração de dados subiu para 90,8%, o tempo de verificação caiu para menos de 5 segundos e o custo de processamento recuou 91%.

A AWS apresentou um sistema para migração e atualização de LLMs em produção com otimização de prompts
A AWS apresentou a Generative AI Model Agility Solution — uma abordagem para migrar e atualizar LLMs em produção com conversão de prompts, sua otimização e controle de qualidade.

AWS e Artificial Genius demonstraram forma de reduzir alucinações de LLM em finanças e medicina
AWS e Artificial Genius descreveram uma abordagem híbrida onde Amazon Nova compreende a solicitação, e uma camada determinística restringe as respostas apenas ao que pode ser verificado contra os dados de entrada.

AWS explica o lançamento de reinforcement fine-tuning no Amazon Bedrock via APIs compatíveis com OpenAI
AWS lançou um guia passo a passo sobre reinforcement fine-tuning no Amazon Bedrock: com configuração de APIs compatíveis com OpenAI, avaliador Lambda, treinamento de modelo e inferência sem hospedagem separada.

AWS explica como acelerar fine-tuning do Llama 3.2 Vision em dados do S3
AWS demonstrou um cenário prático onde SageMaker Unified Studio, Catalog e S3 permitem ajuste fino mais rápido do Llama 3.2 11B Vision Instruct em dados não estruturados para VQA.

AWS Lança Amazon Bedrock na Nova Zelândia com Claude e Inferência entre Regiões
Amazon Bedrock agora está disponível na região Ásia Pacífico (Nova Zelândia): empresas podem invocar Claude e Nova de Auckland, com carga distribuída entre Nova Zelândia e Austrália.

AWS mostrou como procurar explosões solares no SageMaker AI usando dados do instrumento ESA STIX
AWS publicou uma análise mostrando como treinar e implantar um modelo LSTM no SageMaker AI para detectar explosões solares usando dados do instrumento ESA STIX.

AWS explicou como escalar memória de agentes IA com padrões de namespace em AgentCore Memory
AWS publicou um guia sobre hierarquias de namespace, padrões de retrieval e controle de acesso IAM para AgentCore Memory — um serviço de memória de longo prazo para agentes IA.

Amazon Bedrock AgentCore Runtime agora suporta MCP-proxies sem servidor
AWS demonstrou como implementar MCP-proxies sem servidor no Amazon Bedrock AgentCore Runtime: uma camada programável com políticas de segurança, auditoria e observabilidade para agentes de IA.

Vanguard construiu um Analista Virtual na AWS seguindo oito princípios de dados AI-ready
Vanguard — uma das maiores gestoras de ativos do mundo — publicou um case sobre como construiu um Analista Virtual na AWS seguindo oito princípios de dados AI-ready e obteve resultados mensuráveis de negócio.

PwC e AWS demonstram sistema de IA para análise de contratos com redução de verificação até 90%
A PwC apresentou o sistema AIDA na AWS, que utiliza Amazon Bedrock para extrair termos de contratos, responder perguntas sobre eles e, segundo a empresa, reduz a verificação manual em até 90%.

NVIDIA lança Nemotron 3 Nano Omni no Amazon SageMaker JumpStart no dia do lançamento
NVIDIA adicionou Nemotron 3 Nano Omni ao Amazon SageMaker JumpStart no dia do lançamento para permitir que as empresas implantem rapidamente cenários de IA multimodal para texto, imagens, áudio e vídeo.

AWS explicou como converter um agente de IA baseado em texto em um assistente de voz no Nova 2 Sonic
AWS decompôs a transição de um agente de texto para um assistente de voz no Amazon Nova 2 Sonic: o que muda na arquitetura, prompts, ferramentas e experiência do usuário.

AWS mostra como Amazon Nova Act automatiza monitoramento de preços dos concorrentes
AWS descreveu um sistema baseado em Amazon Nova Act que visita simultaneamente sites de concorrentes, coleta preços e promoções de forma estruturada e ajuda a tomar decisões de precificação mais rapidamente.

Rocket Close Acelerou o Processamento de Documentos Hipotecários em 15 Vezes com AWS
Rocket Close, em parceria com AWS, acelerou o processamento de documentos hipotecários em 15 vezes, combinando Amazon Textract para OCR e Amazon Bedrock para segmentação, classificação e extração de campos com precisão d