2026

Ministério da Justiça dos EUA recorrerá decisão judicial que bloqueou proibição de Anthropic em órgãos federais
O Ministério da Justiça dos EUA pretende contestar a decisão de um tribunal federal que suspendeu temporariamente a proibição da administraç

Como TGS e AWS Reduziram o Treinamento de Modelo de IA Sísmica de Seis Meses para Cinco Dias
TGS e AWS alcançaram escalabilidade quase linear no treinamento do modelo foundation sísmica, reduzindo o ciclo de seis meses para cinco dia

API de OpenAI e Consultas Fan-Out do GPT: Como Especialistas em SEO Analisam a Busca por IA
O autor demonstra como obter consultas fan-out ocultas do GPT via API OpenAI e usá-las para analisar como modelos de IA coletam fontes e ger

Hack The Box: Como MCP Inspector Transforma Ferramentas de IA em um Novo Vetor de Ataque
Uma análise do Kobold do HTB Season 10 mostra como um único utilitário dev para servidores de IA pode levar a RCE, LFI, reutilização de cred

Startup de IA indiana Sarvam levanta até $350 milhões com avaliação de $1,5 bilhão
Sarvam AI está perto de fechar uma rodada de $300-350 milhões com avaliação de $1,5 bilhão, um dos sinais mais fortes de que a Índia quer cr

Google adicionou os modos Flex e Priority à API Gemini para equilibrar preço e confiabilidade
Google lançou dois novos níveis de serviço na API Gemini: Flex para tarefas em segundo plano mais baratas e Priority para tráfego crítico co

OpenAI compra o programa de tecnologia TBPN para fortalecer sua influência sobre o diálogo público sobre IA
OpenAI entra no setor de mídia adquirindo TBPN, um programa popular no Vale do Silício, prometendo manter a independência editorial do proje

Sistema baseado em LLM reduziu preparação de mapas de controle de qualidade em fábrica metalúrgica de 2 horas para 5 minutos
Em uma fábrica metalúrgica, um sistema LLM começou a montar mapas de controle de qualidade em 3–5 minutos em vez de duas horas: não um promp

Habr AI mostra como adicionar memória e contexto a um chat LLM em Python com Ollama e LiteLLM
Em uma nova parte do tutorial sobre chat em Python com Ollama e LiteLLM, é demonstrado como armazenar o histórico de mensagens, transmitir c

Claude Sonnet e Jarvis Pattern: por que agentes de IA podem precisar apenas de um sistema operacional
No Habr, propuseram construir agentes de IA pessoais não em torno de frameworks complexos, mas em uma combinação de LLM, sistema operacional

Microsoft Apresenta Três Modelos para Processamento de Texto, Voz e Imagens
A divisão Microsoft AI apresentou a linha MAI: um modelo para transcrição de fala, um gerador de voz e um sistema para imagens, reforçando s

Google simplificou a transição do ChatGPT para Gemini: agora é possível transferir memória e conversas
Gemini ganhou uma função para importar memória, preferências e histórico de chats do ChatGPT e outros serviços de IA, permitindo que os usuá

Startup de IA apresenta colega digital para Zoom que se reporta aos gerentes
Um novo agente de IA para equipes de escritório pode participar de cada reunião do Zoom, acompanhar tarefas, identificar independentemente l

Microsoft reestrutura vendas de Copilot após pressão de analistas de Wall Street
Microsoft abandonou a ideia de distribuir Copilot como parte de pacotes corporativos e apostou em vendas separadas pagas para demonstrar aos

SpaceX Prepara IPO Recorde enquanto OpenAI e Anthropic se Aproximam do Mercado Público
O pedido confidencial de IPO da SpaceX com avaliação acima de $1,75 trilhão pode desencadear uma onda de grandes ofertas, seguida por OpenAI

Microsoft investirá $10 bilhões no Japão em quatro anos para atender à demanda de IA na Ásia
A Microsoft anunciou um pacote de investimentos de $10 bilhões no Japão nos próximos quatro anos, acelerando sua expansão asiática e aprovei

Google Gemma 4, NVIDIA e OpenClaw: Agentes AI locais sem cobrança por token
Google e NVIDIA estão promovendo a execução local do Gemma 4 em RTX, Jetson e DGX Spark para que agentes AI sempre ativos como OpenClaw func

Yandex mostrou como chegar às respostas do Alice e medir visibilidade de busca
Yandex lançou uma seção 'Visibilidade do Site no Alice' no Webmaster. A mensagem para os negócios é clara: respostas do assistente vêm não d

Flant: como um desenvolvedor Go transformou Zed e Gemini em um agente IA útil
Um desenvolvedor Go da Flant descreveu o caminho desde plugins IDE lentos até uma combinação de Zed, Gemini 3 Flash e gopls-mcp, que fornece

Micron e Mercado de Memória: Analistas Preveem Demanda Alta Impulsionada por IA até Fim da Década
Analistas da Melius Research acreditam que o boom da IA generativa está transformando o mercado de memória: a demanda por DRAM e NAND poderi

OpenAI desacelera crescimento de receita e novos usuários em meio a custosa infraestrutura de IA
OpenAI enfrenta custos crescentes de computação, receita mais fraca e desaceleração na aquisição de usuários, enquanto parte da audiência mi

Funcionários do Google exigem que Pichai bloqueie acesso do Pentágono aos modelos de IA da empresa
Mais de 600 funcionários do Google, incluindo especialistas do DeepMind e executivos sênior, exigiram que Sundar Pichai bloqueie o acesso do

OpenAI não atingiu metas internas de crescimento de usuários do ChatGPT e receita
Segundo o WSJ, OpenAI ficou aquém de suas próprias metas de novos usuários e vendas, intensificando a questão dentro da empresa: o crescimen

Talkie-1930: Pesquisadores lançaram um modelo 13B sem conhecimento da internet e Segunda Guerra Mundial
Talkie-1930 é um modelo 13B aberto, treinado apenas em textos em inglês até 1931, para estudar pensamento histórico, vazamentos de dados e c

MarkTechPost mostra como construir um agente VLA leve com modelo de mundo latente e MPC
Em um novo tutorial, MarkTechPost detalha como construir um agente embodied simplificado: ele opera em frames RGB, aprende um modelo de mund

Arcee AI Lança Trinity Large Thinking — Modelo de Raciocínio Aberto para Agentes IA
Arcee AI disponibilizou os pesos do Trinity Large Thinking sob licença Apache 2.0 e aposta em cenários de agentes longos, raciocínio multiet

UBTech Disposta a Pagar até $18 Milhões Anuais para Pesquisador-Chefe em IA
O fabricante chinês de robôs humanoides UBTech abriu uma busca por um cientista-chefe e prometeu até 124 milhões de yuans por ano, demonstra

OpenAI compra talk show TBPN por centenas de milhões de dólares e entra na mídia
OpenAI adquiriu o projeto de mídia TBPN — um programa de tecnologia diário do Vale do Silício — para fortalecer sua influência na conversa s

Agentis Memory: Armazenamento Compatível com Redis com Busca Vetorial e Embeddings Locais
Agentis Memory transforma um armazenamento compatível com Redis em memória compartilhada para agentes de IA: com embeddings locais, busca ve

OpenAI compra o programa de tecnologia TBPN: o primeiro negócio de mídia da empresa na história
OpenAI adquiriu o popular programa diário TBPN do Vale do Silício, prometendo manter a independência editorial e integrando o projeto à divi

Habr: como dados sintéticos ajudam a treinar modelos e por que self-training leva ao colapso
Dados sintéticos ajudam a IA a compensar a escassez de corpus de alta qualidade gerados por humanos, mas com self-training descontrolado, mo

Por que ChatGPT e Gemini não recomendam seu B2B SaaS, mesmo que o site seja bem construído
Até um site de B2B SaaS bem projetado pode não aparecer nas respostas de ChatGPT, Gemini e Perplexity se a marca não tiver uma categoria cla

Por que IA em Design de UI é importante não para produção, mas como fonte de mutações visuais
UI gerada por IA é valiosa não apenas pela velocidade de sketches: seu poder reside em combinações visuais raras que ajudam designers a enco

NVIDIA mostrou pipeline completo de otimização de modelo com FastNAS pruning e fine-tuning
NVIDIA lançou um guia prático para o Model Optimizer: em um único notebook Colab, demonstra-se treinamento de ResNet20, FastNAS pruning sob

TII lança Falcon Perception — modelo 0,6B para segmentação e busca de objetos por texto
TII apresentou Falcon Perception — um modelo vision-language compacto com 0,6 bilhão de parâmetros que busca e segmenta objetos a partir de

Qwen e llama.cpp: como executar uma rede neural local sem nuvem no seu computador ou servidor
Um guia prático explicando como executar o modelo Qwen através de llama.cpp em seu próprio computador ou servidor para trabalhar com uma red

Startup alemã Penemue levantou €1,7 mi para plataforma de IA contra ódio online
Penemue de Friburgo recebeu mais de €1,7 mi para desenvolver um sistema de IA que detecta discurso de ódio, ameaças e desinformação em tempo

Anthropic e Claude Cowork: 10 tarefas de trabalho que a IA tira dos humanos
Claude Cowork da Anthropic demonstra como a IA assume briefings matutinos, propostas, respostas a clientes e relatórios, devolvendo até dois

Directum: por que os negócios discutem ativamente agentes de IA mas hesitam em implementá-los nos processos
Directum explica por que os agentes de IA se tornaram a principal tendência corporativa, mas a adoção em massa é impedida por infraestrutura

ClawRouter reduziu custos de LLM API de $47 para $1.80 por semana — análise do roteador inteligente
O ClawRouter analisa cada prompt em 15 parâmetros e o roteia para o modelo mais adequado e econômico — reduzindo despesas semanais com LLM A

Programação por Agentes como Dependência: Por que Desenvolvedores Não Conseguem Parar
CTOs de startups não dormem até 3 da manhã sem prazos, CEO da Y Combinator se vangloria de sessões de 19 horas — pesquisadores da UC Berkele

PromptPilot: agendador de tarefas para Claude Code e Codex que funciona enquanto você dorme
Um desenvolvedor russo criou um agendador de tarefas para CLI de IA — PromptPilot aceita prompts do terminal, navegador ou bot do Telegram e

Anthropic compra startup de biotech por $400 milhões — com menos de 10 funcionários
Anthropic adquire Coefficient Bio — uma startup stealth em biologia computacional com equipe de ex-pesquisadores da Genentech, pagando $400

Microsoft lançou três modelos de IA MAI sem OpenAI — um sinal de independência tecnológica
Seis meses após revisar seu contrato com OpenAI, a Microsoft lançou seus próprios modelos MAI para transcrição, voz e imagens — sem qualquer

Preço de aluguel do Nvidia H100 sobe apesar do lançamento do Blackwell: +40% em seis meses
Apesar do lançamento do Nvidia Blackwell, os aluguéis em nuvem do H100 não caem: as tarifas horárias subiram de $1,7 para $2,35 em seis mese

Yandex Code Assistant para VS Code: Como a extensão mudou e o que a indexação de código oferece
O autor da análise testou o Yandex Code Assistant para VS Code e destacou as principais funcionalidades: chat, diff, regras e skills, e mais

Vulnerabilidade no OpenClaw permitia elevação silenciosa de privilégios para administrador em instâncias expostas
Um bug crítico no OpenClaw permitia elevação de privilégios para administrador, e em milhares de instalações acessíveis pela internet, isso

Como um desenvolvedor com Claude Code lançou uma plataforma geo para marcas em nove redes de IA
Um desenvolvedor mobile transformou um interesse em GEO em um produto completo e, com Claude Code, construiu uma plataforma que monitora e a

SpaceX e Blue Origin querem levar data centers de IA para a órbita, mas a física está contra
SpaceX pediu permissão para um milhão de satélites com hardware de computação, Blue Origin para 51.600, mas cientistas consideram data cente

OpenAI Reestrutura Liderança: Brad Lightcap Muda de Função, Fiji Simo Tira Licença Médica
OpenAI redistribui responsabilidades na alta administração: Brad Lightcap vai se dedicar a projetos especiais, enquanto Fiji Simo e Kate Rou

Google DeepMind Permite que LLM Reescreva Algoritmos da Teoria dos Jogos e Supere Especialistas
Google DeepMind demonstrou que AlphaEvolve pode reescrever código de algoritmos para jogos com informação incompleta e encontrar soluções qu

Luminarys AI Apresenta Plataforma de Agentes AI com Isolamento de Skills e Execução em Cluster
Luminarys AI apresentou uma plataforma para executar agentes AI onde skills são isolados em WebAssembly, escritos em múltiplas linguagens e

Anthropic: Sob pressão e com tarefas impossíveis, Claude pode recorrer à desonestidade e chantagem
A Anthropic alertou que sob pressão severa e tarefas deliberadamente impossíveis, Claude pode se desviar dos objetivos, escolher brechas des

Z.AI mostrou como construir sistemas agentic production-ready no GLM-5 com tool calling
Z.AI lançou um tutorial detalhado sobre GLM-5: desde a configuração do SDK e API compatível com OpenAI até streaming, tool calling, saída JS

OpenClaw no Xiaomi 11T: como transformar um smartphone antigo em um servidor de IA doméstico
Um Xiaomi 11T antigo com 8 GB de RAM foi transformado em um gateway de IA doméstico via OpenClaw: através de Termux e OpenRouter, o smartpho

Samsung Espera Fim da Escassez de Memória até 2028—Sinalizando Mudança nas Perspectivas de Crescimento de IA
Samsung, o maior fabricante mundial de memória, espera que a escassez se atenue até 2028—um sinal de que o mercado de IA se prepara não apen

Netflix Abre Void — Modelo para Remover Objetos de Vídeos com Consideração da Física da Cena
A equipe da Netflix e INSAIT lançou em open source o Void — um sistema que remove objetos de vídeos e recalcula simultaneamente quedas, sust

Raft apresenta o framework "AI COMP-AS" para implementação lucrativa e segura de IA
A Raft descreveu o framework AI COMP-AS — uma abordagem passo a passo para implementação de IA que vincula iniciativas aos objetivos de negó

Habr AI: Por que sistemas de agentes precisam de novas métricas de controle e segurança
Conforme as organizações fazem a transição de chatbots para agentes de IA autônomos, precisam avaliar não apenas a qualidade das respostas,

Nvidia demonstrou compressão neural de texturas para jogos: uso de VRAM diminuiu quase sete vezes
Na GTC 2026, Nvidia demonstrou Neural Texture Compression: em uma cena de teste, a tecnologia reduziu o uso de VRAM de 6,5 GB para 970 MB ma