апрель 2026 г.

NVIDIA na GTC 2026 muda foco de chips para fábricas de tokens e a era de Agent-as-a-Service
Na GTC 2026, a NVIDIA apresentou uma aposta não em GPUs individuais, mas em fábricas de tokens, a arquitetura modular Vera Rubin e a economi

PageIndex da VectifyAI oferece busca sem embeddings para documentos longos
PageIndex constrói um índice estruturado em árvore do documento e busca seções relevantes através de raciocínio LLM, prometendo RAG sem embe

Omniscient Levanta $4,1 Milhões do Seedcamp para Analítica de IA para Conselhos de Administração
A startup parisiense Omniscient recebeu $4,1 milhões do Seedcamp para desenvolver um sistema de IA que rastreia sinais de reputação em tempo

GolangConf 2026 e Ontiko: por que times Go precisam consertar a arquitetura, não a velocidade do código
Ontiko está reestruturando GolangConf 2026 em torno dos problemas reais dos times Go: a IA acelerou a escrita de código, mas decisões arquit

ruGPT3XL Ganha Contexto de 8k: Modelo Restaurado Ultrapassa Limite de 2k com Mínimas Perdas
O autor da restauração do ruGPT3XL corrigiu sparse attention, aumentou o contexto do modelo de 2k para 8k e preservou a qualidade em sequênc

Stephen Marche: Autores Devem Aceitar a IA, Mas o Valor do Texto Humano Não Desaparece
O escritor Stephen Marche acredita que a IA generativa já está desvalorizando a prosa formulaica, enquanto simultaneamente aumenta o valor d

OpenAI, MiniMax e Nvidia determinaram o tom de março em IA: Sora, GPT-5.4 e a aposta em Mira Murati
Março em IA foi marcado por grandes mudanças de produtos: OpenAI reconsidera o futuro de Sora, Google e Anthropic aceleram seus assistentes,

Startups AI-first: por que o growth marketing não funciona e o que quebra no funil
Produtos AI-first costumam ter métricas fortes no topo do funil que mascaram demanda falsa: pessoas chegam pela novidade, não para resolver

Empresas de tecnologia dos EUA aceleram demissões em meio a investimentos em inteligência artificial
Empresas de tecnologia dos EUA retomaram a liderança em demissões: as companhias estão reduzindo quadros no contexto de investimentos em IA,

Rocket Close Acelerou o Processamento de Documentos Hipotecários em 15 Vezes com AWS
Rocket Close, em parceria com AWS, acelerou o processamento de documentos hipotecários em 15 vezes, combinando Amazon Textract para OCR e Am

CEO da Anthropic, Dario Amodei, Promete 'IA Boa', mas Críticos Pedem Desaceleração
Após a visita do CEO da Anthropic a Canberra, o debate sobre IA na Austrália mudou de promessas de crescimento para a questão de quem pagará

Dan Prattle: Quadron Avança Economia da Confiança para Avaliação de Valor na Era da IA
O fundador da Quadron, Dan Prattle, acredita que com o crescimento da IA generativa, o principal déficit não é conhecimento, mas experiência

Fortis Solutions Aposta em IA Controlada pelo Ser Humano e Infraestrutura de Confiança
Fortis Solutions acredita que o negócio não precisa de IA autônoma isolada, mas de sistemas onde a precisão das máquinas amplifica as pessoa

China aprova plano quinquenal até 2030 com metas para implementação massiva de IA
Pequim incluiu a IA entre as prioridades-chave do 15º Plano Quinquenal: desde modelos e chips até serviços governamentais, medicina e indúst

Habr: Agentes de IA transformam delivery, e equipes precisam reconstruir todo o ciclo de desenvolvimento
Habr explica por que com o surgimento de agentes de IA, as equipes precisam reestruturar não apenas a escrita de código, mas todo o delivery

M2 delegou 40% dos textos de marketing a uma rede neural e manteve a qualidade do conteúdo
A equipe da M2 integrou um redator de IA no seu departamento editorial interno, delegou 40% dos textos de produtos e marketing para ele e ma

Sova AI lança assistente Android que controla telefone sem PC e root
Sova AI apresentou um aplicativo Android com agente IA que abre aplicativos, pressiona botões, faz scroll em telas e executa comandos de voz

Microsoft quer criar seus próprios modelos de IA avançados até 2027 no nível de OpenAI e Anthropic
Microsoft planeja desenvolver grandes modelos de IA avançados até 2027 para reduzir a dependência de OpenAI e Anthropic e criar sua própria

Ministério da Justiça dos EUA recorrerá decisão judicial que bloqueou proibição de Anthropic em órgãos federais
O Ministério da Justiça dos EUA pretende contestar a decisão de um tribunal federal que suspendeu temporariamente a proibição da administraç

Como TGS e AWS Reduziram o Treinamento de Modelo de IA Sísmica de Seis Meses para Cinco Dias
TGS e AWS alcançaram escalabilidade quase linear no treinamento do modelo foundation sísmica, reduzindo o ciclo de seis meses para cinco dia

API de OpenAI e Consultas Fan-Out do GPT: Como Especialistas em SEO Analisam a Busca por IA
O autor demonstra como obter consultas fan-out ocultas do GPT via API OpenAI e usá-las para analisar como modelos de IA coletam fontes e ger

Hack The Box: Como MCP Inspector Transforma Ferramentas de IA em um Novo Vetor de Ataque
Uma análise do Kobold do HTB Season 10 mostra como um único utilitário dev para servidores de IA pode levar a RCE, LFI, reutilização de cred

Startup de IA indiana Sarvam levanta até $350 milhões com avaliação de $1,5 bilhão
Sarvam AI está perto de fechar uma rodada de $300-350 milhões com avaliação de $1,5 bilhão, um dos sinais mais fortes de que a Índia quer cr

Google adicionou os modos Flex e Priority à API Gemini para equilibrar preço e confiabilidade
Google lançou dois novos níveis de serviço na API Gemini: Flex para tarefas em segundo plano mais baratas e Priority para tráfego crítico co

OpenAI compra o programa de tecnologia TBPN para fortalecer sua influência sobre o diálogo público sobre IA
OpenAI entra no setor de mídia adquirindo TBPN, um programa popular no Vale do Silício, prometendo manter a independência editorial do proje

Sistema baseado em LLM reduziu preparação de mapas de controle de qualidade em fábrica metalúrgica de 2 horas para 5 minutos
Em uma fábrica metalúrgica, um sistema LLM começou a montar mapas de controle de qualidade em 3–5 minutos em vez de duas horas: não um promp

Habr AI mostra como adicionar memória e contexto a um chat LLM em Python com Ollama e LiteLLM
Em uma nova parte do tutorial sobre chat em Python com Ollama e LiteLLM, é demonstrado como armazenar o histórico de mensagens, transmitir c

Claude Sonnet e Jarvis Pattern: por que agentes de IA podem precisar apenas de um sistema operacional
No Habr, propuseram construir agentes de IA pessoais não em torno de frameworks complexos, mas em uma combinação de LLM, sistema operacional

Microsoft Apresenta Três Modelos para Processamento de Texto, Voz e Imagens
A divisão Microsoft AI apresentou a linha MAI: um modelo para transcrição de fala, um gerador de voz e um sistema para imagens, reforçando s

Google simplificou a transição do ChatGPT para Gemini: agora é possível transferir memória e conversas
Gemini ganhou uma função para importar memória, preferências e histórico de chats do ChatGPT e outros serviços de IA, permitindo que os usuá

Startup de IA apresenta colega digital para Zoom que se reporta aos gerentes
Um novo agente de IA para equipes de escritório pode participar de cada reunião do Zoom, acompanhar tarefas, identificar independentemente l

Microsoft reestrutura vendas de Copilot após pressão de analistas de Wall Street
Microsoft abandonou a ideia de distribuir Copilot como parte de pacotes corporativos e apostou em vendas separadas pagas para demonstrar aos

SpaceX Prepara IPO Recorde enquanto OpenAI e Anthropic se Aproximam do Mercado Público
O pedido confidencial de IPO da SpaceX com avaliação acima de $1,75 trilhão pode desencadear uma onda de grandes ofertas, seguida por OpenAI

Microsoft investirá $10 bilhões no Japão em quatro anos para atender à demanda de IA na Ásia
A Microsoft anunciou um pacote de investimentos de $10 bilhões no Japão nos próximos quatro anos, acelerando sua expansão asiática e aprovei

Google Gemma 4, NVIDIA e OpenClaw: Agentes AI locais sem cobrança por token
Google e NVIDIA estão promovendo a execução local do Gemma 4 em RTX, Jetson e DGX Spark para que agentes AI sempre ativos como OpenClaw func

Yandex mostrou como chegar às respostas do Alice e medir visibilidade de busca
Yandex lançou uma seção 'Visibilidade do Site no Alice' no Webmaster. A mensagem para os negócios é clara: respostas do assistente vêm não d

Flant: como um desenvolvedor Go transformou Zed e Gemini em um agente IA útil
Um desenvolvedor Go da Flant descreveu o caminho desde plugins IDE lentos até uma combinação de Zed, Gemini 3 Flash e gopls-mcp, que fornece

Micron e Mercado de Memória: Analistas Preveem Demanda Alta Impulsionada por IA até Fim da Década
Analistas da Melius Research acreditam que o boom da IA generativa está transformando o mercado de memória: a demanda por DRAM e NAND poderi

OpenAI desacelera crescimento de receita e novos usuários em meio a custosa infraestrutura de IA
OpenAI enfrenta custos crescentes de computação, receita mais fraca e desaceleração na aquisição de usuários, enquanto parte da audiência mi

Funcionários do Google exigem que Pichai bloqueie acesso do Pentágono aos modelos de IA da empresa
Mais de 600 funcionários do Google, incluindo especialistas do DeepMind e executivos sênior, exigiram que Sundar Pichai bloqueie o acesso do

OpenAI não atingiu metas internas de crescimento de usuários do ChatGPT e receita
Segundo o WSJ, OpenAI ficou aquém de suas próprias metas de novos usuários e vendas, intensificando a questão dentro da empresa: o crescimen

Talkie-1930: Pesquisadores lançaram um modelo 13B sem conhecimento da internet e Segunda Guerra Mundial
Talkie-1930 é um modelo 13B aberto, treinado apenas em textos em inglês até 1931, para estudar pensamento histórico, vazamentos de dados e c

MarkTechPost mostra como construir um agente VLA leve com modelo de mundo latente e MPC
Em um novo tutorial, MarkTechPost detalha como construir um agente embodied simplificado: ele opera em frames RGB, aprende um modelo de mund

Arcee AI Lança Trinity Large Thinking — Modelo de Raciocínio Aberto para Agentes IA
Arcee AI disponibilizou os pesos do Trinity Large Thinking sob licença Apache 2.0 e aposta em cenários de agentes longos, raciocínio multiet

UBTech Disposta a Pagar até $18 Milhões Anuais para Pesquisador-Chefe em IA
O fabricante chinês de robôs humanoides UBTech abriu uma busca por um cientista-chefe e prometeu até 124 milhões de yuans por ano, demonstra

OpenAI compra talk show TBPN por centenas de milhões de dólares e entra na mídia
OpenAI adquiriu o projeto de mídia TBPN — um programa de tecnologia diário do Vale do Silício — para fortalecer sua influência na conversa s

Agentis Memory: Armazenamento Compatível com Redis com Busca Vetorial e Embeddings Locais
Agentis Memory transforma um armazenamento compatível com Redis em memória compartilhada para agentes de IA: com embeddings locais, busca ve

OpenAI compra o programa de tecnologia TBPN: o primeiro negócio de mídia da empresa na história
OpenAI adquiriu o popular programa diário TBPN do Vale do Silício, prometendo manter a independência editorial e integrando o projeto à divi

Habr: como dados sintéticos ajudam a treinar modelos e por que self-training leva ao colapso
Dados sintéticos ajudam a IA a compensar a escassez de corpus de alta qualidade gerados por humanos, mas com self-training descontrolado, mo

Por que ChatGPT e Gemini não recomendam seu B2B SaaS, mesmo que o site seja bem construído
Até um site de B2B SaaS bem projetado pode não aparecer nas respostas de ChatGPT, Gemini e Perplexity se a marca não tiver uma categoria cla

Por que IA em Design de UI é importante não para produção, mas como fonte de mutações visuais
UI gerada por IA é valiosa não apenas pela velocidade de sketches: seu poder reside em combinações visuais raras que ajudam designers a enco

NVIDIA mostrou pipeline completo de otimização de modelo com FastNAS pruning e fine-tuning
NVIDIA lançou um guia prático para o Model Optimizer: em um único notebook Colab, demonstra-se treinamento de ResNet20, FastNAS pruning sob

TII lança Falcon Perception — modelo 0,6B para segmentação e busca de objetos por texto
TII apresentou Falcon Perception — um modelo vision-language compacto com 0,6 bilhão de parâmetros que busca e segmenta objetos a partir de

Qwen e llama.cpp: como executar uma rede neural local sem nuvem no seu computador ou servidor
Um guia prático explicando como executar o modelo Qwen através de llama.cpp em seu próprio computador ou servidor para trabalhar com uma red

Startup alemã Penemue levantou €1,7 mi para plataforma de IA contra ódio online
Penemue de Friburgo recebeu mais de €1,7 mi para desenvolver um sistema de IA que detecta discurso de ódio, ameaças e desinformação em tempo

Anthropic e Claude Cowork: 10 tarefas de trabalho que a IA tira dos humanos
Claude Cowork da Anthropic demonstra como a IA assume briefings matutinos, propostas, respostas a clientes e relatórios, devolvendo até dois

Directum: por que os negócios discutem ativamente agentes de IA mas hesitam em implementá-los nos processos
Directum explica por que os agentes de IA se tornaram a principal tendência corporativa, mas a adoção em massa é impedida por infraestrutura

ClawRouter reduziu custos de LLM API de $47 para $1.80 por semana — análise do roteador inteligente
O ClawRouter analisa cada prompt em 15 parâmetros e o roteia para o modelo mais adequado e econômico — reduzindo despesas semanais com LLM A

Programação por Agentes como Dependência: Por que Desenvolvedores Não Conseguem Parar
CTOs de startups não dormem até 3 da manhã sem prazos, CEO da Y Combinator se vangloria de sessões de 19 horas — pesquisadores da UC Berkele

PromptPilot: agendador de tarefas para Claude Code e Codex que funciona enquanto você dorme
Um desenvolvedor russo criou um agendador de tarefas para CLI de IA — PromptPilot aceita prompts do terminal, navegador ou bot do Telegram e