апрель 2026 г.

Elon Musk promete reestruturar a xAI após nova onda de saídas entre cofundadores
Elon Musk afirmou que vai reestruturar a xAI após uma série de saídas da empresa: a turbulência no quadro de pessoal ampliou as dúvidas sobr

Claude Cowork e Chrome: 10 casos de uso para delegar a rotina repetitiva do navegador a um agente de AI
A Habr publicou uma análise prática de como o Claude Cowork, com uma extensão para Chrome, assume busca de dados, preenchimento de formulári

Microsoft e NVIDIA chamam o physical AI de próxima vantagem para a indústria
A MIT Technology Review descreve uma nova etapa da automação: o physical AI ajuda as fábricas não apenas a reduzir custos, mas a crescer em

Anthropic explicou como as empresas podem implementar sistemas agênticos sem complexidade desnecessária
Anthropic mostrou que, para as empresas, vale mais a pena começar não com sistemas agênticos autônomos, mas com cenários simples: eles são m

Em cinco dias, Yoyo passou de 200 linhas para um agente autônomo que escreve código sozinho
Um experimento com o agente Yoyo mostrou que 200 linhas em Rust foram suficientes para iniciar um ciclo de autoaceleração: o bot lê o própri

ChatGPT e data centers: como o crescimento da AI acelera o consumo de energia e a pressão sobre a água
O crescimento do ChatGPT e de outros serviços de AI está impulsionando a construção de data centers, aumentando a demanda por eletricidade e

GLiNER 2 mostrou como encoders compactos estão alcançando os LLMs em NER e classificação
Uma nova onda de encoders zero-shot, liderada pelo GLiNER 2, mostra que tarefas de NER e classificação podem ser resolvidas sem LLMs pesados

NVIDIA apresenta o NeMo Retriever — busca agêntica para dados corporativos complexos
A NVIDIA apresentou um pipeline agêntico no NeMo Retriever: o sistema não se limita à busca semântica, mas planeja etapas, refina consultas

Ollama Cloud comparado em code review: DeepSeek v3.1 se mostrou superior a Qwen e GPT-OSS
O autor testou três modelos no Ollama Cloud em Pull Requests reais de Python de um projeto legado: DeepSeek v3.1 mostrou o melhor equilíbrio

CodeSpeak, de Andrey Breslav, criador do Kotlin, transfere o desenvolvimento do código para as especificações
A equipe de Andrey Breslav lançou a alfa pública do CodeSpeak — uma plataforma em que o desenvolvedor descreve um sistema em inglês, e LLM g

OpenAI, SoftBank e Oracle disputam o Stargate: megaprojeto de data centers empaca
O Stargate, projeto de até US$ 500 bilhões pensado como base computacional da OpenAI, desacelera: os parceiros divergem sobre estrutura, din

AWS e vLLM integraram o P-EAGLE para acelerar a inferência de LLMs de grande porte em até 1,69x
A AWS mostrou como o P-EAGLE no vLLM elimina o gargalo da decodificação especulativa, gera vários tokens em um único forward pass e oferece

Elon Musk reformula a xAI: cortes, consultores da Tesla e SpaceX e aposta em data centers de AI
Musk iniciou uma reestruturação dura na xAI: após a entrada de dinheiro da Tesla e uma aproximação com a SpaceX, consultores externos chegam

Harry Tan lançou o gstack — um sistema de workflow para Claude Code com QA, revisão e release
Harry Tan abriu o código-fonte do gstack — um conjunto de modos para Claude Code que separa planejamento, revisão, QA e release em comandos

EUA desistem de vincular a venda de chips de AI à construção obrigatória de data centers
Washington não apoiou a ideia de vender aceleradores americanos apenas a países e empresas dispostos a construir data centers nos EUA, prese

Google atualizou radicalmente o Maps: Gemini responde a perguntas, e a navegação agora é 3D
Google lançou a maior atualização do Maps em uma década: o Ask Maps, baseado em Gemini, entende consultas complexas do dia a dia, e o Immers

Claude como parte do pensamento: por que perder uma ferramenta de AI compromete não só o acesso, mas também o trabalho
Para usuários ativos, perder uma conta no Claude se mostrou mais do que uma falha de serviço: junto com o acesso, desaparecem o contexto, o

Seldon Vault transformou a psicohistória de Asimov em um serviço multiagente de previsões com AI
Seldon Vault transforma a ideia da psicohistória de Asimov em um serviço real de AI: sete agentes, um cético e um árbitro constroem diariame

The Lancet Psychiatry alerta: chatbots com AI podem reforçar delírios em pessoas vulneráveis
Uma revisão publicada na The Lancet Psychiatry mostrou que chatbots com AI podem reforçar ideias delirantes em pessoas com vulnerabilidade à

Elon Musk reestrutura a xAI de novo: saída de cofundadores, demissões e Grok atrás da concorrência
A xAI passa por um novo hard reset: engenheiros-chave e cofundadores estão deixando a empresa, o Grok perde para os concorrentes em programa

Anthropic e ETH Zurich: um CLAUDE.md longo piora o desempenho do agente e aumenta os custos
Um estudo da ETH Zurich com 138 repositórios mostrou que arquivos CLAUDE.md e AGENTS.md longos frequentemente reduzem a taxa de sucesso de a

Gemini 3.1 Pro superou ChatGPT 5.4 e Claude Opus 4.6 em teste de geração de texto
Uma comparação autoral de três modelos de ponta em quatro tarefas literárias mostrou que Gemini 3.1 Pro mantém melhor o gênero, a emoção e a

Anthropic, OpenAI e Cursor: oito níveis de maturidade da engenharia de agentes
A Habr AI detalhou oito níveis da engenharia de agentes — de tab-complete e context engineering a background agents e equipes autônomas que

Zhipu AI lança o GLM-OCR, um modelo OCR compacto de 0,9 bilhão de parâmetros para documentos
A Zhipu AI e a Universidade Tsinghua apresentaram o GLM-OCR, um modelo OCR multimodal de 0,9 bilhão de parâmetros que analisa documentos com

LangChain lançou Deep Agents para agentes de AI em várias etapas com memória e isolamento
LangChain lançou Deep Agents, uma biblioteca para agentes de AI que precisam de planejamento, memória de longo prazo, contexto de arquivos e

AMD RX580 rodou um LLM localmente: como driblar ROCm, Ollama e obter inferência em GPU
Um engenheiro mostrou como fazer uma antiga AMD RX580 rodar um LLM de forma estável via ROCm e Ollama, destrinchando sinais falsos de ativid

Por que Claude 4.6 não basta sem contexto: o principal ponto cego do desenvolvimento com LLM
Até mesmo um modelo forte como Claude 4.6 perde eficácia sem um contexto reunido de forma sistemática: knowledge base, conexões entre serviç

AI força universidades a repensar os trabalhos de curso: o problema da trapaça é anterior ao ChatGPT
A doutora Nafisa Baba-Ahmed considera que a AI não criou a crise dos trabalhos universitários, mas apenas ampliou um antigo hábito de tercei

Desenvolvedor cria agregador de notícias com AI, MCP, DeepSeek e bot no Telegram
Após o ataque de drones sobre Dubai, um desenvolvedor criou um agregador de notícias multilíngue: 80+ fontes, servidor MCP para agentes de A

BorisovAI testou MoE em uma RTX 4090 e mostrou por que a perplexidade compromete a avaliação de LLM
BorisovAI testou MoE com especialistas plug-in em uma única RTX 4090 e descobriu que uma perplexidade impressionante não garante ganho real

Experimento com LLM mostrou como a “personalidade” do modelo surge no espaço latente
Um experimento com uma LLM modular mostrou que um vetor latente separado pode armazenar não apenas o estilo do texto, mas também traços comp

Nvidia sugere, antes da GTC 2026, um chip óptico capaz de reformular os data centers de AI
Antes de sua apresentação em 16 de março de 2026, a Nvidia elevou as expectativas do mercado com a promessa de “um chip que vai abalar o mun

Por que os avanços da DeepMind em AGI não respondem à principal questão da consciência de máquina
O autor explica por que o aumento do poder computacional e os avanços da DeepMind em AGI não equivalem ao surgimento da consciência: a intel

IBM lançou Granite 4.0 1B Speech — um modelo de fala multilíngue compacto para edge AI
A IBM apresentou o Granite 4.0 1B Speech, um modelo leve para reconhecimento e tradução de fala, projetado para implantação rápida em cenári

Demissões na Atlassian reacenderam o debate: a AI deveria reduzir as horas de trabalho, e não o quadro de pessoal
Após as demissões na Atlassian, economistas voltaram a discutir quem deve ficar com os ganhos da AI: as empresas, na forma de lucros, ou os

A OpenAI adiou o lançamento de chats eróticos no ChatGPT devido a riscos para adolescentes
A OpenAI voltou a adiar os chats eróticos no ChatGPT: a empresa foi freada por uma verificação de idade fraca, pelo risco de acesso por adol

Habr AI sobre o futuro do trabalho: como AI e robôs podem levar a sociedade de volta a uma nova Antiguidade
Habr AI argumenta que a combinação de AI, robotização e neuroimplantes pode não apenas mudar o mercado de trabalho, mas dividir a sociedade

Lucro da Hon Hai, parceira da Nvidia, cai e amplia preocupação com a demanda por servidores de AI
A Hon Hai, uma das principais parceiras da Nvidia em hardware para servidores, reportou queda de 2,4% no lucro trimestral, e o mercado viu n

Google retira da busca um recurso de AI com conselhos médicos de usuários aleatórios
Google encerrou o recurso What People Suggest na busca: a ferramenta de AI mostrava conselhos médicos de pessoas comuns e, diante de questio

Unity mostrou como criar NPCs com voz, memória e contexto do mundo
Um guia passo a passo mostra como criar NPCs com voz na Unity com um modelo local, memória de diálogos, conhecimento do mundo do jogo e resp

Harvard: AI reduz a contratação de juniores, e em três anos isso pode afetar todo o setor
Harvard registra queda na contratação de juniores após a adoção de AI, enquanto a METR aponta o aumento da dependência de desenvolvedores ex

Moonshot AI apresentou Attention Residuals — uma alternativa às conexões residuais em transformers
A Moonshot AI propôs Attention Residuals, uma substituição para as conexões residuais padrão em transformers, na qual a camada escolhe sozin

DeepSeek e GLM-5 superaram Yandex em teste com 34 modelos de AI para gestores sem VPN
Os autores de um grande teste de cenários de gestão concluíram que DeepSeek V3.2 e GLM-5, disponíveis na Rússia sem VPN, são visivelmente ma

Google lançou o Gemini Embedding 2 para RAG multimodal com vídeo, áudio e PDF
O Google lançou o Gemini Embedding 2, um modelo que vetoriza texto, imagens, vídeo, áudio e PDF em um único espaço e simplifica a construção

Bitrix24 listou oito erros típicos no desenvolvimento de servidores MCP para LLMs
Um desenvolvedor da Bitrix24 explicou por que servidores MCP falham em autorização, cadeias de chamadas, descrições ruins de ferramentas, te

Prof. Dionne apresentará o VINPix — nanofotônica e AI para multiômica em um chip
A IEEE Spectrum convida para um webinar sobre a plataforma VINPix: chips nanofotônicos combinados com AI prometem acelerar a análise multiôm

Por que a ideia de world model de Yann LeCun não resolve a principal crise no desenvolvimento de LLMs
Após a saída de Yann LeCun da Meta, seu conceito de world model volta a ser discutido como um caminho além dos LLMs, mas críticos afirmam qu

Alibaba reúne serviços de AI em uma nova unidade de negócios para impulsionar o crescimento dos lucros
Alibaba cria uma divisão separada que reunirá os serviços e os esforços de desenvolvimento de AI hoje dispersos pela empresa, para transform

Montaram um pipeline de Physical AI para o SO-101 com base em ROS2 e LeRobot por 30 mil rublos
Uma stack open-source baseada em ROS2 e LeRobot permite montar um pipeline completo de Physical AI no SO-101 de baixo custo: teleoperação, g

Citrini Research: como a AI pode derrubar o prêmio pela inteligência e sacudir a economia
A Citrini Research descreve um cenário em que a AI transforma o trabalho intelectual em uma commodity de massa, pressiona os salários da cla

xAI contrata banqueiros e especialistas em crédito para reforçar o Grok em finanças
A xAI quer treinar o Grok em estratégia financeira com a ajuda de banqueiros e especialistas em private credit, apostando em um segmento mai

Karakeep ajuda a organizar artigos, links e abas do YouTube com AI
O Karakeep transforma o caos de artigos, pesquisas e abas do YouTube em um arquivo organizado: a AI adiciona tags automaticamente, cria resu

Intel alerta: a AI agêntica saiu da fase de "infância" e exige um novo modelo de controle
A AI agêntica está passando de chatbots para ações autônomas, e as empresas já precisam não de políticas gerais, mas de restrições, auditori

SimpleOne lançou o SimpleGen — ferramenta de AI para desenvolvimento e deploy na plataforma
A SimpleOne apresentou o SimpleGen — uma ferramenta de AI para gerar soluções em sua plataforma: o desenvolvedor só precisa preparar um repo

Google AI Ultra: como transformar uma assinatura em um pool de agentes paralelos e consenso entre modelos
O Google AI Ultra é proposto como base para um stack multiagente: executar workers paralelos do Gemini, delegar rotinas e conferir decisões

Ação de Musk contra OpenAI e Microsoft seguirá, embora cifra de US$ 134 bilhões tenha sido considerada arbitrária
A juíza questionou a estimativa de danos na ação de Elon Musk contra OpenAI e Microsoft, de até US$ 134 bilhões, mas não encerrou a disputa

Meta vai gastar até US$ 27 bilhões em infraestrutura de AI da Nebius Group nos próximos cinco anos
A Meta está pronta para gastar até US$ 27 bilhões ao longo de cinco anos para ter acesso à infraestrutura de AI da Nebius Group, mostrando q

Britannica e Merriam-Webster processam a OpenAI por quase 100 mil artigos
Britannica e Merriam-Webster acusaram a OpenAI de usar seus materiais para treinar o ChatGPT sem autorização e de reproduzir trechos de quas

Conselheiro de startups de AI, Salil Darji, apontou os erros que os fundadores percebem tarde demais
O mentor de startups de AI Salil Darji diz que os fundadores são prejudicados pela dispersão, pelo culto ao pitch deck e pela corrida pelo h

OpenAI pode entrar em sistemas militares dos EUA contra o Irã — da seleção de alvos à defesa antidrone
Após o acordo com o Pentágono, tecnologias da OpenAI podem aparecer no conflito em torno do Irã — da priorização de ataques à defesa antidro