Habr AI

OpenAI lança GPT-5.4: aposta em agentes de computador, não só em código
A OpenAI apresentou o GPT-5.4 com computer use nativo, tool search e contexto longo: em tarefas de agentes, o modelo é visivelmente mais for

Startups de AI em 2026 passam de um único prompt para pipelines multiagentes
A era dos serviços de AI baseados em um único prompt está chegando ao fim: para entregar resultados consistentes, as startups em 2026 estão

Por que textos de AI irritam os leitores: autor do Habr analisou a reação ao estilo de escrita de redes neurais
Um autor do Habr fez um experimento com edição por AI dos próprios textos e mostrou que o público muitas vezes reage não às ideias, mas à fo

LLMs e sistemas agênticos estão deslocando o ROS do centro da robótica — por que isso importa
A arquitetura dos robôs está migrando de cenários do ROS rigidamente programados para a combinação de LLMs e frameworks agênticos, em que o

Como o Del Complex, um falso data center flutuante de AI com H100, enganou o X e os principais veículos de tecnologia
A história do Del Complex mostrou como, em 2023, um site bem-feito, imagens geradas por AI e promessas grandiosas sobre um data center marít

Habr AI mostrou como preparar entrada estruturada para um agente de AI em vez de uma especificação técnica bruta
No Habr AI, explicaram por que é melhor dar aos agentes não um documento inteiro, mas requisitos atômicos com atributos JSON: assim fica mai

ETH Strategy: Parallel AI e AskSurf deram avaliações opostas ao mesmo projeto DeFi
A comparação de duas auditorias de AI de ETH Strategy mostrou que até modelos fortes divergem em conclusões básicas: um encontrou riscos sér

A X5 Tech contou como desenvolveu em 7 dias um serviço de AI para a preparação para exames internacionais
No AI Talent Camp, a equipe do ExamLab Bot desenvolveu em uma semana um serviço que cria planos personalizados de preparação para exames e r

Claude foi transformado em um analista médico pessoal com acesso ao sono e a exames
O autor conectou o Claude ao Notion, ao Oura, a um bot do Telegram para alimentação e aos dados da balança para que a AI correlacionasse son

A OpenAI explicou como o Codex está mudando o desenvolvimento em um mundo em que o código é cada vez mais escrito por agentes
A OpenAI descreveu um experimento em que um produto interno foi montado quase inteiramente via Codex: pessoas definiam regras, verificavam i

Claude Code e Codex comparados em uma tarefa real: Claude é mais forte em RAG, Codex economiza tokens
Uma comparação ampla entre Claude Code e Codex mostra que a escolha de um agente de programação não depende da velocidade em uma demo, mas d

Claude Code ajudou a criar uma aplicação Elixir para produção sem código escrito manualmente em quatro meses
O caso mostrou como, em quatro meses, o Claude Code foi usado para criar um serviço Elixir para produção com 1.702 commits, 3.880 testes e d

Veai 5.6 para JetBrains IDEs adiciona geração de commit message e execução manual de Skills
A Veai lançou a versão 5.6 para JetBrains IDEs: o agente agora sugere sozinho uma commit message a partir do diff, oferece ações rápidas no

Habr AI mostrou como montar um Linear Layer em C++ e CUDA na série «De MNIST a Transformer»
Na terceira parte da série «De MNIST a Transformer», a Habr AI mostra como passar de matrizes para tensores, implementar um Linear Layer em

A Selectel adicionou servidores de ponta para treinamento de modelos e ampliou o catálogo de imagens
A Selectel resumiu as atualizações de fevereiro: lançou servidores HGX B300 para treinar modelos de grande porte, adicionou novas imagens, t

DEMIURGOS adiciona modo de depuração de regras para agentes de AI e suporte a mais de 20 ferramentas
O DEMIURGOS permite descrever uma única vez a stack, as restrições e os padrões do projeto para que Claude Code, Cursor, Copilot e outros ag

Whisper e Gemma 3 conectados com aprendizado contrastivo para entrada de voz de baixo custo em LLMs
Um desenvolvedor mostrou como conectou Whisper e Gemma 3 por meio de um projetor MLP e aprendizado contrastivo: depois de uma série de tenta

Um stack open source de 6 modelos e 9 agentes mostrou como montar uma equipe de AI em um único servidor
Seis modelos open source e nove agentes em um único servidor com GPU formam uma equipe autônoma de AI que projeta, escreve, testa e implanta

Gamma, Tome e SlidesAI: quais serviços de AI realmente aceleram a criação de apresentações
Os serviços de AI para apresentações assumem a estrutura, o texto e o design básico, mas só economizam tempo de verdade quando o autor forne

Sber, Yandex e red_mad_robot mostraram como a AI está mudando o papel do desenvolvedor
Em um encontro com Sber, Yandex, T-Technologies e red_mad_robot, discutiu-se o AI PDLC: a AI já escreve a maior parte do código, e o desenvo

Nvidia, Google e Anthropic: Nemotron, bugs no Firefox e sinais preocupantes para o mercado de AI
Nvidia lançou o modelo aberto Nemotron-3-Super-120B, Anthropic encontrou dezenas de falhas no Firefox, e Google e ByteDance ficaram no centr

Claude Cowork e Chrome: 10 casos de uso para delegar a rotina repetitiva do navegador a um agente de AI
A Habr publicou uma análise prática de como o Claude Cowork, com uma extensão para Chrome, assume busca de dados, preenchimento de formulári

Anthropic explicou como as empresas podem implementar sistemas agênticos sem complexidade desnecessária
Anthropic mostrou que, para as empresas, vale mais a pena começar não com sistemas agênticos autônomos, mas com cenários simples: eles são m

Em cinco dias, Yoyo passou de 200 linhas para um agente autônomo que escreve código sozinho
Um experimento com o agente Yoyo mostrou que 200 linhas em Rust foram suficientes para iniciar um ciclo de autoaceleração: o bot lê o própri

GLiNER 2 mostrou como encoders compactos estão alcançando os LLMs em NER e classificação
Uma nova onda de encoders zero-shot, liderada pelo GLiNER 2, mostra que tarefas de NER e classificação podem ser resolvidas sem LLMs pesados

Ollama Cloud comparado em code review: DeepSeek v3.1 se mostrou superior a Qwen e GPT-OSS
O autor testou três modelos no Ollama Cloud em Pull Requests reais de Python de um projeto legado: DeepSeek v3.1 mostrou o melhor equilíbrio

CodeSpeak, de Andrey Breslav, criador do Kotlin, transfere o desenvolvimento do código para as especificações
A equipe de Andrey Breslav lançou a alfa pública do CodeSpeak — uma plataforma em que o desenvolvedor descreve um sistema em inglês, e LLM g

OpenAI, SoftBank e Oracle disputam o Stargate: megaprojeto de data centers empaca
O Stargate, projeto de até US$ 500 bilhões pensado como base computacional da OpenAI, desacelera: os parceiros divergem sobre estrutura, din

Claude como parte do pensamento: por que perder uma ferramenta de AI compromete não só o acesso, mas também o trabalho
Para usuários ativos, perder uma conta no Claude se mostrou mais do que uma falha de serviço: junto com o acesso, desaparecem o contexto, o

Seldon Vault transformou a psicohistória de Asimov em um serviço multiagente de previsões com AI
Seldon Vault transforma a ideia da psicohistória de Asimov em um serviço real de AI: sete agentes, um cético e um árbitro constroem diariame