Habr AI

Anthropic e ETH Zurich: um CLAUDE.md longo piora o desempenho do agente e aumenta os custos
Um estudo da ETH Zurich com 138 repositórios mostrou que arquivos CLAUDE.md e AGENTS.md longos frequentemente reduzem a taxa de sucesso de a

Gemini 3.1 Pro superou ChatGPT 5.4 e Claude Opus 4.6 em teste de geração de texto
Uma comparação autoral de três modelos de ponta em quatro tarefas literárias mostrou que Gemini 3.1 Pro mantém melhor o gênero, a emoção e a

Anthropic, OpenAI e Cursor: oito níveis de maturidade da engenharia de agentes
A Habr AI detalhou oito níveis da engenharia de agentes — de tab-complete e context engineering a background agents e equipes autônomas que

AMD RX580 rodou um LLM localmente: como driblar ROCm, Ollama e obter inferência em GPU
Um engenheiro mostrou como fazer uma antiga AMD RX580 rodar um LLM de forma estável via ROCm e Ollama, destrinchando sinais falsos de ativid

Por que Claude 4.6 não basta sem contexto: o principal ponto cego do desenvolvimento com LLM
Até mesmo um modelo forte como Claude 4.6 perde eficácia sem um contexto reunido de forma sistemática: knowledge base, conexões entre serviç

Desenvolvedor cria agregador de notícias com AI, MCP, DeepSeek e bot no Telegram
Após o ataque de drones sobre Dubai, um desenvolvedor criou um agregador de notícias multilíngue: 80+ fontes, servidor MCP para agentes de A

BorisovAI testou MoE em uma RTX 4090 e mostrou por que a perplexidade compromete a avaliação de LLM
BorisovAI testou MoE com especialistas plug-in em uma única RTX 4090 e descobriu que uma perplexidade impressionante não garante ganho real

Experimento com LLM mostrou como a “personalidade” do modelo surge no espaço latente
Um experimento com uma LLM modular mostrou que um vetor latente separado pode armazenar não apenas o estilo do texto, mas também traços comp

Nvidia sugere, antes da GTC 2026, um chip óptico capaz de reformular os data centers de AI
Antes de sua apresentação em 16 de março de 2026, a Nvidia elevou as expectativas do mercado com a promessa de “um chip que vai abalar o mun

Por que os avanços da DeepMind em AGI não respondem à principal questão da consciência de máquina
O autor explica por que o aumento do poder computacional e os avanços da DeepMind em AGI não equivalem ao surgimento da consciência: a intel

Habr AI sobre o futuro do trabalho: como AI e robôs podem levar a sociedade de volta a uma nova Antiguidade
Habr AI argumenta que a combinação de AI, robotização e neuroimplantes pode não apenas mudar o mercado de trabalho, mas dividir a sociedade

Unity mostrou como criar NPCs com voz, memória e contexto do mundo
Um guia passo a passo mostra como criar NPCs com voz na Unity com um modelo local, memória de diálogos, conhecimento do mundo do jogo e resp

Harvard: AI reduz a contratação de juniores, e em três anos isso pode afetar todo o setor
Harvard registra queda na contratação de juniores após a adoção de AI, enquanto a METR aponta o aumento da dependência de desenvolvedores ex

DeepSeek e GLM-5 superaram Yandex em teste com 34 modelos de AI para gestores sem VPN
Os autores de um grande teste de cenários de gestão concluíram que DeepSeek V3.2 e GLM-5, disponíveis na Rússia sem VPN, são visivelmente ma

Google lançou o Gemini Embedding 2 para RAG multimodal com vídeo, áudio e PDF
O Google lançou o Gemini Embedding 2, um modelo que vetoriza texto, imagens, vídeo, áudio e PDF em um único espaço e simplifica a construção

Bitrix24 listou oito erros típicos no desenvolvimento de servidores MCP para LLMs
Um desenvolvedor da Bitrix24 explicou por que servidores MCP falham em autorização, cadeias de chamadas, descrições ruins de ferramentas, te

Por que a ideia de world model de Yann LeCun não resolve a principal crise no desenvolvimento de LLMs
Após a saída de Yann LeCun da Meta, seu conceito de world model volta a ser discutido como um caminho além dos LLMs, mas críticos afirmam qu

Montaram um pipeline de Physical AI para o SO-101 com base em ROS2 e LeRobot por 30 mil rublos
Uma stack open-source baseada em ROS2 e LeRobot permite montar um pipeline completo de Physical AI no SO-101 de baixo custo: teleoperação, g

SimpleOne lançou o SimpleGen — ferramenta de AI para desenvolvimento e deploy na plataforma
A SimpleOne apresentou o SimpleGen — uma ferramenta de AI para gerar soluções em sua plataforma: o desenvolvedor só precisa preparar um repo

Google AI Ultra: como transformar uma assinatura em um pool de agentes paralelos e consenso entre modelos
O Google AI Ultra é proposto como base para um stack multiagente: executar workers paralelos do Gemini, delegar rotinas e conferir decisões

Sam Altman e o Pentágono: como contratos militares podem se tornar um seguro para a OpenAI
Uma coluna sobre a ligação entre OpenAI e o Pentágono afirma que contratos militares dão à empresa de Sam Altman não apenas dinheiro e dados

OpenAI lançou o GPT-5.4 Pro: novos recordes em ARC-AGI-2, FrontierMath e lógica
A OpenAI apresentou o GPT-5.4 Pro — um modelo que avançou fortemente em benchmarks complexos, resolve melhor tarefas de raciocínio e lida co

nullClaw em Zig superou o OpenClaw em uso de memória e inicialização em testes locais de agentes de AI
nullClaw, um runtime leve de AI em Zig, mostrou inicialização quase instantânea e consumo de memória várias vezes menor em uma comparação lo

O ChatGPT 5.4 da OpenAI superou Claude Opus 4.6 e Gemini 3.1 Pro em uma comparação no Habr
O Habr publicou uma comparação de três modelos de ponta em tarefas rotineiras: o ChatGPT 5.4 ficou em primeiro lugar na soma dos pontos, o G

Estudo: Cursor acelera o início do desenvolvimento, mas depois aumenta a dívida técnica da equipe
Um estudo sobre o Cursor mostrou que o assistente de AI acelera fortemente a entrega de código nas primeiras semanas, mas depois aumenta a c

Yandex no AI Dev Day mostrou como a IA já está mudando o desenvolvimento na Avito, Ozon e T-Bank
No AI Dev Day, as empresas Yandex, Avito, Ozon, T-Bank e Sber demonstraram onde a IA já está acelerando o desenvolvimento e onde o efeito ai

Como a AI está mudando o desenvolvimento indie: está cada vez mais difícil para desenvolvedores solo competir
O autor da coluna afirma que a AI acelerou o lançamento de MVPs, mas ao mesmo tempo elevou a barreira de entrada, acirrou a concorrência em

Uma empresa sem gerentes: três armadilhas em que as empresas caem ao implementar AI
Entre 50 executivos no ProIT Fest, apenas três disseram que AI realmente facilitou a tomada de decisões — ao mesmo tempo em que as empresas

Bitrix24 mostrou como adicionar quatro robôs de automação a um portal corporativo
A Bitrix24 lançou a continuação de sua série prática e mostrou como integrar quatro robôs a um portal corporativo: para limpar números de te

A Anthropic explicou como criar skills para Claude Code e por que as equipes precisam de um marketplace próprio
A Anthropic mostrou quais skills realmente funcionam no Claude Code, como escrevê-las sem ruído desnecessário e por que grandes equipes prec