Источник

Habr AI

708
всего статей
403
за неделю
30 апреля
последнее обновление
RSSОригинал →
LLM
LLM·Habr AI

Anthropic e ETH Zurich: um CLAUDE.md longo piora o desempenho do agente e aumenta os custos

Um estudo da ETH Zurich com 138 repositórios mostrou que arquivos CLAUDE.md e AGENTS.md longos frequentemente reduzem a taxa de sucesso de a

2026-04-30·3 мин
LLM
LLM·Habr AI

Gemini 3.1 Pro superou ChatGPT 5.4 e Claude Opus 4.6 em teste de geração de texto

Uma comparação autoral de três modelos de ponta em quatro tarefas literárias mostrou que Gemini 3.1 Pro mantém melhor o gênero, a emoção e a

2026-04-30·3 мин
LLM
LLM·Habr AI

Anthropic, OpenAI e Cursor: oito níveis de maturidade da engenharia de agentes

A Habr AI detalhou oito níveis da engenharia de agentes — de tab-complete e context engineering a background agents e equipes autônomas que

2026-04-30·3 мин
LLM
LLM·Habr AI

AMD RX580 rodou um LLM localmente: como driblar ROCm, Ollama e obter inferência em GPU

Um engenheiro mostrou como fazer uma antiga AMD RX580 rodar um LLM de forma estável via ROCm e Ollama, destrinchando sinais falsos de ativid

2026-04-30·3 мин
LLM
LLM·Habr AI

Por que Claude 4.6 não basta sem contexto: o principal ponto cego do desenvolvimento com LLM

Até mesmo um modelo forte como Claude 4.6 perde eficácia sem um contexto reunido de forma sistemática: knowledge base, conexões entre serviç

2026-04-30·3 мин
LLM
LLM·Habr AI

Desenvolvedor cria agregador de notícias com AI, MCP, DeepSeek e bot no Telegram

Após o ataque de drones sobre Dubai, um desenvolvedor criou um agregador de notícias multilíngue: 80+ fontes, servidor MCP para agentes de A

2026-04-30·3 мин
LLM
LLM·Habr AI

BorisovAI testou MoE em uma RTX 4090 e mostrou por que a perplexidade compromete a avaliação de LLM

BorisovAI testou MoE com especialistas plug-in em uma única RTX 4090 e descobriu que uma perplexidade impressionante não garante ganho real

2026-04-30·3 мин
LLM
LLM·Habr AI

Experimento com LLM mostrou como a “personalidade” do modelo surge no espaço latente

Um experimento com uma LLM modular mostrou que um vetor latente separado pode armazenar não apenas o estilo do texto, mas também traços comp

2026-04-30·2 мин
LLM
LLM·Habr AI

Nvidia sugere, antes da GTC 2026, um chip óptico capaz de reformular os data centers de AI

Antes de sua apresentação em 16 de março de 2026, a Nvidia elevou as expectativas do mercado com a promessa de “um chip que vai abalar o mun

2026-04-30·3 мин
LLM
LLM·Habr AI

Por que os avanços da DeepMind em AGI não respondem à principal questão da consciência de máquina

O autor explica por que o aumento do poder computacional e os avanços da DeepMind em AGI não equivalem ao surgimento da consciência: a intel

2026-04-30·3 мин
LLM
LLM·Habr AI

Habr AI sobre o futuro do trabalho: como AI e robôs podem levar a sociedade de volta a uma nova Antiguidade

Habr AI argumenta que a combinação de AI, robotização e neuroimplantes pode não apenas mudar o mercado de trabalho, mas dividir a sociedade

2026-04-30·2 мин
LLM
LLM·Habr AI

Unity mostrou como criar NPCs com voz, memória e contexto do mundo

Um guia passo a passo mostra como criar NPCs com voz na Unity com um modelo local, memória de diálogos, conhecimento do mundo do jogo e resp

2026-04-30·2 мин
LLM
LLM·Habr AI

Harvard: AI reduz a contratação de juniores, e em três anos isso pode afetar todo o setor

Harvard registra queda na contratação de juniores após a adoção de AI, enquanto a METR aponta o aumento da dependência de desenvolvedores ex

2026-04-30·3 мин
LLM
LLM·Habr AI

DeepSeek e GLM-5 superaram Yandex em teste com 34 modelos de AI para gestores sem VPN

Os autores de um grande teste de cenários de gestão concluíram que DeepSeek V3.2 e GLM-5, disponíveis na Rússia sem VPN, são visivelmente ma

2026-04-30·3 мин
LLM
LLM·Habr AI

Google lançou o Gemini Embedding 2 para RAG multimodal com vídeo, áudio e PDF

O Google lançou o Gemini Embedding 2, um modelo que vetoriza texto, imagens, vídeo, áudio e PDF em um único espaço e simplifica a construção

2026-04-30·2 мин
LLM
LLM·Habr AI

Bitrix24 listou oito erros típicos no desenvolvimento de servidores MCP para LLMs

Um desenvolvedor da Bitrix24 explicou por que servidores MCP falham em autorização, cadeias de chamadas, descrições ruins de ferramentas, te

2026-04-30·3 мин
LLM
LLM·Habr AI

Por que a ideia de world model de Yann LeCun não resolve a principal crise no desenvolvimento de LLMs

Após a saída de Yann LeCun da Meta, seu conceito de world model volta a ser discutido como um caminho além dos LLMs, mas críticos afirmam qu

2026-04-30·3 мин
LLM
LLM·Habr AI

Montaram um pipeline de Physical AI para o SO-101 com base em ROS2 e LeRobot por 30 mil rublos

Uma stack open-source baseada em ROS2 e LeRobot permite montar um pipeline completo de Physical AI no SO-101 de baixo custo: teleoperação, g

2026-04-30·3 мин
LLM
LLM·Habr AI

SimpleOne lançou o SimpleGen — ferramenta de AI para desenvolvimento e deploy na plataforma

A SimpleOne apresentou o SimpleGen — uma ferramenta de AI para gerar soluções em sua plataforma: o desenvolvedor só precisa preparar um repo

2026-04-30·3 мин
LLM
LLM·Habr AI

Google AI Ultra: como transformar uma assinatura em um pool de agentes paralelos e consenso entre modelos

O Google AI Ultra é proposto como base para um stack multiagente: executar workers paralelos do Gemini, delegar rotinas e conferir decisões

2026-04-30·2 мин
LLM
LLM·Habr AI

Sam Altman e o Pentágono: como contratos militares podem se tornar um seguro para a OpenAI

Uma coluna sobre a ligação entre OpenAI e o Pentágono afirma que contratos militares dão à empresa de Sam Altman não apenas dinheiro e dados

2026-04-30·2 мин
LLM
LLM·Habr AI

OpenAI lançou o GPT-5.4 Pro: novos recordes em ARC-AGI-2, FrontierMath e lógica

A OpenAI apresentou o GPT-5.4 Pro — um modelo que avançou fortemente em benchmarks complexos, resolve melhor tarefas de raciocínio e lida co

2026-04-30·2 мин
LLM
LLM·Habr AI

nullClaw em Zig superou o OpenClaw em uso de memória e inicialização em testes locais de agentes de AI

nullClaw, um runtime leve de AI em Zig, mostrou inicialização quase instantânea e consumo de memória várias vezes menor em uma comparação lo

2026-04-30·3 мин
LLM
LLM·Habr AI

O ChatGPT 5.4 da OpenAI superou Claude Opus 4.6 e Gemini 3.1 Pro em uma comparação no Habr

O Habr publicou uma comparação de três modelos de ponta em tarefas rotineiras: o ChatGPT 5.4 ficou em primeiro lugar na soma dos pontos, o G

2026-04-30·3 мин
LLM
LLM·Habr AI

Estudo: Cursor acelera o início do desenvolvimento, mas depois aumenta a dívida técnica da equipe

Um estudo sobre o Cursor mostrou que o assistente de AI acelera fortemente a entrega de código nas primeiras semanas, mas depois aumenta a c

2026-04-30·2 мин
LLM
LLM·Habr AI

Yandex no AI Dev Day mostrou como a IA já está mudando o desenvolvimento na Avito, Ozon e T-Bank

No AI Dev Day, as empresas Yandex, Avito, Ozon, T-Bank e Sber demonstraram onde a IA já está acelerando o desenvolvimento e onde o efeito ai

2026-04-30·3 мин
LLM
LLM·Habr AI

Como a AI está mudando o desenvolvimento indie: está cada vez mais difícil para desenvolvedores solo competir

O autor da coluna afirma que a AI acelerou o lançamento de MVPs, mas ao mesmo tempo elevou a barreira de entrada, acirrou a concorrência em

2026-04-30·3 мин
LLM
LLM·Habr AI

Uma empresa sem gerentes: três armadilhas em que as empresas caem ao implementar AI

Entre 50 executivos no ProIT Fest, apenas três disseram que AI realmente facilitou a tomada de decisões — ao mesmo tempo em que as empresas

2026-04-30·2 мин
LLM
LLM·Habr AI

Bitrix24 mostrou como adicionar quatro robôs de automação a um portal corporativo

A Bitrix24 lançou a continuação de sua série prática e mostrou como integrar quatro robôs a um portal corporativo: para limpar números de te

2026-04-30·3 мин
LLM
LLM·Habr AI

A Anthropic explicou como criar skills para Claude Code e por que as equipes precisam de um marketplace próprio

A Anthropic mostrou quais skills realmente funcionam no Claude Code, como escrevê-las sem ruído desnecessário e por que grandes equipes prec

2026-04-30·3 мин