Habr AI

Como um desenvolvedor russo passou dias executando Gemini—e o que finalmente funcionou
Um programador russo passou vários dias executando o Gemini da Rússia via VPN, tentou dezenas de abordagens e documentou cada etapa—o que nã

Product Graph e Memória de Agentes: Por Que IA Não Salva Produtos Sem Estrutura de Conhecimento
Uma análise do Product Graph explica por que até mesmo agentes de IA poderosos são inúteis sem memória compartilhada do produto e como estru

Laboratório em Seis Anos: De Pen Drives e Cadernos a IA que Encontra Defeitos Ocultos
A história de como um laboratório passou seis anos construindo infraestrutura digital — e acabou desenvolvendo IA que lê logs de deposição e

Como a IA transformou a pesquisa de diário: três compromissos que abandonamos
Uma equipe de pesquisadores UX explicou como a IA tornou possível abandonar compromissos com tamanho de amostra, duração e profundidade de a

Marcin Moskala auditou GeminiAI: o que a auditoria revelou sobre corrotinas e arquitetura Android
O autor do cliente open-source GeminiAI contou como seu projeto passou pela auditoria de Marcin Moskala e por que erros em corrotinas se tor

Anthropic: vazamento de código-fonte do Claude Code revelou arquitetura complexa de agentes
Um sourcemap vazado do Claude Code mostrou que o produto da Anthropic evoluiu de um 'CLI para chat' para uma plataforma com sub-agentes, mem

Sber explicou por que os negócios precisam de uma camada AI Overlay em vez de reestruturar departamentos
Sber mostrou por que a implementação pontual de IA generativa raramente traz lucro e propôs uma alternativa — uma camada horizontal AI Overl

Saiga Llama 3 8B em 10 GB VRAM: Como a Habr Alcançou 93% de Precisão em Guerra e Paz
A Habr AI demonstrou como executar Saiga Llama 3 8B em 10 GB VRAM, comprimir dois volumes de Guerra e Paz em um resumo e reduzir alucinações

4 Padrões de Fundadores Não-Técnicos que Fazem Startups Fracassarem
Um desenvolvedor do Habr trabalhou com vários fundadores não-técnicos e descreveu quatro padrões que impedem startups de decolarem—e como IA

DeepSeek e Gemma: Como um Experimento de LLM Híbrido no Kaggle Quebrou a Biblioteca Transformers
Entusiastas transferiram quatro camadas de 31B do Gemma para a arquitetura MoE do DeepSeek sem retreinamento, contornaram limitações do PyTo

Google Gemma 4 e Qwen 3.6 encabeçam a lista dos melhores modelos locais para uso doméstico em 2026
Uma seleção de modelos locais para 2026 mostra que uma RTX 3060 já é suficiente para IA doméstica, e a escolha deve ser feita com base em VR

Yandex Praktikum Explica Como CNNs Processam Imagens e Por Que Parâmetros Não Definem Tudo
A Yandex Praktikum publicou uma análise no Habr AI explicando como redes neurais convolucionais processam imagens, por que a arquitetura imp

Google mostrou TurboQuant: cache KV de 3 bits para LLM, mas mercado de memória entrou em pânico cedo
Após o anúncio do TurboQuant, ações de fabricantes de memória caíram, mas por trás do efeito impressionante há limitações significativas: nã

Rutube Saiu de Piloto Whisper para Plataforma Própria de Legendas e Reconhecimento de Fala
Rutube compartilhou como transformou um piloto rápido do Whisper em uma plataforma completa de legendas com arquitetura de microsserviços e

Raft mostra como as empresas podem avaliar agentes de IA antes de implementar em fluxos de trabalho
Raft lançou um guia prático sobre avaliações para agentes de IA: em vez de confiar em intuição e demonstrações pontuais, as empresas são ori

Veai mostrou como testa um agente de IA no JetBrains IDE sem dependência do modelo
Veai descreveu uma abordagem para automação de UI do plugin JetBrains IDE: a equipe desacoplou a interface determinística das respostas do L

Habr AI explicou quando empresas precisam de sistemas de recomendação e quando não
Habr AI lançou um guia prático sobre sistemas de recomendação: quando regras simples são suficientes para empresas, quando modelos de ML são

Bot Anti-Spam Tab Lançado para Telegram com Rede Neural Personalizada e Aprendizagem de Moderadores
Um desenvolvedor lançou Tab, um bot anti-spam gratuito para Telegram que filtra mensagens usando sua própria rede neural, aprende com feedba

SpeShu.AI lançou AI-Profi — serviço de seleção de especialistas em AI para tarefas empresariais
SpeShu.AI apresentou o serviço AI-Profi: empresas podem encontrar especialistas em AI para tarefas específicas em poucos cliques em meio ao

Qwen 3.6 Plus vence DeepSeek V4 Pro no teste de conteúdo russo e é mais custo-efetivo
Em uma comparação recente de seis modelos LLM de abril, Qwen 3.6 Plus obteve 92 pontos em conteúdo russo e superou o novo DeepSeek V4 Pro, q

Sber lança Kandinsky 6.0 Image Pro — modelo unificado para geração e edição de imagens
Sber apresentou Kandinsky 6.0 Image Pro — modelo para geração e edição de imagens, acelerado mais de 40% e aprimorado com Image RAG para com

NASA e SETI descrevem modelos fundacionais para astrobiologia e busca por vida extraterrestre
Um grupo de pesquisadores da NASA e SETI propôs um modelo fundacional multimodal para astrobiologia — desde a detecção de biossignaturas até

Como Cursor Criou um Protótipo em Três Dias por $180 Que Dividiu o Time de Desenvolvimento
Em uma grande empresa de TI, um arquiteto construiu um protótipo funcional em três dias e $180 usando Cursor, enquanto o time passou três me

Usuários do Claude Code criticam Anthropic Opus 4.7 e recomendam voltar para 4.6
Após o lançamento do Claude Opus 4.7, alguns desenvolvedores no Claude Code reclamaram da preguiça, alucinações e perda de contexto do model

VK apresenta DataCopilot — sistema multiagente para dados corporativos e documentação
VK apresentou DataCopilot — um assistente multiagente para repositórios de dados corporativos: busca data marts, explica estrutura de dados,

Wallmates: Como projetores, drones e IA estão mudando design e decoração de espaços comerciais
A agência Wallmates demonstrou como projetores já estão reduzindo trabalho manual em projetos de interiores, por que a RA ainda não está pro

DeepSeek V4 Pro vs Claude Sonnet 4.6 em 50 tarefas reais: onde economizar, onde está o risco
Um teste de 50 tarefas reais de um desenvolvedor russo mostrou que o DeepSeek V4 é notavelmente mais barato que o Claude Sonnet 4.6, mas com

Grupo Smart Service testa controle por voz de robô transportador de paletes
O primeiro teste do Grupo Smart Service mostrou que a voz pode acionar cenários do robô de paletes em um depósito, mas apenas com comandos r

Anthropic remove Claude Code do plano de $20, SpaceX prepara aquisição de Cursor
Anthropic testa remoção do Claude Code da assinatura de $20, Duolingo remove métricas de IA para funcionários, e modelo fechado Claude Mytho

OpenAI lançou GPT-5.5: mais forte em programação, agentes e trabalho no computador
OpenAI lançou GPT-5.5 focado em código, tarefas agentivas e trabalho no computador: o modelo já está disponível em ChatGPT e Codex, mas a AP