Habr AI

NextFilm descreve modelo de recomendação de filmes: cold start, vetor de gosto e camada GPT
O autor do NextFilm mostrou como recomendar filmes a novos usuários: coletar avaliações iniciais, construir um vetor de gosto, compará-lo co

Desenvolvedor do n0x ensinou seu agente de navegador a abrir sites e tirar capturas de tela
O projeto n0x evoluiu de um simples chatbot de linguagem para um agente de navegador com suporte a MCP: agora ele abre sites, tira capturas

Anthropic testa Claude Mythos: vazamento revela modelo com 10 trilhões de parâmetros
Um vazamento interno da Anthropic revelou Claude Mythos — um modelo que a empresa considera seu IA mais poderoso e ainda não está pronta par

Anthropic e OpenClaude: por que o Claude Code 'grátis' em 2026 não é tão grátis assim
Após o vazamento do código-fonte do Claude Code, a comunidade rapidamente montou o OpenClaude, mas por trás da promessa de codificação AI gr

Como uma única instrução de sistema transforma um LLM em uma ferramenta confiável: testes em Qwen e DeepSeek
Um único prompt de sistema pode eliminar alucinações em LLM: um experimento com Qwen e DeepSeek mostrou que um 'exoesqueleto' de regras tran

T-Technologies sobre open source em AI/ML: como o trabalho com LLM é organizado internamente
Entrevista com o time AI/ML do Grupo T-Technologies — sobre desenvolvimento de LLM, participação em open source e direcionamento de pesquisa

NVIDIA na GTC 2026 muda foco de chips para fábricas de tokens e a era de Agent-as-a-Service
Na GTC 2026, a NVIDIA apresentou uma aposta não em GPUs individuais, mas em fábricas de tokens, a arquitetura modular Vera Rubin e a economi

PageIndex da VectifyAI oferece busca sem embeddings para documentos longos
PageIndex constrói um índice estruturado em árvore do documento e busca seções relevantes através de raciocínio LLM, prometendo RAG sem embe

GolangConf 2026 e Ontiko: por que times Go precisam consertar a arquitetura, não a velocidade do código
Ontiko está reestruturando GolangConf 2026 em torno dos problemas reais dos times Go: a IA acelerou a escrita de código, mas decisões arquit

ruGPT3XL Ganha Contexto de 8k: Modelo Restaurado Ultrapassa Limite de 2k com Mínimas Perdas
O autor da restauração do ruGPT3XL corrigiu sparse attention, aumentou o contexto do modelo de 2k para 8k e preservou a qualidade em sequênc

OpenAI, MiniMax e Nvidia determinaram o tom de março em IA: Sora, GPT-5.4 e a aposta em Mira Murati
Março em IA foi marcado por grandes mudanças de produtos: OpenAI reconsidera o futuro de Sora, Google e Anthropic aceleram seus assistentes,

Startups AI-first: por que o growth marketing não funciona e o que quebra no funil
Produtos AI-first costumam ter métricas fortes no topo do funil que mascaram demanda falsa: pessoas chegam pela novidade, não para resolver

Habr: Agentes de IA transformam delivery, e equipes precisam reconstruir todo o ciclo de desenvolvimento
Habr explica por que com o surgimento de agentes de IA, as equipes precisam reestruturar não apenas a escrita de código, mas todo o delivery

M2 delegou 40% dos textos de marketing a uma rede neural e manteve a qualidade do conteúdo
A equipe da M2 integrou um redator de IA no seu departamento editorial interno, delegou 40% dos textos de produtos e marketing para ele e ma

Sova AI lança assistente Android que controla telefone sem PC e root
Sova AI apresentou um aplicativo Android com agente IA que abre aplicativos, pressiona botões, faz scroll em telas e executa comandos de voz

API de OpenAI e Consultas Fan-Out do GPT: Como Especialistas em SEO Analisam a Busca por IA
O autor demonstra como obter consultas fan-out ocultas do GPT via API OpenAI e usá-las para analisar como modelos de IA coletam fontes e ger

Hack The Box: Como MCP Inspector Transforma Ferramentas de IA em um Novo Vetor de Ataque
Uma análise do Kobold do HTB Season 10 mostra como um único utilitário dev para servidores de IA pode levar a RCE, LFI, reutilização de cred

Sistema baseado em LLM reduziu preparação de mapas de controle de qualidade em fábrica metalúrgica de 2 horas para 5 minutos
Em uma fábrica metalúrgica, um sistema LLM começou a montar mapas de controle de qualidade em 3–5 minutos em vez de duas horas: não um promp

Habr AI mostra como adicionar memória e contexto a um chat LLM em Python com Ollama e LiteLLM
Em uma nova parte do tutorial sobre chat em Python com Ollama e LiteLLM, é demonstrado como armazenar o histórico de mensagens, transmitir c

Claude Sonnet e Jarvis Pattern: por que agentes de IA podem precisar apenas de um sistema operacional
No Habr, propuseram construir agentes de IA pessoais não em torno de frameworks complexos, mas em uma combinação de LLM, sistema operacional

Yandex mostrou como chegar às respostas do Alice e medir visibilidade de busca
Yandex lançou uma seção 'Visibilidade do Site no Alice' no Webmaster. A mensagem para os negócios é clara: respostas do assistente vêm não d

Flant: como um desenvolvedor Go transformou Zed e Gemini em um agente IA útil
Um desenvolvedor Go da Flant descreveu o caminho desde plugins IDE lentos até uma combinação de Zed, Gemini 3 Flash e gopls-mcp, que fornece

Agentis Memory: Armazenamento Compatível com Redis com Busca Vetorial e Embeddings Locais
Agentis Memory transforma um armazenamento compatível com Redis em memória compartilhada para agentes de IA: com embeddings locais, busca ve

Habr: como dados sintéticos ajudam a treinar modelos e por que self-training leva ao colapso
Dados sintéticos ajudam a IA a compensar a escassez de corpus de alta qualidade gerados por humanos, mas com self-training descontrolado, mo

Por que ChatGPT e Gemini não recomendam seu B2B SaaS, mesmo que o site seja bem construído
Até um site de B2B SaaS bem projetado pode não aparecer nas respostas de ChatGPT, Gemini e Perplexity se a marca não tiver uma categoria cla

Por que IA em Design de UI é importante não para produção, mas como fonte de mutações visuais
UI gerada por IA é valiosa não apenas pela velocidade de sketches: seu poder reside em combinações visuais raras que ajudam designers a enco

Qwen e llama.cpp: como executar uma rede neural local sem nuvem no seu computador ou servidor
Um guia prático explicando como executar o modelo Qwen através de llama.cpp em seu próprio computador ou servidor para trabalhar com uma red

Anthropic e Claude Cowork: 10 tarefas de trabalho que a IA tira dos humanos
Claude Cowork da Anthropic demonstra como a IA assume briefings matutinos, propostas, respostas a clientes e relatórios, devolvendo até dois

Directum: por que os negócios discutem ativamente agentes de IA mas hesitam em implementá-los nos processos
Directum explica por que os agentes de IA se tornaram a principal tendência corporativa, mas a adoção em massa é impedida por infraestrutura

ClawRouter reduziu custos de LLM API de $47 para $1.80 por semana — análise do roteador inteligente
O ClawRouter analisa cada prompt em 15 parâmetros e o roteia para o modelo mais adequado e econômico — reduzindo despesas semanais com LLM A