Últimas publicações

ML Red Teaming para LLMs: De Alucinações a Vazamento de Dados — Prática de Testes
Como atacar modelos LLM para encontrar vulnerabilidades antes dos adversários: uma análise prática de classes de ataque, metodologias de testes e defesas para IA corporativa.

Activation Steering: um tutorial para controlar um modelo de linguagem de dentro usando PyTorch e nnsight
Um tutorial no Habr explica Activation Steering — como controlar o comportamento de um LLM intervindo diretamente nas ativações da rede neural sem retreinamento, usando PyTorch, nnsight e pyvene.

Agentes de IA gerenciam processos de RH, mas HRIS não vê quem tomou a decisão
Agentes filtram candidatos e aprovam férias, mas o sistema registra apenas o resultado — o responsável pela decisão e a trilha de auditoria desaparecem.

Agentes MCP em Sistemas Corporativos: Como SimpleOne e Ainergy Integraram IA em Processos de Negócio
SimpleOne e Ainergy integraram agentes MCP em sua plataforma corporativa — agora a IA não apenas ajuda com texto, mas cria tarefas, verifica status e trabalha diretamente com processos de negócio.

Nove agentes de IA, uma cota de API: como o Rate Governor previne falhas em cascata
Retentativas padrão e jitter não funcionam quando múltiplos agentes compartilham uma cota comum — uma resposta 429 se transforma em uma avalanche de requisições e derruba todo o sistema.

Como Bitrix24 construiu eval e automatizou a otimização do agente RAG Martha
Engenheiros da Bitrix24 compartilharam sua metodologia para avaliação end-to-end de sistemas RAG: conjuntos de dados especializados e sintéticos, a lacuna entre métricas de retrieval e desempenho real, e um ciclo automat

IA Sem Extremos: O Ciclo Fechado dos Modelos Generativos e a Dívida Cognitiva
A IA generativa pode degradar ao treinar em seus próprios textos, enquanto usuários perdem habilidades de pensamento independente — examinamos riscos reais e oportunidades não óbvias.

Janela de Contexto de LLM: Por Que Redes Neurais Esquecem Partes da Sua Conversa
Toda vez que você escreve em um chat com IA, o modelo relê toda a conversa do zero — ele não tem memória no sentido convencional. Isso é chamado de janela de contexto, e tem um limite rígido.

Archspec investigate: como LLMs detectam conflitos entre serviços antes da escrita do código
Terceira parte da série archspec: o autor testou se Claude Sonnet 4.6 consegue detectar conflitos entre serviços na fase de planejamento quando fornecidos contratos legíveis por máquina SERVICE_MAP.yaml.

Como uma Advogada Escreveu seu Primeiro Código com IA e Automatizou Conformidade
Uma advogada cansou de esperar pelo TI e abriu uma IDE pela primeira vez: em poucas semanas com um assistente de IA, ela escreveu um script Python que automatiza verificações de conformidade de contratos em relação às po

Sangue e suor da IA: milhões de trabalhadores ocultos por trás de cada consulta ao ChatGPT
Milhões de anotadores mal remunerados do Quênia, Paquistão e Índia tornam o ChatGPT possível — e seu trabalho é deliberadamente omitido.

Como Construir um Planejador com IA em Solo: Do Orçamento Zero ao MWP
Um desenvolvedor compartilha como alcançou um planejador com IA funcional em solo e com orçamento zero — da ideia ao MVP, e depois ao MWP, um produto minimamente impressionante.

Codificadores de vibe chegam ao mercado: como LLMs estratificaram o mercado freelance até 2026
Um freelancer que cresceu de 40 mil para 270 mil por mês conta como codificadores de vibe armados com IA transformaram o mercado: guerras de preço, trabalhos por 7 mil rublos e números reais de renda.

Verificação de Programas na Era da IA: Por Que Alucinações Tornam a Verificação de Código Mais Importante
Pesquisadores provam: IA acelera a escrita de código, mas alucinações tornam a verificação formal de programas criticamente importante — especialmente para sistemas comerciais e críticos.

Agente de IA local em vez de administrador de sistema: análise autônoma de logs de servidor
Um desenvolvedor substituiu a análise manual mensal de logs por um agente de IA local que monitora continuamente servidores físicos e alerta sobre falhas antes que se tornem críticas.

Anotações de RH da Cloud.ru: O que ChatGPT fez com a contratação e as entrevistas
Marina Lomadze, gerente de recrutamento da Cloud.ru, explica como a IA transformou o recrutamento: por que os currículos perderam significado, como as entrevistas mudaram e quem as empresas estão contratando agora.

Anthropic lançou Claude Mythos para cibersegurança — mas primeiro vazou seus próprios rascunhos
Anthropic anunciou a IA de cibersegurança Claude Mythos com 11 parceiros e US$100 milhões — mas um mês antes do lançamento, acidentalmente expôs acesso público a 3000 arquivos internos.

AlphaFold e AI desafiam Alzheimer — após 20 anos presos a uma única teoria
A doença de Alzheimer permanece intratável há três décadas — em grande parte devido ao monopólio da 'hipótese amiloide'. Agora a IA está encontrando novos alvos moleculares e mudando toda a lógica da busca.

Não sei programar, mas tenho 10 bots Telegram rodando: Minha história de vibeoding com Claude Code
Um autor sem nenhuma habilidade de programação implantou uma dúzia de bots Telegram funcionais em uma VPS usando Claude Code — e agora geram renda real.

Siemens lança agente IA para TIA Portal que entende a arquitetura do seu projeto
O novo agente Siemens está integrado ao TIA Portal e gera código PLC com base na topologia real da rede e estrutura do projeto — sem adaptação manual ou alucinações.

Emergence AI lançou 5 civilizações de IA: Claude construiu uma utopia, Grok morreu em 4 dias
A empresa Emergence AI criou cinco cidades virtuais gerenciadas por Claude, Gemini, Grok e GPT — e observou como agentes de IA evoluíram ao longo de 15 dias.

Estratégia de Marketing com ChatGPT em 20 Minutos: Prompts Reais e Análise de Erros
No Habr analisaram por que ChatGPT produz textos vazios em vez de estratégia — e mostraram um fluxo de trabalho com prompts reais, um case e uma lista honesta de onde a IA falha.

Agentes de código: assinatura ou API — análise de preços para seus harnesses personalizados
Um desenvolvedor do Coddy Agent comparou as assinaturas do Claude Max, Cursor, Windsurf e Copilot com a API direta — qual é mais econômico e o que funciona para integrar em seu próprio pipeline de agentes.

Нейро-панк: почему разработчики должны освободить ИИ от корпоративного контроля
Хабр-эссе призывает ML-исследователей и схемотехников стать «нейро-панками» — строить ИИ, независимый от корпораций и государств, пока это ещё возможно.

Claude Fable 5 viveu três dias: vazamento de prompt de sistema, degradação e diretiva dos EUA
A Anthropic lançou o Claude Fable 5, mas retirou o acesso três dias depois — após vazamento do prompt de sistema, escândalo de degradação de respostas e intervenção do governo dos EUA.

Servidor MCP para Obsidian: como conectar sua base de conhecimento pessoal a qualquer LLM
Um desenvolvedor criou o servidor MCP obsidian-agent, que conecta um cofre Obsidian a qualquer cliente LLM e dá ao modelo de linguagem acesso direto a notas pessoais sem cópia manual.

Por que ChatGPT Esquece: Explicação da Janela de Contexto de Modelos de Linguagem
Explicamos o que é uma janela de contexto em modelos de linguagem e por que o ChatGPT começa a 'esquecer' detalhes da tarefa após uma conversa longa — essa é uma limitação arquitetônica, não um erro.

Anthropic sobre agentes de IA em cibersegurança: capacidades e armadilhas
Anthropic publicou pesquisa sobre a aplicação de agentes de IA em cibersegurança — o desenvolvedor Edgar Sipki analisou o documento e fez perguntas incômodas sobre sua confiabilidade real.

Claude Code lançou modo Agent Team: uma equipe de agentes IA em vez de um
O modo experimental Agent Team no Claude Code lança múltiplos agentes independentes em paralelo: cada um divide tarefas de uma lista compartilhada e se comunica com colegas.

Um engenheiro ditou um diário para um agente de IA durante quatro meses — e percebeu que a memória importa mais que o modelo
Um desenvolvedor construiu um sistema de diário de voz usando faster-whisper e Telegram, mas a descoberta principal provou ser surpreendente: memória confiável é mais importante que potência do modelo de linguagem.