Habr AI

Playwright e MCP: como um agente de IA testa UI e banco de dados sem assertions SQL manuais
Um agente Playwright combinado com MCP pode não apenas executar o checkout no navegador, mas também verificar imediatamente mudanças no banc

Por que modelos de OpenAI, Google e Anthropic se tornam mais convincentes, mas cometem mais erros
Grandes laboratórios de IA tentam corrigir erros de modelos com computações adicionais, mas quanto mais convincentes as respostas se tornam,

Habr AI: Por que modelos de linguagem precisam de guardrails e como se defender contra prompt hacking
Habr AI examina por que LLMs agora exigem uma camada de proteção separada: desde conteúdo tóxico e vazamentos de dados até prompt injection,

Engenheiro da Selectel Apresentou Agente LLM para Seleção Automática de Domínios Disponíveis
Um engenheiro da Selectel construiu um serviço em Python que solicita a uma LLM a geração de nomes de domínio e os verifica imediatamente vi

Anthropic Explicou Como e Quando Começar Corretamente uma Nova Sessão no Claude Code
Anthropic lançou o comando /usage e explicou como gerenciar sessões no Claude Code para que um milhão de tokens de contexto não se transform

Niantic Mostra Como Pokémon Go Transforma Ações de Jogadores em Datasets para IA
Niantic, Google e outras empresas transformam cada vez mais ações comuns de usuários — desde jogos e viagens até CAPTCHAs — em dados para tr

Positive Technologies listou os melhores benchmarks para avaliar LLM em cibersegurança
Positive Technologies dividiu os benchmarks de cibersegurança para LLM em testes de conhecimento e avaliações práticas, mostrando que os mod

Deflação de IA em TI: Casos Klarna e IBM explicam por que há mais vagas mas crescimento salarial mais fraco
Um novo paradoxo surgiu no desenvolvimento: vagas para engenheiros aumentaram 11%, mas o crescimento salarial em TI desacelerou para 1,6%, e

MTS mostrou como o OpenClaw foi conectado a um robô e levou um agente de IA para o mundo físico
A equipe MWS demonstrou que o OpenClaw pode ser conectado a um robô físico através de uma camada de software simples e LLM em nuvem sem cons

Claude Sonnet Ajuda Executivos a Montar Diretor de IA para Decisões Críticas em 8 Horas
No hackathon fechado Snow BASE, uma equipe de CEO, CTO e CIO montou CAITO em oito horas — um diretor de IA em Claude Sonnet que muda de posi

Por que ServiceNow, Atlassian e BMC estão transformando o mercado de ITSM e o debate sobre plataforma em 2026
O mercado de ITSM com IA está se movendo de chatbots para infraestrutura gerenciada, onde segurança, escalabilidade e controle de agentes de

ServiceNow e Atlassian Lideram o Mercado de ITSM em Direção às Plataformas de IA em vez de Soluções Prontas
A IA em ITSM está mudando rapidamente de chatbots para infraestrutura gerenciada: o mercado compara abordagens de plataforma e prontas para

Wildberries & Russ descreveu qual nível de maturidade de dados é necessário para agentes de IA precisos
Wildberries & Russ descreveu um modelo de maturidade de dados em três níveis onde a qualidade dos metadados e da camada semântica determina

Midjourney em 2026: por que um estilo visual forte não o torna universal
Uma análise do Midjourney mostra que em 2026, seu principal diferencial não é a universalidade, mas o estilo reconhecível e o controle profu

Cursor e Microsoft Research Testam se Agentes de IA Precisam de Acesso Completo ao Debugger
Um experimento com Debug2Fix e Modo Debug do Cursor mostra que breakpoints, execução passo a passo e avaliação de expressão podem ajudar age

Raft mostrou como priorizar iniciativas de AI e construir um roadmap realista
Raft analisou como avaliar o valor de iniciativas de AI, filtrar ideias fracas através de uma matriz de viabilidade e construir um roadmap d

Gemma 4 no Codex CLI: execução local funciona, mas ainda é mais fraca que a nuvem
Testes do Gemma 4 local no Codex CLI mostraram que o modelo já consegue trabalhar com tool calling e passar em testes, mas ainda é inferior

Por que LLMs criam uma ilusão de criatividade e não garantem verdadeira novidade de ideias
LLMs ajudam a desenvolver rapidamente uma ideia e levá-la à forma final, mas seu estilo confiante mascara facilmente secundariedade, compila

Como Agentes de IA e IBM Estão Mudando a Gestão de Projetos de TI e o Papel do Gerente de Projeto
Agentes de IA vão além de chatbots: já ajudam gerentes de projetos a planejar sprints, avaliar riscos e resolver incidentes, e o caso da IBM

StudyAI: Como a IA Generativa Mina a Confiança em Textos, Vozes e Vídeos Online
StudyAI analisa como a IA generativa torna as deepfakes mais convincentes, desvaloriza evidências digitais e empurra a internet para uma era

Habr AI Explica Por Que LLMs Não Calculam, Não Aprendem no Diálogo e Dependem de Ferramentas
Habr AI explica que modelos de linguagem conseguem apenas trabalhar com texto por conta própria, enquanto memória, cálculos, busca, agentes

Svoi.ru reduziu a preparação para testes em 70% usando agentes de IA
A equipe da Svoi.ru demonstrou como agentes de IA podem automatizar análise de requisitos e preparação de documentação de testes, eliminando

Kodik explica por que benchmarks públicos de modelos de linguagem são enganosos
Kodik analisou fraquezas em testes populares de LLM e mostrou por que para seu editor de código AI, um benchmark interno é mais importante q

Como Google DeepMind e Concorrentes Estão Transformando a Música: Cinco Serviços de IA para Geração de Faixas
Uma coletânea de cinco serviços de IA demonstra como a geração de música a partir de texto deixou de ser um brinquedo e se tornou uma ferram

WisprFlow, Whisper e GigaAM: quem reconhece melhor a fala russo-inglesa
O autor comparou cinco aplicativos e cinco modelos de entrada por voz para mistura russo-inglesa e demonstrou como as soluções open source l

GPTunneL e a Tendência Forbes: Por Que AI-Superapps Estão Se Tornando o Novo Motor de Crescimento do Mercado
GPTunneL, que cresceu para 2 milhões de usuários, descreve como AI-superapps estão mudando o comportamento da audiência, a demanda corporati

Habr mostrou como treinar uma mini-LLM em C# usando ILGPU e gráficos AMD integrados
Habr publicou uma análise de como construir e treinar uma LLM minúscula em C# com ILGPU e OpenCL, exportá-la para GGUF e executá-la no LM St

Anthropic apresenta Claude Mythos Preview por system card de 244 páginas em vez de lançamento padrão
Anthropic apresentou Claude Mythos Preview não como um lançamento típico, mas através de uma system card de 244 páginas detalhando as capaci

OpenAI e Anthropic redefinem o cálculo de custos de modelos de linguagem: em 2026, o preço da tarefa é importante
OpenAI e Anthropic estão mudando as regras de precificação de LLM: em 2026, para as empresas não basta mais acompanhar o preço do token — é

Claude Code Transformado em Analista de IA por BABOK: Assistente Conduz Entrevistas e Coleta Requisitos
Com base em Claude Code, desenvolveram um assistente de IA para análise de negócios seguindo BABOK v3: ele auxilia na condução de entrevista