Источник

Habr AI

712

всего статей

407

за неделю

2 мая

последнее обновление

RSS Оригинал →

LLM·Habr AI

Playwright e MCP: como um agente de IA testa UI e banco de dados sem assertions SQL manuais

Um agente Playwright combinado com MCP pode não apenas executar o checkout no navegador, mas também verificar imediatamente mudanças no banc

2026-04-28·2 мин

LLM·Habr AI

Por que modelos de OpenAI, Google e Anthropic se tornam mais convincentes, mas cometem mais erros

Grandes laboratórios de IA tentam corrigir erros de modelos com computações adicionais, mas quanto mais convincentes as respostas se tornam,

2026-04-28·2 мин

LLM·Habr AI

Habr AI: Por que modelos de linguagem precisam de guardrails e como se defender contra prompt hacking

Habr AI examina por que LLMs agora exigem uma camada de proteção separada: desde conteúdo tóxico e vazamentos de dados até prompt injection,

2026-04-28·2 мин

LLM·Habr AI

Engenheiro da Selectel Apresentou Agente LLM para Seleção Automática de Domínios Disponíveis

Um engenheiro da Selectel construiu um serviço em Python que solicita a uma LLM a geração de nomes de domínio e os verifica imediatamente vi

2026-04-28·2 мин

LLM·Habr AI

Anthropic Explicou Como e Quando Começar Corretamente uma Nova Sessão no Claude Code

Anthropic lançou o comando /usage e explicou como gerenciar sessões no Claude Code para que um milhão de tokens de contexto não se transform

2026-04-28·3 мин

LLM·Habr AI

Niantic Mostra Como Pokémon Go Transforma Ações de Jogadores em Datasets para IA

Niantic, Google e outras empresas transformam cada vez mais ações comuns de usuários — desde jogos e viagens até CAPTCHAs — em dados para tr

2026-04-28·3 мин

LLM·Habr AI

Positive Technologies listou os melhores benchmarks para avaliar LLM em cibersegurança

Positive Technologies dividiu os benchmarks de cibersegurança para LLM em testes de conhecimento e avaliações práticas, mostrando que os mod

2026-04-28·3 мин

LLM·Habr AI

Deflação de IA em TI: Casos Klarna e IBM explicam por que há mais vagas mas crescimento salarial mais fraco

Um novo paradoxo surgiu no desenvolvimento: vagas para engenheiros aumentaram 11%, mas o crescimento salarial em TI desacelerou para 1,6%, e

2026-04-28·3 мин

LLM·Habr AI

MTS mostrou como o OpenClaw foi conectado a um robô e levou um agente de IA para o mundo físico

A equipe MWS demonstrou que o OpenClaw pode ser conectado a um robô físico através de uma camada de software simples e LLM em nuvem sem cons

2026-04-28·3 мин

LLM·Habr AI

Claude Sonnet Ajuda Executivos a Montar Diretor de IA para Decisões Críticas em 8 Horas

No hackathon fechado Snow BASE, uma equipe de CEO, CTO e CIO montou CAITO em oito horas — um diretor de IA em Claude Sonnet que muda de posi

2026-04-28·3 мин

LLM·Habr AI

Por que ServiceNow, Atlassian e BMC estão transformando o mercado de ITSM e o debate sobre plataforma em 2026

O mercado de ITSM com IA está se movendo de chatbots para infraestrutura gerenciada, onde segurança, escalabilidade e controle de agentes de

2026-04-28·3 мин

LLM·Habr AI

ServiceNow e Atlassian Lideram o Mercado de ITSM em Direção às Plataformas de IA em vez de Soluções Prontas

A IA em ITSM está mudando rapidamente de chatbots para infraestrutura gerenciada: o mercado compara abordagens de plataforma e prontas para

2026-04-28·3 мин

LLM·Habr AI

Wildberries & Russ descreveu qual nível de maturidade de dados é necessário para agentes de IA precisos

Wildberries & Russ descreveu um modelo de maturidade de dados em três níveis onde a qualidade dos metadados e da camada semântica determina

2026-04-28·3 мин

LLM·Habr AI

Midjourney em 2026: por que um estilo visual forte não o torna universal

Uma análise do Midjourney mostra que em 2026, seu principal diferencial não é a universalidade, mas o estilo reconhecível e o controle profu

2026-04-28·2 мин

LLM·Habr AI

Cursor e Microsoft Research Testam se Agentes de IA Precisam de Acesso Completo ao Debugger

Um experimento com Debug2Fix e Modo Debug do Cursor mostra que breakpoints, execução passo a passo e avaliação de expressão podem ajudar age

2026-04-28·2 мин

LLM·Habr AI

Raft mostrou como priorizar iniciativas de AI e construir um roadmap realista

Raft analisou como avaliar o valor de iniciativas de AI, filtrar ideias fracas através de uma matriz de viabilidade e construir um roadmap d

2026-04-28·3 мин

LLM·Habr AI

Gemma 4 no Codex CLI: execução local funciona, mas ainda é mais fraca que a nuvem

Testes do Gemma 4 local no Codex CLI mostraram que o modelo já consegue trabalhar com tool calling e passar em testes, mas ainda é inferior

2026-04-28·3 мин

LLM·Habr AI

Por que LLMs criam uma ilusão de criatividade e não garantem verdadeira novidade de ideias

LLMs ajudam a desenvolver rapidamente uma ideia e levá-la à forma final, mas seu estilo confiante mascara facilmente secundariedade, compila

2026-04-28·3 мин

LLM·Habr AI

Como Agentes de IA e IBM Estão Mudando a Gestão de Projetos de TI e o Papel do Gerente de Projeto

Agentes de IA vão além de chatbots: já ajudam gerentes de projetos a planejar sprints, avaliar riscos e resolver incidentes, e o caso da IBM

2026-04-28·2 мин

LLM·Habr AI

StudyAI: Como a IA Generativa Mina a Confiança em Textos, Vozes e Vídeos Online

StudyAI analisa como a IA generativa torna as deepfakes mais convincentes, desvaloriza evidências digitais e empurra a internet para uma era

2026-04-28·3 мин

LLM·Habr AI

Habr AI Explica Por Que LLMs Não Calculam, Não Aprendem no Diálogo e Dependem de Ferramentas

Habr AI explica que modelos de linguagem conseguem apenas trabalhar com texto por conta própria, enquanto memória, cálculos, busca, agentes

2026-04-28·3 мин

LLM·Habr AI

Svoi.ru reduziu a preparação para testes em 70% usando agentes de IA

A equipe da Svoi.ru demonstrou como agentes de IA podem automatizar análise de requisitos e preparação de documentação de testes, eliminando

2026-04-28·2 мин

LLM·Habr AI

Kodik explica por que benchmarks públicos de modelos de linguagem são enganosos

Kodik analisou fraquezas em testes populares de LLM e mostrou por que para seu editor de código AI, um benchmark interno é mais importante q

2026-04-28·2 мин

LLM·Habr AI

Como Google DeepMind e Concorrentes Estão Transformando a Música: Cinco Serviços de IA para Geração de Faixas

Uma coletânea de cinco serviços de IA demonstra como a geração de música a partir de texto deixou de ser um brinquedo e se tornou uma ferram

2026-04-28·3 мин

LLM·Habr AI

WisprFlow, Whisper e GigaAM: quem reconhece melhor a fala russo-inglesa

O autor comparou cinco aplicativos e cinco modelos de entrada por voz para mistura russo-inglesa e demonstrou como as soluções open source l

2026-04-28·3 мин

LLM·Habr AI

GPTunneL e a Tendência Forbes: Por Que AI-Superapps Estão Se Tornando o Novo Motor de Crescimento do Mercado

GPTunneL, que cresceu para 2 milhões de usuários, descreve como AI-superapps estão mudando o comportamento da audiência, a demanda corporati

2026-04-28·2 мин

LLM·Habr AI

Habr mostrou como treinar uma mini-LLM em C# usando ILGPU e gráficos AMD integrados

Habr publicou uma análise de como construir e treinar uma LLM minúscula em C# com ILGPU e OpenCL, exportá-la para GGUF e executá-la no LM St

2026-04-28·2 мин

LLM·Habr AI

Anthropic apresenta Claude Mythos Preview por system card de 244 páginas em vez de lançamento padrão

Anthropic apresentou Claude Mythos Preview não como um lançamento típico, mas através de uma system card de 244 páginas detalhando as capaci

2026-04-28·2 мин

LLM·Habr AI

OpenAI e Anthropic redefinem o cálculo de custos de modelos de linguagem: em 2026, o preço da tarefa é importante

OpenAI e Anthropic estão mudando as regras de precificação de LLM: em 2026, para as empresas não basta mais acompanhar o preço do token — é

2026-04-28·2 мин

LLM·Habr AI

Claude Code Transformado em Analista de IA por BABOK: Assistente Conduz Entrevistas e Coleta Requisitos

Com base em Claude Code, desenvolveram um assistente de IA para análise de negócios seguindo BABOK v3: ele auxilia na condução de entrevista

2026-04-28·2 мин