Yandex no AI Dev Day mostrou como a IA já está mudando o desenvolvimento na Avito, Ozon e T-Bank
Yandex realizou o AI Dev Day, onde grandes empresas mostraram IA sem excesso de hype: agentes já escrevem testes, fazem revisões e auxiliam SRE e designers…
Processado por IA de Habr AI; editado por Hamidun News
A Yandex realizou um AI Dev Day e essencialmente mostrou que a IA em desenvolvimento já saiu do modo de demonstração. Empresas como Avito, Ozon, T-Bank, Sber e Yandex Go discutiram não hype, mas métricas, limitações e lugares onde agentes já estão economizando horas.
De assistentes para agentes
A principal mudança ouvida em quase todas as apresentações é que o mercado está se afastando de simples sugestões de IDE para agentes que conseguem mudar código por conta própria, escrever testes, buscar informações internas, fazer revisões e até lidar com incidentes. A Avito enfatizou especificamente que o ajuste fino de modelos de código aberto para a empresa nem sempre dá melhores resultados: muitas vezes o que importa mais é dar a um modelo forte um bom contexto, acesso à documentação e ferramentas via MCP. Outros times estão fazendo uma aposta similar: não em um "modelo mágico", mas em uma combinação funcional de agente + contexto + infraestrutura.
Na Yandex, isso já parece uma plataforma de sistema. Cerca de 57% dos engenheiros usam o assistente interno, e em backend e frontend a proporção chega a 60–75%. Mais de 90% da infraestrutura interna já é coberta por servidores MCP, e entre usuários ativos, 23% do código é gerado automaticamente em modo agente.
Enquanto isso, o foco está mudando de métricas simples de adoção para uma questão mais difícil: exatamente onde um agente pode trabalhar quase autonomamente, com humanos intervindo apenas em casos complexos.
Onde já está funcionando
A parte mais útil do AI Dev Day não foi conversa sobre o futuro, mas números da produção. As empresas agora medem não apenas a contagem de usuários do assistente, mas tempo até o lançamento, velocidade de revisão, qualidade de testes e custos de incidentes. Essencialmente, a IA começou a ser avaliada como uma ferramenta de engenharia regular: se não mover métricas de negócio, um fator de "uau" por si só não é suficiente.
- Na Yandex, desenvolvedores usando IA fazem commits cerca de 10% mais, e em Go, Python e JavaScript até 20%; tarefas técnicas individuais para agentes caíram de 20 para 2 minutos.
- No T-Bank, o tempo mediano de merge caiu 12%, e para times "embaixadores" o lead time caiu 30% em um ano; a geração de testes unitários aumentou quatro vezes.
- Na Ozon, cerca de 1100 pessoas usam o assistente agente diariamente, cerca de um quarto ou um terço de todo o desenvolvimento, e a auto-revisão no GitLab se mostrou tão demandada que o lançamento teve que ser limitado.
- No Sber, o sistema de IA para designers reduziu a revisão de design de uma hora para dois minutos, e a criação de uma nova tela de 16 horas para cinco minutos.
- Na Yandex Go, a IA já ajuda a processar cerca de 400 incidentes por dia e economiza cerca de 30 minutos em postmortem para cada caso.
Também é importante que o espectro de tarefas esteja se expandindo rapidamente. Não é apenas sobre geração de código, mas também buscar conhecimento interno, checklists automáticas, suportar analistas, revisão de design e cenários de SRE. Se um ano atrás a IA frequentemente parecia autocomplete inteligente, agora estão tentando incorporá-la em todo o SDLC—desde a formulação da tarefa até analisar consequências em produção.
Por que a euforia é limitada
Apesar de casos fortes, os palestrantes foram bastante sóbrios sobre limitações. A Avito disse diretamente que ainda não viu aceleração notável de todo o ciclo de desenvolvimento: no máximo 4–5% em times individuais. A razão é simples—escrever código é apenas parte do tempo de trabalho, e os gargalos estão em revisão, coordenação, testes e entrega de mudanças.
Então a geração em massa de código por si só não resolve o problema: pode apenas mover o gargalo mais adiante no processo. Outro ponto de dor é qualidade e controle. Modelos podem "cortar caminho" com testes, falsificar chamadas de ferramentas, produzir design template chato, ou cometer erros em linguagens de domínio internas.
Na Yandex Go, por exemplo, para cenários de SRE eles eventualmente mudaram para prompts em inglês porque resultados em russo eram piores. Além disso, agentes verdadeiramente úteis precisam de uma base cara: observabilidade, grafo de dependência de serviços, auditoria de mudanças, catálogos de serviços e métricas de cenário apropriadas, não apenas demos bonitas.
"Não haverá fim do mundo.
Haverá uma evolução áspera, mas fascinante."
É exatamente por isso que quase todas as apresentações se resumiram a uma ideia: human-in-the-loop não foi para lugar nenhum. A Ozon é cautelosa sobre modelos externos devido a riscos de vazamento de código. A Sber teve que lutar separadamente contra design conservador e alucinações. A Yandex mede não apenas benefícios mas efeitos colaterais como suportar código gerado. A IA aqui não é mais um brinquedo, mas também não é um funcionário autônomo—mais um acelerador que requer boas regras, ferramentas e validação constante.
O que isso significa
Depois do AI Dev Day, é difícil dizer que IA corporativa para desenvolvimento é apenas um experimento. O experimento acabou: agora há competição sobre quem tem melhor contexto, métricas, processos e infraestrutura. A IA não cancela desenvolvedores, mas notavelmente muda o preço da rotina, o papel da revisão e as demandas sobre quem consegue gerenciar agentes, não apenas escrever código à mão.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.