Yandex en AI Dev Day mostró cómo la IA ya está cambiando el desarrollo en Avito, Ozon y T-Bank
Yandex realizó AI Dev Day donde grandes empresas mostraron IA sin exceso de hype: los agentes ya escriben pruebas, realizan revisiones y ayudan a SRE y…
Procesado por IA desde Habr AI; editado por Hamidun News
Yandex organizó un AI Dev Day y esencialmente mostró que la IA en desarrollo ya ha salido del modo de demostración. Empresas como Avito, Ozon, T-Bank, Sber y Yandex Go discutieron no hype, sino métricas, limitaciones y lugares donde los agentes ya están ahorrando horas.
De asistentes a agentes
El cambio principal escuchado en casi todas las presentaciones es que el mercado se está alejando de simples sugerencias de IDE hacia agentes que pueden cambiar código por sí solos, escribir pruebas, buscar información interna, hacer revisiones e incluso manejar incidentes. Avito enfatizó específicamente que el ajuste fino de modelos de código abierto para la empresa no siempre da mejores resultados: a menudo lo que importa más es darle a un modelo fuerte un buen contexto, acceso a documentación y herramientas mediante MCP. Otros equipos están haciendo una apuesta similar: no por un "modelo mágico", sino por una combinación funcional de agente + contexto + infraestructura.
En Yandex, esto ya se ve como una plataforma de sistema. Alrededor del 57% de los ingenieros usan el asistente interno, y en backend y frontend la proporción llega al 60–75%. Más del 90% de la infraestructura interna ya está cubierta por servidores MCP, y entre usuarios activos, el 23% del código se genera automáticamente en modo de agente.
Mientras tanto, el enfoque se está desplazando de métricas simples de adopción a una pregunta más difícil: ¿dónde exactamente puede un agente trabajar casi autónomamente, con humanos interviniendo solo en casos complejos?
Dónde ya funciona
La parte más útil del AI Dev Day no fue hablar sobre el futuro, sino números de producción. Las empresas ahora miden no solo la cantidad de usuarios del asistente, sino tiempo hasta el lanzamiento, velocidad de revisión, calidad de pruebas y costos de incidentes. Esencialmente, la IA comenzó a ser evaluada como una herramienta de ingeniería regular: si no mueve métricas de negocio, un factor de "wow" por sí solo no es suficiente.
- En Yandex, los desarrolladores que usan IA hacen commits aproximadamente 10% más, y en Go, Python y JavaScript hasta 20%; tareas técnicas individuales para agentes cayeron de 20 a 2 minutos.
- En T-Bank, el tiempo mediano de fusión se redujo en 12%, y para equipos "embajadores" el tiempo de entrega cayó 30% en un año; la generación de pruebas unitarias aumentó cuatro veces.
- En Ozon, alrededor de 1100 personas usan el asistente agente diariamente, aproximadamente un cuarto o un tercio de todo el desarrollo, y la revisión automática en GitLab resultó ser tan demandada que el lanzamiento tuvo que ser limitado.
- En Sber, el sistema de IA para diseñadores redujo la revisión de diseño de una hora a dos minutos, y la creación de una nueva pantalla de 16 horas a cinco minutos.
- En Yandex Go, la IA ya ayuda a procesar alrededor de 400 incidentes por día y ahorra aproximadamente 30 minutos en postmortem para cada caso.
También es importante que el espectro de tareas se está expandiendo rápidamente. Ya no se trata solo de generación de código, sino también de buscar conocimiento interno, listas de verificación automáticas, apoyar analistas, revisión de diseño y escenarios de SRE. Si hace un año la IA frecuentemente se veía como autocompletado inteligente, ahora están intentando incrustarla en todo el SDLC—desde la formulación de tareas hasta analizar consecuencias en producción.
Por qué la euforia es limitada
A pesar de casos sólidos, los oradores fueron bastante sobrios sobre las limitaciones. Avito dijo directamente que aún no ha visto una aceleración notable de todo el ciclo de desarrollo: como máximo 4–5% en equipos individuales. La razón es simple—escribir código es solo parte del tiempo de trabajo, y los cuellos de botella están en revisión, coordinación, pruebas y entrega de cambios.
Entonces la generación masiva de código por sí sola no resuelve el problema: puede simplemente mover el cuello de botella más adelante en el proceso. Otro punto de dolor es la calidad y el control. Los modelos pueden "atajar" con pruebas, falsificar llamadas de herramientas, producir diseño plantilla aburrido, o cometer errores en lenguajes de dominio internos.
En Yandex Go, por ejemplo, para escenarios de SRE eventualmente pasaron a prompts en inglés porque los resultados en ruso eran peores. Además, los agentes verdaderamente útiles necesitan una base cara: observabilidad, gráfico de dependencia de servicios, auditoría de cambios, catálogos de servicios y métricas de escenario adecuadas, no solo demostraciones bonitas.
"No habrá fin del mundo.
Habrá una evolución áspera, pero fascinante."
Es exactamente por eso que casi todas las presentaciones se redujeron a una idea: human-in-the-loop no desapareció. Ozon es cautelosa sobre modelos externos debido a riesgos de fuga de código. Sber tuvo que luchar por separado contra diseño conservador y alucinaciones. Yandex mide no solo beneficios sino efectos secundarios como soportar código generado. La IA aquí ya no es un juguete, pero tampoco es un empleado autónomo—más bien un acelerador que requiere buenas reglas, herramientas y validación constante.
Lo que esto significa
Después del AI Dev Day, es difícil decir que la IA corporativa para desarrollo es solo un experimento. El experimento terminó: ahora hay competencia sobre quién tiene mejor contexto, métricas, procesos e infraestructura. La IA no cancela a los desarrolladores, pero notablemente cambia el precio de la rutina, el rol de la revisión y las demandas sobre quienes pueden gestionar agentes, no solo escribir código manualmente.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.