Lyft redujo el desarrollo de agentes de IA de meses a semanas con LangGraph y LangSmith
Lyft desarrolló una plataforma de autoservicio de agentes de IA para soporte al cliente. Usando LangGraph y LangSmith, la empresa redujo el tiempo de desarrollo

Lyft creó una plataforma de autoservicio para desarrollar agentes de IA que ayudan con el soporte al cliente. Usando las herramientas LangGraph y LangSmith, la empresa redujo el tiempo de desarrollo de agentes de meses a semanas, haciendo que la innovación en IA sea accesible para todos los ingenieros, no solo para un grupo reducido de especialistas en machine learning.
El
Problema: El Desarrollo Era un Cuello de Botella Anteriormente, crear un único agente de IA para Lyft requería varios meses de trabajo de un equipo especializado. Se necesitaba un conocimiento profundo de machine learning, integración con los sistemas de Lyft, configuración de monitoreo y mejora continua. Esto hacía que el proceso fuera costoso y lento — una nueva idea, de la hipótesis a la producción, tomaba un trimestre o dos.
La empresa atiende millones de viajes al día, y el soporte al cliente es un volumen enorme de trabajo. Cada respuesta incorrecta del chatbot puede llevar a un cliente insatisfecho o carga adicional en el equipo de soporte. El equipo se dio cuenta de que si pudiera capacitar a los desarrolladores para crear y probar agentes de forma independiente, las ganancias en velocidad y calidad serían significativas.
Pero para eso, necesitaban las herramientas adecuadas para hacer que el desarrollo fuera intuitivo.
Solución:
LangGraph para la Lógica, LangSmith para la Visibilidad Lyft eligió LangGraph para orquestar la lógica de los agentes y LangSmith para monitoreo, depuración y pruebas. LangGraph permite describir el flujo de trabajo de un agente como un gráfico: los nodos son pasos individuales (buscar información en una base de datos, generar una respuesta, verificar la relevancia, escalar a un especialista), las aristas son transiciones condicionales entre ellos. Esto es más intuitivo para un ingeniero que un conjunto de callbacks y código asincrónico.
LangSmith añade visibilidad del proceso: registro de todos los pasos, métricas de calidad, pruebas A/B de prompts, seguimiento rápido de errores. El equipo puede ver inmediatamente dónde se confundió el agente, qué prompt no funcionó, y corregirlo sobre la marcha sin rediseño. Esto es crítico porque al trabajar con LLMs, los errores a menudo se esconden en los detalles de la formulación.
Características principales de la plataforma: Iteración rápida en prompts y lógica sin recarga del servicio El enfoque de grafos simplifica agregar nuevos pasos al flujo de trabajo El monitoreo integrado ahorra semanas de depuración y análisis de logs Plantillas listas para tareas comunes (búsqueda, ranking, enrutamiento) ## Resultado Práctico: Semanas en Lugar de Meses Después de implementar la plataforma, el tiempo desde una idea hasta un agente en producción cayó de 8–12 semanas a 1–2 semanas. Ahora un gerente de producto puede sugerir una idea, un ingeniero arma un flujo de trabajo en LangGraph en un día o dos, lo prueba en datos reales a través de LangSmith, mira las métricas, y el agente está listo para lanzarse. El trabajo cambió de ML profundo a diseño de lógica, lo cual es más accesible para la mayoría del equipo.
Lyft ya ha lanzado varios agentes en la plataforma: desde simples (respuestas automáticas a preguntas frecuentes) hasta complejos (sistemas de triage que deciden a qué especialista escalar, evalúan la prioridad, encuentran documentación relevante). Cada uno opera con menor latencia de respuesta y mejor precisión que los antiguos sistemas basados en reglas.
Lo
Que Esto Significa Las plataformas de IA se están convirtiendo en herramientas no solo para ingenieros de ML, sino para equipos de ingeniería completos. Cuando las herramientas son simples de aprender y los resultados son visibles de inmediato, la velocidad de adopción de IA en los negocios crece varias veces. Para empresas a la escala de Lyft, con millones de consultas al día, esto significa experimentación rápida con nuevas soluciones de IA, medición del impacto real y escalabilidad de las que funcionan.