AWS Machine Learning Blog→ original

AWS y Atos mostraron cómo la gamificación acelera la formación en AI para cientos de empleados

AWS explicó cómo Atos utilizó el programa AWS AI League para acelerar la formación en AI dentro de la empresa. En la liga de dos semanas participaron 409…

Procesado por IA desde AWS Machine Learning Blog; editado por Hamidun News
AWS y Atos mostraron cómo la gamificación acelera la formación en AI para cientos de empleados
Fuente: AWS Machine Learning Blog. Collage: Hamidun News.
◐ Escuchar artículo

AWS mostró un caso de estudio de Atos, que transformó la capacitación corporativa en IA en una liga competitiva en lugar de otro conjunto de cursos y certificados. En dos semanas, 409 participantes crearon más de 4.100 modelos fine-tuned y obtuvieron experiencia práctica que podría aplicarse inmediatamente en proyectos de clientes.

Cómo se estructuró la liga

Atos ya tenía una base sólida: más de 5.800 certificaciones AWS y 11 Golden Jackets dentro de la empresa. Pero esto resultó insuficiente para el objetivo de que toda la plantilla fuera alfabetizada en IA para 2026. Un problema familiar para muchas grandes organizaciones: los empleados completan la capacitación pero no siempre avanzan hacia aplicar modelos con confianza en el trabajo real. Por eso Atos y AWS eligieron el formato AWS AI League—no conferencias solo para cumplir, sino una serie de tareas prácticas con rankings, plazos y una final en formato de espectáculo en vivo.

  • Taller introductorio sobre fine-tuning en SageMaker JumpStart
  • Selección de Meta Llama 3.2 3B Instruct como modelo base
  • Preparación de un dataset JSONL para un escenario de seguros
  • Fine-tuning, despliegue y verificación de respuestas en SageMaker
  • Puntuación en la tabla de clasificación y selección para la final en vivo

Después del taller de apertura, comenzó una liga virtual de dos semanas. Los participantes ajustaron repetidamente datasets, learning rates, epochs, batch sizes y parámetros LoRA para subir en la tabla de resultados. En la ronda online, los modelos fueron evaluados por un LLM-as-a-Judge automatizado basado en Llama 3.2 90B. Los cinco mejores finalistas avanzaron a la final en vivo, donde la puntuación general se componía de tres partes: 40% del juez LLM, 40% de cinco expertos de Atos y 20% de la votación de la audiencia. Los finalistas tuvieron solo 90 segundos por tarea para ajustar el prompt del sistema y los parámetros de inferencia.

Caso de uso real de seguros

Para la tarea operativa, Atos eligió no un escenario de demostración abstracto, sino un asistente para suscripción de seguros—el Intelligent Insurance Underwriter. El modelo necesitaba analizar situaciones de seguros complejas, evaluar riesgos, sugerir términos de pólizas y franquicias, recomendar ajustes de primas y explicar su razonamiento. Este caso demuestra bien el valor del fine-tuning: la competencia lingüística general por sí sola no es suficiente si necesitas trabajar con confianza con terminología específica de la industria, excepciones y reglas de toma de decisiones. Aquí se trata no solo de generación de texto, sino de precisión aplicada dentro del dominio.

Técnicamente, los participantes trabajaron en Amazon SageMaker Studio y SageMaker JumpStart, donde la infraestructura fue ampliamente abstraída. Para el entrenamiento, ensamblaron datasets JSONL a partir de pares instruction/response, los subieron a Amazon S3 y ejecutaron fine-tuning sin profundizar en operaciones de ML. AWS señala específicamente que el tamaño del dataset por sí solo no garantizaba mejores resultados. Quienes tuvieron éxito fueron aquellos que limpiaron datos, aumentaron la diversidad de ejemplos y probaron sistemáticamente hiperparámetros en lugar de simplemente generar la mayor cantidad de registros posible. Dentro de la liga, se utilizaron herramientas separadas para la generación y mejora de datasets.

Una lección aparte surgió del problema de sobreajuste. Algunos modelos funcionaban bien en ejemplos familiares pero comenzaban a repetirse o daban respuestas irrelevantes a nuevas preguntas. Esto fue especialmente evidente al probar 87 preguntas no vistas de la tabla de clasificación. Por eso los participantes tuvieron que aprender no solo a ejecutar fine-tuning, sino a monitorear eval-loss, perplexity y el comportamiento del modelo durante inferencia para distinguir mejoras reales de ganancias cosméticas de métricas. Para la capacitación corporativa, este es un punto importante: las personas dominaron no solo botones de interfaz, sino la lógica de trabajar con modelos y calidad de resultados.

Por qué funcionó

El efecto principal vino no del taller en sí, sino de la mecánica competitiva alrededor de él. Después del lanzamiento de la liga, los participantes simultáneamente compartieron hallazgos en canales de trabajo, asistieron a office hours, mientras intentaban no revelar completamente sus estrategias a los competidores. Como resultado, Atos logró el más alto nivel de engagement entre sus programas gamificados: 409 personas en la tabla de clasificación y más de 4.100 modelos fine-tuned creados. Para entrar en el top 5, un modelo necesitaba mostrar al menos un 93% de win rate contra respuestas de un modelo mucho más grande. Esto transformó la capacitación de una actividad formal en una tarea de ingeniería con objetivos claros y progreso visible.

Las conclusiones empresariales para Atos también resultaron bastante prácticas. Según datos de AWS, un modelo fine-tuned de 3 mil millones de parámetros fue capaz de superar un modelo de 90 mil millones de parámetros en un dominio estrecho cuando tenía datos relevantes y ajuste apropiado. Para las empresas, esta es una señal importante: en sistemas agentic, no siempre necesitas el LLM de propósito general más grande.

Los modelos pequeños especializados son más baratos para ejecutar inferencia, responden más rápido y escalan más fácilmente. El artículo de AWS incluso proporciona un contraste de infraestructura: ml.g5.

4xlarge versus ml.g5.48xlarge para el modelo más grande.

Después del programa, el 85% de los participantes reportó sentirse más confiado en conversaciones con clientes sobre IA generativa, y todo el ciclo de capacitación tomó dos semanas en lugar de los meses que requeriría la capacitación tradicional.

Qué significa

El caso Atos muestra que la capacitación corporativa en IA se está desplazando de cursos pasivos hacia ciclos prácticos cortos con resultados medibles. Para empresas que quieren no solo capacitar a empleados en IA, sino llevarlos a implementaciones reales, un formato con un estudio de caso de la industria, una tabla de clasificación e iteración continua parece notavelmente más efectivo que la teoría estándar y las certificaciones únicas. Especialmente donde el negocio necesita no conocimiento general de GenAI, sino especialistas capaces de ensamblar rápidamente un asistente funcional específico del dominio.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…