AWS e Atos mostraram como a gamificação acelera o treinamento em AI para centenas de funcionários
A AWS explicou como a Atos usou o programa AWS AI League para acelerar o treinamento em AI dentro da empresa. A liga de duas semanas reuniu 409 pessoas, e as…
Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
A AWS apresentou um estudo de caso da Atos, que transformou o treinamento corporativo em IA em uma liga competitiva em vez de mais um conjunto de cursos e certificados. Em duas semanas, 409 participantes criaram mais de 4.100 modelos fine-tuned e ganharam experiência prática que poderia ser aplicada imediatamente em projetos de clientes.
Como a liga foi estruturada
A Atos já tinha uma base sólida: mais de 5.800 certificações AWS e 11 Golden Jackets dentro da empresa. Mas isso se mostrou insuficiente para o objetivo de tornar toda a equipe letrada em IA até 2026. Um problema familiar para muitas grandes organizações: funcionários completam o treinamento, mas nem sempre progridem para aplicar modelos com confiança no trabalho real. É por isso que Atos e AWS escolheram o formato AWS AI League—não aulas apenas para cumprir protocolos, mas uma série de tarefas práticas com rankings, prazos e uma final em formato de show ao vivo.
- Workshop introdutório sobre fine-tuning no SageMaker JumpStart
- Seleção do Meta Llama 3.2 3B Instruct como modelo base
- Preparação de um dataset JSONL para um cenário de seguros
- Fine-tuning, deployment e verificação de respostas no SageMaker
- Pontuação no leaderboard e seleção para a final ao vivo
Após o workshop de abertura, começou uma liga virtual de duas semanas. Os participantes ajustaram repetidamente datasets, learning rates, epochs, batch sizes e parâmetros LoRA para subir na tabela de resultados. Na rodada online, os modelos foram avaliados por um LLM-as-a-Judge automatizado baseado em Llama 3.2 90B. Os cinco melhores finalistas avançaram para a final ao vivo, onde a pontuação geral consistia em três componentes: 40% do juiz LLM, 40% de cinco especialistas da Atos e 20% da votação do público. Os finalistas tiveram apenas 90 segundos por tarefa para ajustar o prompt do sistema e os parâmetros de inferência.
Caso de uso real em seguros
Para a tarefa operacional, Atos escolheu não um cenário de demonstração abstrato, mas um assistente para subscrição de seguros—o Intelligent Insurance Underwriter. O modelo precisava analisar situações de seguros complexas, avaliar riscos, sugerir termos de apólices e franquias, recomendar ajustes de prêmios e explicar seu raciocínio. Este caso demonstra bem o valor do fine-tuning: a proficiência linguística geral sozinha não é suficiente se você precisa trabalhar com confiança com terminologia específica da indústria, exceções e regras de tomada de decisão. Aqui, não é apenas sobre geração de texto, mas precisão aplicada dentro do domínio.
Tecnicamente, os participantes trabalharam no Amazon SageMaker Studio e SageMaker JumpStart, onde a infraestrutura foi largamente abstraída. Para treinamento, eles montaram datasets JSONL a partir de pares instruction/response, fizeram upload para Amazon S3 e executaram fine-tuning sem mergulhar profundamente em operações de ML. A AWS observa especificamente que o tamanho do dataset sozinho não garantia melhores resultados. Os que tiveram sucesso foram aqueles que limparam dados, aumentaram a diversidade de exemplos e testaram sistematicamente hiperparâmetros em vez de simplesmente gerar o máximo de registros possível. Dentro da liga, ferramentas separadas foram usadas para geração e melhoria de datasets.
Uma lição separada emergiu do problema de overfitting. Alguns modelos funcionaram bem em exemplos familiares, mas começaram a se repetir ou dar respostas irrelevantes para novas perguntas. Isso foi especialmente evidente quando testado em 87 questões não vistas do leaderboard. É por isso que os participantes tiveram que aprender não apenas a executar fine-tuning, mas a monitorar eval-loss, perplexity e o comportamento do modelo durante inferência para distinguir melhorias reais de ganhos cosméticos de métricas. Para treinamento corporativo, este é um ponto importante: as pessoas dominaram não apenas botões de interface, mas a lógica de trabalhar com modelos e qualidade de resultados.
Por que funcionou
O efeito principal veio não do workshop em si, mas da mecânica competitiva ao seu redor. Após o lançamento da liga, os participantes simultaneamente compartilhavam descobertas em canais de trabalho, participavam de office hours, enquanto tentavam não revelar completamente suas estratégias aos competidores. Como resultado, a Atos alcançou o mais alto nível de engajamento entre seus programas gamificados: 409 pessoas no leaderboard e mais de 4.100 modelos fine-tuned criados. Para entrar no top 5, um modelo precisava mostrar pelo menos 93% de win rate contra respostas de um modelo muito maior. Isso transformou o treinamento de uma atividade formal em uma tarefa de engenharia com objetivos claros e progresso visível.
As conclusões de negócios para a Atos também se mostraram bastante práticas. De acordo com dados da AWS, um modelo fine-tuned de 3 bilhões de parâmetros foi capaz de superar um modelo de 90 bilhões de parâmetros em um domínio estreito quando tinha dados relevantes e ajuste apropriado. Para empresas, este é um sinal importante: em sistemas agentic, você nem sempre precisa do maior LLM de propósito geral.
Modelos pequenos especializados são mais baratos para executar inferência, respondem mais rápido e escalam mais facilmente. O artigo da AWS até fornece um contraste de infraestrutura: ml.g5.
4xlarge versus ml.g5.48xlarge para o modelo maior.
Após o programa, 85% dos participantes relataram se sentir mais confiantes em conversas com clientes sobre IA generativa, e todo o ciclo de treinamento levou duas semanas em vez dos meses que o treinamento tradicional exigiria.
O que significa
O caso Atos mostra que o treinamento corporativo em IA está se deslocando de cursos passivos para ciclos práticos curtos com resultados mensuráveis. Para empresas que desejam não apenas treinar funcionários em IA, mas levá-los a implementações reais, um formato com um estudo de caso da indústria, um leaderboard e iteração contínua parece notavelmente mais eficaz do que teoria padrão e certificações únicas. Especialmente onde o negócio precisa não de conhecimento geral em GenAI, mas de especialistas capazes de montar rapidamente um assistente específico de domínio funcional.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.