AWS Machine Learning Blog→ original

AWS e Atos mostraram como a gamificação acelera o treinamento em AI para centenas de funcionários

A AWS explicou como a Atos usou o programa AWS AI League para acelerar o treinamento em AI dentro da empresa. A liga de duas semanas reuniu 409 pessoas, e as…

Processado por IA de AWS Machine Learning Blog; editado por Hamidun News
AWS e Atos mostraram como a gamificação acelera o treinamento em AI para centenas de funcionários
Fonte: AWS Machine Learning Blog. Colagem: Hamidun News.
◐ Ouvir artigo

A AWS apresentou um estudo de caso da Atos, que transformou o treinamento corporativo em IA em uma liga competitiva em vez de mais um conjunto de cursos e certificados. Em duas semanas, 409 participantes criaram mais de 4.100 modelos fine-tuned e ganharam experiência prática que poderia ser aplicada imediatamente em projetos de clientes.

Como a liga foi estruturada

A Atos já tinha uma base sólida: mais de 5.800 certificações AWS e 11 Golden Jackets dentro da empresa. Mas isso se mostrou insuficiente para o objetivo de tornar toda a equipe letrada em IA até 2026. Um problema familiar para muitas grandes organizações: funcionários completam o treinamento, mas nem sempre progridem para aplicar modelos com confiança no trabalho real. É por isso que Atos e AWS escolheram o formato AWS AI League—não aulas apenas para cumprir protocolos, mas uma série de tarefas práticas com rankings, prazos e uma final em formato de show ao vivo.

  • Workshop introdutório sobre fine-tuning no SageMaker JumpStart
  • Seleção do Meta Llama 3.2 3B Instruct como modelo base
  • Preparação de um dataset JSONL para um cenário de seguros
  • Fine-tuning, deployment e verificação de respostas no SageMaker
  • Pontuação no leaderboard e seleção para a final ao vivo

Após o workshop de abertura, começou uma liga virtual de duas semanas. Os participantes ajustaram repetidamente datasets, learning rates, epochs, batch sizes e parâmetros LoRA para subir na tabela de resultados. Na rodada online, os modelos foram avaliados por um LLM-as-a-Judge automatizado baseado em Llama 3.2 90B. Os cinco melhores finalistas avançaram para a final ao vivo, onde a pontuação geral consistia em três componentes: 40% do juiz LLM, 40% de cinco especialistas da Atos e 20% da votação do público. Os finalistas tiveram apenas 90 segundos por tarefa para ajustar o prompt do sistema e os parâmetros de inferência.

Caso de uso real em seguros

Para a tarefa operacional, Atos escolheu não um cenário de demonstração abstrato, mas um assistente para subscrição de seguros—o Intelligent Insurance Underwriter. O modelo precisava analisar situações de seguros complexas, avaliar riscos, sugerir termos de apólices e franquias, recomendar ajustes de prêmios e explicar seu raciocínio. Este caso demonstra bem o valor do fine-tuning: a proficiência linguística geral sozinha não é suficiente se você precisa trabalhar com confiança com terminologia específica da indústria, exceções e regras de tomada de decisão. Aqui, não é apenas sobre geração de texto, mas precisão aplicada dentro do domínio.

Tecnicamente, os participantes trabalharam no Amazon SageMaker Studio e SageMaker JumpStart, onde a infraestrutura foi largamente abstraída. Para treinamento, eles montaram datasets JSONL a partir de pares instruction/response, fizeram upload para Amazon S3 e executaram fine-tuning sem mergulhar profundamente em operações de ML. A AWS observa especificamente que o tamanho do dataset sozinho não garantia melhores resultados. Os que tiveram sucesso foram aqueles que limparam dados, aumentaram a diversidade de exemplos e testaram sistematicamente hiperparâmetros em vez de simplesmente gerar o máximo de registros possível. Dentro da liga, ferramentas separadas foram usadas para geração e melhoria de datasets.

Uma lição separada emergiu do problema de overfitting. Alguns modelos funcionaram bem em exemplos familiares, mas começaram a se repetir ou dar respostas irrelevantes para novas perguntas. Isso foi especialmente evidente quando testado em 87 questões não vistas do leaderboard. É por isso que os participantes tiveram que aprender não apenas a executar fine-tuning, mas a monitorar eval-loss, perplexity e o comportamento do modelo durante inferência para distinguir melhorias reais de ganhos cosméticos de métricas. Para treinamento corporativo, este é um ponto importante: as pessoas dominaram não apenas botões de interface, mas a lógica de trabalhar com modelos e qualidade de resultados.

Por que funcionou

O efeito principal veio não do workshop em si, mas da mecânica competitiva ao seu redor. Após o lançamento da liga, os participantes simultaneamente compartilhavam descobertas em canais de trabalho, participavam de office hours, enquanto tentavam não revelar completamente suas estratégias aos competidores. Como resultado, a Atos alcançou o mais alto nível de engajamento entre seus programas gamificados: 409 pessoas no leaderboard e mais de 4.100 modelos fine-tuned criados. Para entrar no top 5, um modelo precisava mostrar pelo menos 93% de win rate contra respostas de um modelo muito maior. Isso transformou o treinamento de uma atividade formal em uma tarefa de engenharia com objetivos claros e progresso visível.

As conclusões de negócios para a Atos também se mostraram bastante práticas. De acordo com dados da AWS, um modelo fine-tuned de 3 bilhões de parâmetros foi capaz de superar um modelo de 90 bilhões de parâmetros em um domínio estreito quando tinha dados relevantes e ajuste apropriado. Para empresas, este é um sinal importante: em sistemas agentic, você nem sempre precisa do maior LLM de propósito geral.

Modelos pequenos especializados são mais baratos para executar inferência, respondem mais rápido e escalam mais facilmente. O artigo da AWS até fornece um contraste de infraestrutura: ml.g5.

4xlarge versus ml.g5.48xlarge para o modelo maior.

Após o programa, 85% dos participantes relataram se sentir mais confiantes em conversas com clientes sobre IA generativa, e todo o ciclo de treinamento levou duas semanas em vez dos meses que o treinamento tradicional exigiria.

O que significa

O caso Atos mostra que o treinamento corporativo em IA está se deslocando de cursos passivos para ciclos práticos curtos com resultados mensuráveis. Para empresas que desejam não apenas treinar funcionários em IA, mas levá-los a implementações reais, um formato com um estudo de caso da indústria, um leaderboard e iteração contínua parece notavelmente mais eficaz do que teoria padrão e certificações únicas. Especialmente onde o negócio precisa não de conhecimento geral em GenAI, mas de especialistas capazes de montar rapidamente um assistente específico de domínio funcional.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…