Yao Shunyü na Tencent: por que a estrela principal da pesquisa em IA começou do básico
Imagine o melhor atacante do mundo mudando para um novo clube e no primeiro jogo, em vez de simplesmente marcar gols, começa a reescrever o livro de táticas…
Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
Imagine o melhor atacante do mundo mudando para um novo clube e no primeiro jogo, em vez de simplesmente marcar gols, começa a reescrever o livro de táticas. Algo assim é o que parece ser o primeiro artigo científico de Yao Shunyu sob os auspícios da Tencent. Para quem perdeu: Yao é uma figura lendária em círculos restritos de pesquisadores.
Ele é o responsável por nos dar ReAct (Reason + Act) e Tree of Thoughts, ensinando as redes neurais não apenas a produzir texto, mas a planejar suas ações e raciocinar. Sua recente mudança de Princeton para a divisão de pesquisa da Tencent causou um efeito de bomba na indústria. E agora estamos vendo os primeiros frutos dessa união.
Em vez de anunciar imediatamente um assassino do GPT-5, Yao e sua equipe decidiram olhar sob o capô de um dos fenômenos mais misteriosos do mundo dos grandes modelos de linguagem — o aprendizado em contexto (In-Context Learning, ICL). Se você já deu a uma rede neural um par de exemplos em um prompt e ela magicamente compreendeu a tarefa, você encontrou ICL. É a capacidade do modelo de aprender sem alterar seus pesos, durante o próprio processo de diálogo.
Até agora, esse processo parecia alquimia: sabíamos que funcionava, mas não entendíamos completamente como o modelo estruturava esse conhecimento internamente. O trabalho de Yao tenta transformar essa alquimia em uma ciência rigorosa. Por que a Tencent investiu suas mentes mais brilhantes nessa direção agora?
A resposta está no estado atual do mercado. A era em que se poderia simplesmente enterrar um modelo em dados e placas gráficas está chegando ao fim. Estamos entrando na segunda metade do jogo, onde a vitória irá para aquele que tornar os modelos mais inteligentes e eficientes no nível da arquitetura.
O aprendizado em contexto é a chave para criar agentes verdadeiramente autônomos. Se o modelo compreende melhor o contexto, comete menos erros em cadeias complexas de raciocínio e requer menos recursos computacionais para se adaptar às necessidades específicas dos negócios. A Tencent claramente está apostando na qualidade do raciocínio, não na quantidade de parâmetros.
Em seu trabalho, os pesquisadores analisam exatamente como as distribuições dos dados de entrada influenciam a capacidade de generalização do modelo. Isso não é apenas uma investigação teórica. Compreender a mecânica do ICL permite criar sistemas mais estáveis que não quebrem por uma única palavra mal escolhida em uma instrução.
Diante da feroz concorrência com Alibaba e DeepSeek, é vital para a Tencent ter uma vantagem tecnológica que não possa ser simplesmente copiada comprando mais dez mil chips H100. Eles precisam de avanços algorítmicos, e Yao Shunyu é exatamente a pessoa que pode entregá-los. É interessante também como esse trabalho se encaixa na estratégia mais ampla dos gigantes tecnológicos chineses.
Vemos uma mudança clara de copiar arquiteturas ocidentais para tentar liderar a pesquisa fundamental. Se antes as empresas chinesas frequentemente desempenhavam o papel de seguidoras, agora estão contratando os melhores cientistas direto dos bancos das principais universidades americanas e dando-lhes carta branca para pesquisa profunda. Isso cria uma nova dinâmica na indústria, onde as fronteiras entre a ciência acadêmica e o desenvolvimento corporativo finalmente se apagam.
Resumindo: a Tencent está investindo na fundação, não na fachada. Se Yao Shunyu desvendar a mecânica do aprendizado em contexto, a próxima iteração de seus modelos pode deixar os concorrentes bem para trás pela eficiência, não pela força bruta. O entendimento de ICL pode se tornar a alavanca que irá mudar nossa compreensão das possibilidades das arquiteturas atuais?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.