Jiqizhixin (机器之心)→ original

Yao Shunyü na Tencent: por que a estrela principal da pesquisa em IA começou do básico

Imagine o melhor atacante do mundo mudando para um novo clube e no primeiro jogo, em vez de simplesmente marcar gols, começa a reescrever o livro de táticas…

Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
Yao Shunyü na Tencent: por que a estrela principal da pesquisa em IA começou do básico
Fonte: Jiqizhixin (机器之心). Colagem: Hamidun News.
◐ Ouvir artigo

Imagine o melhor atacante do mundo mudando para um novo clube e no primeiro jogo, em vez de simplesmente marcar gols, começa a reescrever o livro de táticas. Algo assim é o que parece ser o primeiro artigo científico de Yao Shunyu sob os auspícios da Tencent. Para quem perdeu: Yao é uma figura lendária em círculos restritos de pesquisadores.

Ele é o responsável por nos dar ReAct (Reason + Act) e Tree of Thoughts, ensinando as redes neurais não apenas a produzir texto, mas a planejar suas ações e raciocinar. Sua recente mudança de Princeton para a divisão de pesquisa da Tencent causou um efeito de bomba na indústria. E agora estamos vendo os primeiros frutos dessa união.

Em vez de anunciar imediatamente um assassino do GPT-5, Yao e sua equipe decidiram olhar sob o capô de um dos fenômenos mais misteriosos do mundo dos grandes modelos de linguagem — o aprendizado em contexto (In-Context Learning, ICL). Se você já deu a uma rede neural um par de exemplos em um prompt e ela magicamente compreendeu a tarefa, você encontrou ICL. É a capacidade do modelo de aprender sem alterar seus pesos, durante o próprio processo de diálogo.

Até agora, esse processo parecia alquimia: sabíamos que funcionava, mas não entendíamos completamente como o modelo estruturava esse conhecimento internamente. O trabalho de Yao tenta transformar essa alquimia em uma ciência rigorosa. Por que a Tencent investiu suas mentes mais brilhantes nessa direção agora?

A resposta está no estado atual do mercado. A era em que se poderia simplesmente enterrar um modelo em dados e placas gráficas está chegando ao fim. Estamos entrando na segunda metade do jogo, onde a vitória irá para aquele que tornar os modelos mais inteligentes e eficientes no nível da arquitetura.

O aprendizado em contexto é a chave para criar agentes verdadeiramente autônomos. Se o modelo compreende melhor o contexto, comete menos erros em cadeias complexas de raciocínio e requer menos recursos computacionais para se adaptar às necessidades específicas dos negócios. A Tencent claramente está apostando na qualidade do raciocínio, não na quantidade de parâmetros.

Em seu trabalho, os pesquisadores analisam exatamente como as distribuições dos dados de entrada influenciam a capacidade de generalização do modelo. Isso não é apenas uma investigação teórica. Compreender a mecânica do ICL permite criar sistemas mais estáveis que não quebrem por uma única palavra mal escolhida em uma instrução.

Diante da feroz concorrência com Alibaba e DeepSeek, é vital para a Tencent ter uma vantagem tecnológica que não possa ser simplesmente copiada comprando mais dez mil chips H100. Eles precisam de avanços algorítmicos, e Yao Shunyu é exatamente a pessoa que pode entregá-los. É interessante também como esse trabalho se encaixa na estratégia mais ampla dos gigantes tecnológicos chineses.

Vemos uma mudança clara de copiar arquiteturas ocidentais para tentar liderar a pesquisa fundamental. Se antes as empresas chinesas frequentemente desempenhavam o papel de seguidoras, agora estão contratando os melhores cientistas direto dos bancos das principais universidades americanas e dando-lhes carta branca para pesquisa profunda. Isso cria uma nova dinâmica na indústria, onde as fronteiras entre a ciência acadêmica e o desenvolvimento corporativo finalmente se apagam.

Resumindo: a Tencent está investindo na fundação, não na fachada. Se Yao Shunyu desvendar a mecânica do aprendizado em contexto, a próxima iteração de seus modelos pode deixar os concorrentes bem para trás pela eficiência, não pela força bruta. O entendimento de ICL pode se tornar a alavanca que irá mudar nossa compreensão das possibilidades das arquiteturas atuais?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…