Jiqizhixin (机器之心)→ original

ByteDance e Li Han: como fazer redes neurais trabalhar em vez de apenas tagarelarem

Passamos muito tempo tratando grandes modelos de linguagem como mecanismos de busca avançados ou companheiros de conversa divertidos. Enquanto OpenAI e…

Processado por IA de Jiqizhixin (机器之心); editado por Hamidun News
ByteDance e Li Han: como fazer redes neurais trabalhar em vez de apenas tagarelarem
Fonte: Jiqizhixin (机器之心). Colagem: Hamidun News.
◐ Ouvir artigo

Passamos muito tempo tratando grandes modelos de linguagem como mecanismos de busca avançados ou companheiros de conversa divertidos. Enquanto OpenAI e Google competem no número de parâmetros, ByteDance decidiu que chegou a hora de passar de palavras para ações. Dr. Li Han, cujo nome no processamento de linguagem natural pesa aproximadamente o mesmo que toda a infraestrutura de servidores de uma startup de médio porte, publicou um trabalho sobre a criação de um framework universal para agentes de IA. Em resumo: a era dos "apenas chatbots" está oficialmente chegando ao fim.

Você precisa entender o contexto. Li Han não é apenas outro pesquisador. Seu caminho pela Microsoft Research Asia e Huawei até liderar o laboratório de IA da ByteDance mostra que ele se importa com poder prático, não com beleza teórica. As tentativas atuais de criar agentes como AutoGPT ou BabyAGI muitas vezes se assemelham à montagem de um avião com palitos e fita adesiva: eles quebram no segundo passo e alucinam em ciclos infinitos. Li Han propõe uma abordagem sistemática projetada para transformar esses "brinquedos" em ferramentas industriais confiáveis.

O que exatamente mudou na abordagem? O framework universal proposto se concentra em quatro nós críticos: percepção, planejamento, memória e ação. O principal problema com os modelos atuais é que eles não conseguem planejar com antecedência. Eles vivem o momento, gerando o próximo token. Li Han propõe uma arquitetura onde o modelo primeiro constrói uma árvore hierárquica de objetivos e depois usa ferramentas externas para alcançá-los, consultando constantemente a memória de longo prazo. Isso transforma a IA de um estudante de filologia em um gerente de projetos experiente.

Por que isso é criticamente importante agora? Atingimos o limite de utilidade dos chatbots comuns. Para a IA trazer dinheiro real ao setor B2B, ela deve ser capaz de acessar independentemente um CRM, analisar dados, compilar um relatório e enviá-lo ao cliente sem pedir permissão a cada passo. ByteDance, com seus volumes colossais de dados e algoritmos de recomendação extremamente complexos, precisa de tais sistemas autônomos mais do que qualquer um. Se este framework for implementado com sucesso, veremos uma onda de automação que tornará os atuais sistemas RPA parecerem calculadoras.

Analisando o trabalho de Li Han, você entende que a China, através da ByteDance, está apostando em estrutura. Enquanto as empresas ocidentais frequentemente confiam em poder computacional bruto, aqui vemos uma tentativa de criar uma arquitetura de engenharia elegante e escalável. Este é um desafio direto a projetos como o Microsoft AutoGen. A única questão é quem será o primeiro a mover essas conclusões de PDFs acadêmicos para a produção real. Pelo ritmo de ByteDance, não teremos que esperar muito.

A questão-chave: A arquitetura de Li Han se tornará um padrão global ou permanecerá uma ferramenta interna de ByteDance? Se for a primeira opção, podemos esperar um boom em verdadeiros funcionários digitais já no próximo ano.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…