KDnuggets→ original

Bindu Reddy e o caminho para AGI: por que apenas um modelo 'mais inteligente' não é suficiente

Enquanto o Vale do Silício compete para prometer alto o advento da inteligência artificial geral (AGI) para o próximo terça-feira, Bindu Reddy sugere…

Processado por IA de KDnuggets; editado por Hamidun News
Bindu Reddy e o caminho para AGI: por que apenas um modelo 'mais inteligente' não é suficiente
Fonte: KDnuggets. Colagem: Hamidun News.
◐ Ouvir artigo

Enquanto o Vale do Silício compete para prometer alto o advento da inteligência artificial geral (AGI) para o próximo terça-feira, Bindu Reddy sugere respirar fundo. A chefe da Abacus.AI vê a indústria não através dos óculos cor-de-rosa do investimento de capital de risco, mas pela realidade áspera de implantar redes neurais em negócios reais. E seu diagnóstico soa bem esclarecedor: ainda estamos em um estágio onde o "melhor modelo" é um conceito que existe exatamente até o próximo grande lançamento do concorrente. Antes era simples — havia GPT-4 e todos os outros. Agora estamos presenciando uma fragmentação, onde a liderança em codificação, escrita criativa ou raciocínio lógico muda constantemente de mãos.

Reddy enfatiza que o caminho para a AGI não é simplesmente uma questão de aumentar o número de parâmetros ou comprar novos cartões H100. O problema está na arquitetura. Os modelos de linguagem grandes atuais permanecem papagaios estatísticos incrivelmente avançados. Eles predizem o próximo token, mas carecem do que Bindu chama de "agência" — a capacidade de planejar independentemente cadeias complexas de ações e ajustá-las dinamicamente sem orientação humana. O verdadeiro avanço para a AGI ocorrerá não quando um modelo ler a internet inteira, mas quando aprender a raciocinar em tempo real, usando verificação interna de fatos antes de dar uma resposta.

Ao examinar o cenário atual, vemos uma imagem interessante. OpenAI com seu GPT-4o mantém o título de produto mais equilibrado, mas Anthropic com seu modelo Claude 3.5 Sonnet de repente se tornou o favorito entre desenvolvedores e aqueles que valorizam o estilo de escrita "humano" e precisão em código. Enquanto isso, Meta com seu Llama 3.1 provou que modelos abertos podem competir com os gigantes proprietários. Reddy acredita que para um CTO moderno ou líder de produto, ter fé em um único modelo é um erro estratégico. O futuro está na orquestração, onde uma camada de software especializada (router) decide qual solicitação enviar para Claude e qual para um modelo menor, mais barato e rápido.

É interessante como Bindu conecta o desenvolvimento da AGI com viabilidade econômica. O treinamento de modelos está se tornando exponencialmente mais caro, e as melhorias de qualidade estão começando a desacelerar. Estamos nos aproximando de um limite onde simplesmente "mais dados" não fornece mais um salto mágico em inteligência. Para superar essa barreira, a indústria terá que reinventar os métodos de treinamento, possivelmente se afastando do aprendizado supervisionado puro em direção a métodos que se assemelham à forma como os humanos aprendem — através de tentativa, erro e compreensão de relações de causa e efeito. Sem isso, AGI permanecerá apenas um belo termo de marketing para atrair rodadas de financiamento.

O que isso significa para nós? Enquanto os engenheiros lutam para criar um deus digital, devemos aprender a malabarear o que temos. Reddy tem confiança de que nos próximos anos, os vencedores não serão aqueles que criam a maior rede neural, mas aqueles que criam a melhor infraestrutura para usar esse "zoológico" de modelos. A verdadeira inteligência não é apenas um volume de conhecimento, mas a capacidade de aplicar a ferramenta certa no momento certo. E até que os modelos aprendam a fazer isso sozinhos, esse trabalho permanece conosco.

A conclusão principal: AGI não será um evento único ou um "flash". É uma transição suave, e agora estamos presos em um estágio onde os modelos são inteligentes, mas ainda não são independentes. Anthropic e OpenAI continuarão a corrida armamentista, mas o poder real está se movendo para a flexibilidade e a capacidade de combinar diferentes modelos em um único produto.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…