Wired→ original

Criador do AlphaGo fundou empresa unicórnio para construir super-aprendizes de IA

David Silver, o cientista cujo sistema AlphaGo foi o primeiro a derrotar um campeão mundial de go em 2016, fundou uma nova empresa avaliada em um bilhão de…

Processado por IA de Wired; editado por Hamidun News
Criador do AlphaGo fundou empresa unicórnio para construir super-aprendizes de IA
Fonte: Wired. Colagem: Hamidun News.
◐ Ouvir artigo

David Silver, o cientista que criou o algoritmo AlphaGo que em 2016 se tornou o primeiro na história a derrotar o campeão mundial de Go, anunciou a fundação de uma nova empresa avaliada em aproximadamente um bilhão de dólares. Seu objetivo é construir o que Silver chama de super-aprendizes: sistemas de IA capazes de dominar independentemente domínios complexos do conhecimento sem depender de conjuntos de dados criados por humanos. Este é um desafio direto ao paradigma dominante da indústria, em que todos os principais players apostam em escalar modelos de linguagem.

Silver é um dos principais arquitetos da IA moderna, e sua biografia fala por si. Seu trabalho no Google DeepMind levou ao AlphaGo e, posteriormente, ao AlphaZero—um algoritmo que do zero dominou xadrez, xogui e Go, nunca tendo visto uma única partida humana. Em vez de aprender com exemplos prontos, o sistema gerava e analisava independentemente milhões de posições, descobrindo estratégias que jogadores profissionais descreviam como não-humanas.

É esta experiência que molda sua convicção sobre o que a IA de próxima geração deve ser.

A ideia central de Silver é ao mesmo tempo simples e radical: grandes modelos de linguagem—ChatGPT, Claude, Gemini e outros—são fundamentalmente limitados por aprender exclusivamente de textos e dados produzidos por humanos. Isto cria um teto intransponível: IA não pode superar as capacidades cognitivas de seus criadores se se alimenta apenas de seu conhecimento e suas concepções errôneas. Simplesmente aumentar o número de parâmetros e o volume de dados de treinamento, segundo ele, não resolve este problema fundamental—apenas o escala.

A alternativa é o aprendizado por reforço (reinforcement learning, RL). Diferentemente do aprendizado supervisionado, onde um modelo aprende a reproduzir respostas corretas de um conjunto de dados pré-rotulado, o RL permite que um agente explore independentemente o espaço de possibilidades: tente ações, receba sinais de recompensa e construa gradualmente uma estratégia. Isto é precisamente como o AlphaGo funcionava—e esta abordagem, está convencido Silver, abre o caminho para uma IA que supera humanos em um amplo espectro de tarefas, não apenas em jogos pré-acordados.

Esta posição tem argumentos sérios em seu favor. OpenAI está parcialmente se movendo nesta direção com seus modelos de raciocínio da série o, que usam elementos de RL para auto-verificação de respostas. Google DeepMind continua a pesquisa fundamental nesta área.

Não obstante, a maior parte dos recursos da indústria permanece concentrada em escalar modelos de linguagem, e é precisamente contra este mainstream que Silver assume uma posição abertamente contrária. A principal dificuldade com RL está além de tarefas estreitas e claramente definidas. Para xadrez, é simples definir a função de recompensa: ganhe e receba um bônus.

Para escrever texto convincente, tomar uma decisão de negócios bem ponderada ou conduzir pesquisa científica original, a função de recompensa não é óbvia. É precisamente este problema da inteligência inexprimível que a nova empresa deve resolver. A avaliação de um bilhão de dólares sem um único produto no mercado fala sobre o peso da reputação do fundador.

No clima de investimento atual, quando cada startup de IA reivindica significância histórica, o nome do criador do AlphaGo é simultaneamente uma prova de conceito pronta e seguro para investidores não dispostos a esperar anos.

Se Silver estiver correto, a próxima fase da corrida de IA terá um aspecto fundamentalmente diferente: menos dados humanos, mais auto-aprendizado autônomo, menos imitação—mais descoberta. Sistemas capazes de formar conhecimento independentemente além do que a humanidade conhece—é assim que ele vê seus super-aprendizes. Se a ideia se materializará em um produto real, o tempo dirá. Mas o fato de que um dos principais arquitetos da IA moderna está fazendo uma aposta pública contra o paradigma dominante é em si um sinal significativo para toda a indústria.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…