Criador do AlphaGo fundou empresa unicórnio para construir super-aprendizes de IA
David Silver, o cientista cujo sistema AlphaGo foi o primeiro a derrotar um campeão mundial de go em 2016, fundou uma nova empresa avaliada em um bilhão de…
Processado por IA de Wired; editado por Hamidun News
David Silver, o cientista que criou o algoritmo AlphaGo que em 2016 se tornou o primeiro na história a derrotar o campeão mundial de Go, anunciou a fundação de uma nova empresa avaliada em aproximadamente um bilhão de dólares. Seu objetivo é construir o que Silver chama de super-aprendizes: sistemas de IA capazes de dominar independentemente domínios complexos do conhecimento sem depender de conjuntos de dados criados por humanos. Este é um desafio direto ao paradigma dominante da indústria, em que todos os principais players apostam em escalar modelos de linguagem.
Silver é um dos principais arquitetos da IA moderna, e sua biografia fala por si. Seu trabalho no Google DeepMind levou ao AlphaGo e, posteriormente, ao AlphaZero—um algoritmo que do zero dominou xadrez, xogui e Go, nunca tendo visto uma única partida humana. Em vez de aprender com exemplos prontos, o sistema gerava e analisava independentemente milhões de posições, descobrindo estratégias que jogadores profissionais descreviam como não-humanas.
É esta experiência que molda sua convicção sobre o que a IA de próxima geração deve ser.
A ideia central de Silver é ao mesmo tempo simples e radical: grandes modelos de linguagem—ChatGPT, Claude, Gemini e outros—são fundamentalmente limitados por aprender exclusivamente de textos e dados produzidos por humanos. Isto cria um teto intransponível: IA não pode superar as capacidades cognitivas de seus criadores se se alimenta apenas de seu conhecimento e suas concepções errôneas. Simplesmente aumentar o número de parâmetros e o volume de dados de treinamento, segundo ele, não resolve este problema fundamental—apenas o escala.
A alternativa é o aprendizado por reforço (reinforcement learning, RL). Diferentemente do aprendizado supervisionado, onde um modelo aprende a reproduzir respostas corretas de um conjunto de dados pré-rotulado, o RL permite que um agente explore independentemente o espaço de possibilidades: tente ações, receba sinais de recompensa e construa gradualmente uma estratégia. Isto é precisamente como o AlphaGo funcionava—e esta abordagem, está convencido Silver, abre o caminho para uma IA que supera humanos em um amplo espectro de tarefas, não apenas em jogos pré-acordados.
Esta posição tem argumentos sérios em seu favor. OpenAI está parcialmente se movendo nesta direção com seus modelos de raciocínio da série o, que usam elementos de RL para auto-verificação de respostas. Google DeepMind continua a pesquisa fundamental nesta área.
Não obstante, a maior parte dos recursos da indústria permanece concentrada em escalar modelos de linguagem, e é precisamente contra este mainstream que Silver assume uma posição abertamente contrária. A principal dificuldade com RL está além de tarefas estreitas e claramente definidas. Para xadrez, é simples definir a função de recompensa: ganhe e receba um bônus.
Para escrever texto convincente, tomar uma decisão de negócios bem ponderada ou conduzir pesquisa científica original, a função de recompensa não é óbvia. É precisamente este problema da inteligência inexprimível que a nova empresa deve resolver. A avaliação de um bilhão de dólares sem um único produto no mercado fala sobre o peso da reputação do fundador.
No clima de investimento atual, quando cada startup de IA reivindica significância histórica, o nome do criador do AlphaGo é simultaneamente uma prova de conceito pronta e seguro para investidores não dispostos a esperar anos.
Se Silver estiver correto, a próxima fase da corrida de IA terá um aspecto fundamentalmente diferente: menos dados humanos, mais auto-aprendizado autônomo, menos imitação—mais descoberta. Sistemas capazes de formar conhecimento independentemente além do que a humanidade conhece—é assim que ele vê seus super-aprendizes. Se a ideia se materializará em um produto real, o tempo dirá. Mas o fato de que um dos principais arquitetos da IA moderna está fazendo uma aposta pública contra o paradigma dominante é em si um sinal significativo para toda a indústria.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.