MIT Technology Review→ original

A OpenAI está direcionando seus principais recursos para criar um pesquisador de AI totalmente autônomo

A OpenAI está mudando suas prioridades e apostando em um pesquisador de AI totalmente autônomo. A primeira etapa é um “estagiário de AI” até setembro de…

Processado por IA de MIT Technology Review; editado por Hamidun News
A OpenAI está direcionando seus principais recursos para criar um pesquisador de AI totalmente autônomo
Fonte: MIT Technology Review. Colagem: Hamidun News.
◐ Ouvir artigo

A OpenAI está mudando o foco de pesquisa e fazendo sua principal aposta não em outro chatbot, mas em um pesquisador autônomo de IA. A empresa quer desenvolver um sistema que possa trabalhar em problemas complexos por semanas com intervenção humana mínima e eventualmente se transforme em um verdadeiro 'laboratório em um data center.'

Novo Prioritário

Segundo Jacob Pachocki, Diretor Científico Chefe da OpenAI, o projeto está se tornando um objetivo compartilhado por toda a empresa, em torno do qual modelos de raciocínio, sistemas de agentes e ferramentas de interpretabilidade devem convergir. O próximo marco é demonstrar um 'assistente de IA autônomo' até setembro de 2026: um sistema que pode ser atribuído um conjunto limitado de tarefas de pesquisa por vários dias de trabalho. A próxima fase está planejada para 2028: um sistema multiagente totalmente automatizado capaz de enfrentar problemas muito grandes ou complexos para uma única equipe de pessoas.

Para a OpenAI, isto não é simplesmente uma direção elegante de pesquisa. A empresa não é mais a única que define o ritmo do mercado como era nos primeiros dias do GPT, e agora compete com Anthropic e Google DeepMind não apenas na qualidade do modelo, mas também no que a pilha de produtos em torno deles se torna.

A aposta em um pesquisador de IA parece ser uma tentativa de ir além de um assistente de bate-papo e codificação e criar a próxima camada de automação: um sistema que não apenas responde a consultas, mas realiza trabalho estendido da formulação do problema aos resultados intermediários.

"Essencialmente, você terá um laboratório de pesquisa inteiro dentro de um data center," diz

Pachocki.

O Que Já Está Pronto

A OpenAI acredita que um protótipo inicial dessa abordagem já é visível em Codex. Esta ferramenta de agente pode escrever e executar código, analisar documentos, criar visualizações, compilar resumos e lidar com longas cadeias técnicas que os humanos tinham que trabalhar manualmente antes.

Pachocki afirma explicitamente que a empresa quer levar o que já obteve sucesso na programação e transferir esse modo de operação para uma classe mais ampla de problemas. A lógica é simples: se um agente pode lidar independentemente com porções substanciais de trabalho de engenharia, a mesma abordagem pode ser estendida à ciência e pesquisa aplicada.

OpenAI espera que o sistema futuro tenha não uma única função 'mágica', mas um conjunto de habilidades de pesquisa que podem ser encadeadas:

  • Analisar grandes volumes de texto, código e anotações
  • Propor hipóteses e abordagens de verificação
  • Dividir grandes problemas em subtarefas e gerenciá-las em paralelo
  • Encontrar soluções em matemática, física, biologia, química e cenários de política governamental

De acordo com a OpenAI, a base técnica consiste em duas direções. Primeiro, modelos de propósito geral se tornaram melhores em manter o foco e o contexto por períodos mais longos: a transição de GPT-3 para GPT-4 já demonstrou crescimento notável em 'resistência' em uma única tarefa.

Em segundo lugar, modelos de raciocínio que funcionam através de problemas passo a passo e podem voltar atrás após um erro são mais adequados para ciclos autônomos longos. Além disso, os modelos são especialmente treinados em tarefas matemáticas e de codificação complexas para aprender como manter contexto estendido e gerenciar múltiplas subtarefas simultaneamente.

Onde Estão as Fraquezas

A pergunta mais óbvia não é ambição, mas confiabilidade. Pesquisadores independentes reconhecem que a ideia de um cientista autônomo de IA é uma continuação lógica do sucesso dos agentes de programação, mas advertem: uma vez que um sistema deve executar não apenas um passo, mas uma longa cadeia de ações, a probabilidade de erro em cada estágio começa a se acumular.

Em testes do Allen Institute for AI, modelos fortes já demonstraram bom desempenho em tarefas científicas, mas ainda cometiam erros regulares. Mesmo que versões mais novas tenham melhorado, o problema não desaparece: propor uma ideia forte é uma coisa; levar consistentemente uma investigação de vários dias a uma conclusão correta é outra.

Há também uma camada mais difícil de riscos. Pachocki diz que OpenAI está apostando no monitoramento de cadeia de pensamento: o modelo deixa uma espécie de notas de trabalho conforme resolve, enquanto outros modelos ou pesquisadores observam para garantir que não se desvie para comportamento perigoso ou simplesmente incorreto.

Mas ele mesmo admite que o controle completo ainda não está em vigor. Um sistema autônomo pode interpretar mal as instruções, exceder os limites da tarefa, se tornar um alvo de ataque ou obter acesso a ferramentas muito poderosas.

Portanto, versões verdadeiramente poderosas de tais agentes, em sua opinião, precisarão ser mantidas em ambientes sandbox isolados e restritos até que os mecanismos de supervisão se tornem significativamente mais confiáveis.

O Que Isto Significa

Se OpenAI executar mesmo parcialmente este plano, o próximo salto em IA será vinculado não a chatbots mais conversacionais, mas a sistemas que podem ser atribuídos porções de trabalho intelectual real por dias ou semanas.

Mas é precisamente aqui que o verdadeiro teste reside: o mercado acredita prontamente no progresso rápido dos agentes, enquanto a ciência e a segurança exigirão não efeitos de demonstração, mas resultados reproduzíveis sob supervisão humana.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…