OpenAI abriu o capô: como seus agentes escrevem código (e por que não é mágica)
OpenAI quebrou seu silêncio. Após meses em que a empresa guardava segredos tão cuidadosamente quanto a fórmula da Coca-Cola, os desenvolvedores de repente…
Processado por IA de Ars Technica; editado por Hamidun News
OpenAI quebrou seu silêncio. Após meses em que a empresa guardava segredos tão cuidadosamente quanto a fórmula da Coca-Cola, os desenvolvedores de repente divulgaram detalhes sobre como seus modelos se transformam de ferramentas avançadas de auto-completação de texto em engenheiros completos. Este é um artigo sobre a arquitetura técnica dos agentes de codificação, e esta análise nos dá uma oportunidade rara de vislumbrar um futuro onde a programação deixa de ser trabalho manual. Deve-se dizer que o nome OpenAI parecia bastante irônico nos últimos anos, mas este post técnico nos leva de volta aos tempos em que a empresa realmente compartilhava sua experiência.
No centro da atenção está o chamado "agent loop" ou ciclo de agente. Antes, estávamos acostumados com redes neurais simplesmente gerando um trecho de código em resposta a uma solicitação. Se não funcionasse, era seu problema. Agora a abordagem mudou fundamentalmente. OpenAI descreve um sistema que funciona de forma iterativa: o modelo escreve código, executa-o imediatamente em uma "sandbox" fechada, recebe um relatório de erros do compilador e volta ao início para corrigir seus próprios erros. Este processo se repete até que os testes sejam bem-sucedidos. Em essência, a empresa automatizou o processo que qualquer desenvolvedor júnior passa durante seu primeiro ano de trabalho, apenas fazendo isso milhares de vezes mais rápido.
Por que isso é importante agora? Vamos ser honestos: ultimamente, Claude 3.5 Sonnet da Anthropic desanimou bastante o time de Sam Altman, assumindo a liderança em programação. Publicar detalhes técnicos não é apenas um gesto de boa fé, mas uma tentativa de mostrar que OpenAI ainda controla o pensamento arquitetônico. Eles estão apostando não no tamanho do modelo, mas na complexidade do sistema ao seu redor. Descobriu-se que até um modelo menos poderoso com as ferramentas de depuração certas pode mostrar resultados melhores do que um "computador superpoderoso" sozinho. Esta é uma mudança fundamental na indústria: estamos passando de uma corrida de parâmetros para uma corrida de arquiteturas de agentes.
É interessante como OpenAI descreve o trabalho com contexto. Os agentes agora não apenas leem um único arquivo—eles conseguem "olhar ao redor" do repositório, entendendo as conexões entre diferentes partes do projeto. Isto resolve o principal problema da codificação por IA—quando corrige uma linha, o modelo quebra toda a arquitetura da aplicação.
Agora o agente primeiro constrói um mapa de dependências e só então se dedica ao teclado virtual. Esta abordagem torna possível resolver tarefas no nível do SWE-bench—o teste mais difícil para IA, onde é necessário corrigir bugs reais em projetos de código aberto no GitHub. E pelos números que a empresa fornece, estamos à beira de um momento em que a IA conseguirá fechar até metade dos tickets rotineiros do Jira sem envolvimento humano.
Claro, não há como escapar da ironia aqui. Enquanto OpenAI ensina agentes a escrever código perfeito, desenvolvedores em todo o mundo começam a se perguntar: não estariam escrevendo uma ferramenta para seu próprio desemprego agora? Porém, a substituição completa do ser humano ainda está longe.
O principal problema são as "alucinações lógicas," quando o código é sintaticamente correto e até passa nos testes, mas faz algo completamente diferente do que o negócio pediu. Os agentes de OpenAI ainda não aprenderam a questionar especificações mal escritas, e isso é nossa salvação temporária. Porém, a direção é clara: o desenvolvimento de software está se transformando em um processo de supervisão de um exército de agentes autônomos, em vez de escrever linhas manualmente.
O ponto principal: a era dos prompts de código simples está terminando, e a era dos sistemas complexos de agentes está começando. OpenAI conseguirá manter sua liderança neste segmento, ou startups mais flexíveis a ultrapassarão?
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.