Ars Technica→ original

OpenAI abriu o capô: como seus agentes escrevem código (e por que não é mágica)

OpenAI quebrou seu silêncio. Após meses em que a empresa guardava segredos tão cuidadosamente quanto a fórmula da Coca-Cola, os desenvolvedores de repente…

Processado por IA de Ars Technica; editado por Hamidun News
OpenAI abriu o capô: como seus agentes escrevem código (e por que não é mágica)
Fonte: Ars Technica. Colagem: Hamidun News.
◐ Ouvir artigo

OpenAI quebrou seu silêncio. Após meses em que a empresa guardava segredos tão cuidadosamente quanto a fórmula da Coca-Cola, os desenvolvedores de repente divulgaram detalhes sobre como seus modelos se transformam de ferramentas avançadas de auto-completação de texto em engenheiros completos. Este é um artigo sobre a arquitetura técnica dos agentes de codificação, e esta análise nos dá uma oportunidade rara de vislumbrar um futuro onde a programação deixa de ser trabalho manual. Deve-se dizer que o nome OpenAI parecia bastante irônico nos últimos anos, mas este post técnico nos leva de volta aos tempos em que a empresa realmente compartilhava sua experiência.

No centro da atenção está o chamado "agent loop" ou ciclo de agente. Antes, estávamos acostumados com redes neurais simplesmente gerando um trecho de código em resposta a uma solicitação. Se não funcionasse, era seu problema. Agora a abordagem mudou fundamentalmente. OpenAI descreve um sistema que funciona de forma iterativa: o modelo escreve código, executa-o imediatamente em uma "sandbox" fechada, recebe um relatório de erros do compilador e volta ao início para corrigir seus próprios erros. Este processo se repete até que os testes sejam bem-sucedidos. Em essência, a empresa automatizou o processo que qualquer desenvolvedor júnior passa durante seu primeiro ano de trabalho, apenas fazendo isso milhares de vezes mais rápido.

Por que isso é importante agora? Vamos ser honestos: ultimamente, Claude 3.5 Sonnet da Anthropic desanimou bastante o time de Sam Altman, assumindo a liderança em programação. Publicar detalhes técnicos não é apenas um gesto de boa fé, mas uma tentativa de mostrar que OpenAI ainda controla o pensamento arquitetônico. Eles estão apostando não no tamanho do modelo, mas na complexidade do sistema ao seu redor. Descobriu-se que até um modelo menos poderoso com as ferramentas de depuração certas pode mostrar resultados melhores do que um "computador superpoderoso" sozinho. Esta é uma mudança fundamental na indústria: estamos passando de uma corrida de parâmetros para uma corrida de arquiteturas de agentes.

É interessante como OpenAI descreve o trabalho com contexto. Os agentes agora não apenas leem um único arquivo—eles conseguem "olhar ao redor" do repositório, entendendo as conexões entre diferentes partes do projeto. Isto resolve o principal problema da codificação por IA—quando corrige uma linha, o modelo quebra toda a arquitetura da aplicação.

Agora o agente primeiro constrói um mapa de dependências e só então se dedica ao teclado virtual. Esta abordagem torna possível resolver tarefas no nível do SWE-bench—o teste mais difícil para IA, onde é necessário corrigir bugs reais em projetos de código aberto no GitHub. E pelos números que a empresa fornece, estamos à beira de um momento em que a IA conseguirá fechar até metade dos tickets rotineiros do Jira sem envolvimento humano.

Claro, não há como escapar da ironia aqui. Enquanto OpenAI ensina agentes a escrever código perfeito, desenvolvedores em todo o mundo começam a se perguntar: não estariam escrevendo uma ferramenta para seu próprio desemprego agora? Porém, a substituição completa do ser humano ainda está longe.

O principal problema são as "alucinações lógicas," quando o código é sintaticamente correto e até passa nos testes, mas faz algo completamente diferente do que o negócio pediu. Os agentes de OpenAI ainda não aprenderam a questionar especificações mal escritas, e isso é nossa salvação temporária. Porém, a direção é clara: o desenvolvimento de software está se transformando em um processo de supervisão de um exército de agentes autônomos, em vez de escrever linhas manualmente.

O ponto principal: a era dos prompts de código simples está terminando, e a era dos sistemas complexos de agentes está começando. OpenAI conseguirá manter sua liderança neste segmento, ou startups mais flexíveis a ultrapassarão?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…