Habr AI→ original

Paperclip promete uma empresa de agentes de IA, mas se afoga em burocracia durante os testes

O Paperclip propõe gerenciar uma 'empresa' inteira de agentes de redes neurais: com CEO, engenheiros, orçamentos e tickets. Na prática, o experimento expôs o…

Processado por IA de Habr AI; editado por Hamidun News
Paperclip promete uma empresa de agentes de IA, mas se afoga em burocracia durante os testes
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

O Paperclip oferece a possibilidade de gerenciar não apenas um único assistente de IA, mas toda uma "empresa" de agentes com papéis, orçamentos e hierarquia interna. O autor do Habr testou a ideia em uma tarefa de produto real e obteve um fracasso notável: em dois dias, um time de oito "funcionários" virtuais queimou tokens, criou ruído e realizou praticamente nada.

Como o

Paperclip Funciona O Paperclip é um projeto open-source que, segundo seu autor, coletou 24 mil estrelas no GitHub nos primeiros 12 dias e chegou a 30,6 mil no momento da publicação. A ideia é simples e ao mesmo tempo ambiciosa: parar de trabalhar com IA como um conjunto de chats separados e transformar a interação em um modelo de empresa. Em vez de um único assistente, o usuário obtém um CEO, CTO, desenvolvedores, um designer e outros "funcionários" entre os quais podem dividir tarefas, orçamentos e responsabilidades.

"Se

OpenClaw é um funcionário, então Paperclip é uma empresa". papéis de CEO, CTO, engenheiros e designer para diferentes tipos de tarefas limites de tokens e desativação de agentes quando o orçamento se esgota mecanismo de heartbeat que acorda agentes em horários programados em vez de mantê-los constantemente ativos conexão de cada tarefa com um objetivo geral para que os agentes entendam o contexto do trabalho * suporte para diferentes ferramentas — desde Claude Code e Codex até Bash e agentes HTTP No papel, isso parece muito poderoso. O Paperclip tenta resolver um ponto de dor real para desenvolvedores que têm dezenas de sessões de agentes abertas simultaneamente, perdem contexto e veem despesas com tokens sairem do controle.

Um ecossistema já está se formando ao redor do projeto: implantações em nuvem, comunidade ativa e a ideia de um marketplace para "empresas de IA" prontas para cenários típicos — de marketing a desenvolvimento. Isso explica por que o interesse no projeto cresceu tão rapidamente.

Por

Que Tudo Parou Para testar a ideia, o autor deu ao Paperclip uma tarefa bastante típica: finalizar um produto existente, adicionar alguns endpoints, integrar com uma API externa e levar a UI ao design já desenhado. Então o sistema se comportou de forma muito humana. O CEO distribuiu tarefas e desapareceu para verificar métricas.

DevOps se envolveu em automação e gerou um monte de configs de CI/CD. QA não quis trabalhar com esse formato. Backend viu o escopo da especificação, recuou irritadamente.

O designer se limitou a um comentário tipo "façam os botões como em outros lugares". O team lead periodicamente acordava, dava diretrizes estratégicas e voltava a dormir. No segundo dia, as coisas não melhoraram.

Backend voltou, viu novos esclarecimentos e uma longa conversa, depois entrou em timeout profundo. Frontend ficou esperando por uma API que nunca veio. O resultado do experimento foi quase satírico: oito agentes em dois dias gastaram 79 mil tokens, não escreveram uma única linha útil de código, quebraram um cartão de vaga e levaram o autor a reverter as mudanças.

Depois disso, um contratante solo na forma de Cursor fechou a mesma tarefa em aproximadamente uma hora e meia.

Onde

Está o Valor Real O próprio autor faz uma ressalva importante: o problema não é que Paperclip seja inútil. Ao contrário — ele atingiu um ponto de dor de mercado muito preciso. Quando um desenvolvedor tem Claude Code, Cursor, Codex e outros agentes rodando simultaneamente, o caos emerge rapidamente: não fica claro quem está fazendo o quê, onde está o histórico de discussões, qual contexto foi perdido e quanto dinheiro já foi queimado.

O Paperclip oferece uma camada de gerenciamento sobre esse zoológico — com tickets, auditoria, recuperação de estado e controle de orçamento. Mas o experimento também revela o risco principal. Assim que a interação é estruturada em torno de um modelo de empresa comum, junto com a divisão útil do trabalho vêm burocracia, perdas de coordenação e dependência da qualidade de cada agente individual.

O Paperclip não torna os modelos mais inteligentes e não corrige decisões ruins — ele apenas as organiza em uma estrutura. Portanto, o papel mais sensato do humano em tal sistema hoje não é um microgerenciador e não um "funcionário ao lado dos bots", mas um conselho de administração: definir objetivos, alocar orçamentos, observar métricas e intervir apenas onde a autonomia realmente falha.

O

Que Isso Significa O Paperclip definitivamente atingiu um problema futuro do mercado: gerenciar múltiplos agentes já é mais difícil do que trabalhar com um único. Mas o artigo ilustra bem a fronteira das capacidades atuais: ferramentas de coordenação são necessárias agora, mas copiar uma empresa humana com sua hierarquia e rituais para agentes autônomos é prematuro.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…