Habr AI→ original

Paperclip promet une entreprise d'agents IA, mais s'enlise dans la bureaucratie lors des tests

Paperclip propose de gérer une 'entreprise' entière d'agents de réseaux neuronaux : avec un PDG, des ingénieurs, des budgets et des tickets. En pratique…

Traité par IA depuis Habr AI ; édité par Hamidun News
Paperclip promet une entreprise d'agents IA, mais s'enlise dans la bureaucratie lors des tests
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Paperclip offre la possibilité de gérer non pas un seul assistant IA, mais toute une "entreprise" d'agents avec des rôles, des budgets et une hiérarchie interne. L'auteur de Habr a testé l'idée sur une tâche de produit réelle et a obtenu un échec frappant : en deux jours, une équipe de huit "employés" virtuels a brûlé des jetons, créé du bruit et réalisé pratiquement rien.

Comment

Fonctionne Paperclip Paperclip est un projet open-source qui, selon son auteur, a rassemblé 24 mille étoiles sur GitHub en ses 12 premiers jours et en a atteint 30,6 mille au moment de la publication. L'idée est simple et ambitieuse à la fois : arrêter de travailler avec l'IA comme un ensemble de chats séparés et transformer l'interaction en un modèle d'entreprise. Au lieu d'un seul assistant, l'utilisateur obtient un PDG, un DSI, des développeurs, un designer et d'autres "employés" entre lesquels on peut répartir les tâches, les budgets et les responsabilités.

"Si

OpenClaw est un employé, alors Paperclip est une entreprise". rôles de PDG, DSI, ingénieurs et designer pour différents types de tâches limites de jetons et désactivation d'agents quand le budget est épuisé mécanisme de heartbeat qui réveille les agents selon un calendrier plutôt que de les maintenir constamment actifs connexion de chaque tâche à un objectif global pour que les agents comprennent le contexte du travail * support de différents outils — de Claude Code et Codex à Bash et aux agents HTTP Sur le papier, c'est très puissant. Paperclip essaie de résoudre un vrai problème pour les développeurs qui ont des dizaines de sessions d'agents ouvertes simultanément, perdent le contexte et voient les dépenses en jetons spiraler hors de contrôle.

Un écosystème se forme déjà autour du projet : déploiements en cloud, communauté active et l'idée d'une marketplace pour des "entreprises IA" prêtes à l'emploi pour des scénarios types — du marketing au développement. Cela explique pourquoi l'intérêt pour le projet a augmenté si rapidement.

Pourquoi

Tout S'est Bloqué Pour tester l'idée, l'auteur a donné à Paperclip une tâche tout à fait typique : terminer un produit existant, ajouter quelques endpoints, intégrer une API externe et amener l'interface utilisateur au design déjà esquissé. Ensuite, le système s'est comporté de manière très humaine. Le PDG a distribué les tâches et a disparu pour regarder les métriques.

DevOps s'est lancé dans l'automatisation et a généré un tas de configurations de CI/CD. QA a refusé de travailler avec ce format. Backend a vu l'ampleur des spécifications, s'est retiré avec irritation.

Le designer s'est limité à une remarque du style "faites les boutons comme ailleurs". Le team lead se réveillait périodiquement, donnait des directives stratégiques et se rendormait. Au deuxième jour, les choses ne se sont pas améliorées.

Backend est revenu, a vu de nouvelles clarifications et un long fil de discussion, puis est entré en profond timeout. Frontend attendait une API qui n'est jamais venue. Le résultat de l'expérience était presque satirique : huit agents en deux jours ont dépensé 79 mille jetons, n'ont écrit pas une seule ligne de code utile, ont cassé une fiche de poste et ont amené l'auteur à revenir sur les modifications.

Après cela, un seul prestataire sous la forme de Cursor a clôturé la même tâche en approximativement une heure et demie.

Est la Véritable Valeur L'auteur lui-même fait une mise en garde importante : le problème n'est pas que Paperclip soit inutile. Au contraire — il a frappé un point d'usure du marché très précis. Quand un développeur a Claude Code, Cursor, Codex et d'autres agents en cours d'exécution simultanément, le chaos émerge rapidement : on ne sait pas qui fait quoi, où se trouve l'historique des discussions, quel contexte a été perdu et combien d'argent a déjà été brûlé.

Paperclip offre une couche de gestion au-dessus de ce zoo — avec des tickets, un audit, une récupération d'état et un contrôle budgétaire. Mais l'expérience révèle aussi le risque principal. Dès que l'interaction est structurée selon un modèle d'entreprise ordinaire, avec la division utile du travail viennent la bureaucratie, les pertes de coordination et la dépendance de la qualité de chaque agent individuel.

Paperclip ne rend pas les modèles plus intelligents et ne corrige pas les mauvaises décisions — il les organise simplement en une structure. Par conséquent, le rôle le plus sensé de l'humain dans un tel système aujourd'hui n'est pas un micromanageur et pas un "employé aux côtés des bots", mais un conseil d'administration : fixer les objectifs, allouer les budgets, observer les métriques et intervenir uniquement là où l'autonomie échoue réellement.

Ce

Que Cela Signifie Paperclip a définitivement touché un problème futur du marché : gérer plusieurs agents est déjà plus difficile que de travailler avec un seul. Mais l'article illustre bien la limite des capacités actuelles : les outils de coordination sont nécessaires dès maintenant, mais copier une entreprise humaine avec sa hiérarchie et ses rituels pour les agents autonomes est prématuré.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…