Anthropic probó un mercado donde agentes de IA negocian y cierran acuerdos por sí mismos
Anthropic realizó un experimento Project Deal: 69 empleados delegaron la compra y venta de artículos a agentes de IA que negociaban entre sí en Slack sin…
Procesado por IA desde TechCrunch; editado por Hamidun News
Anthropic puso a prueba un mercado donde agentes de IA comercian entre sí y cierran tratos sin participación humana en cada paso, y ya no parece ciencia ficción. En el experimento Project Deal, la empresa creó un mercadillo interno donde Claude representaba tanto a vendedores como a compradores, publicaba lotes por sí mismo, conducía negociaciones, hacía contraofiertas y finalizaba acuerdos. Es importante señalar que no se trataba de una simulación con datos de prueba: los empleados realmente intercambiaron cosas reales y dinero después de que concluyera el experimento.
El experimento involucró a 69 empleados de Anthropic en la oficina de San Francisco. Cada uno recibió un presupuesto condicional de $100, que posteriormente fue compensado con tarjetas de regalo según sus compras y ventas. Antes del lanzamiento, Claude realizaba una breve entrevista: descubría qué estaba dispuesto a vender la persona, qué quería comprar, a qué precio y exactamente cómo el agente debería conducir las negociaciones.
Después de eso, se creaba un agente separado con un prompt de sistema individual para cada participante. Las negociaciones ocurrieron dentro de canales de Slack, y las personas no confirmaban cada acuerdo manualmente: una vez iniciados, los agentes actuaban de manera independiente. Anthropic lanzó simultáneamente cuatro versiones del mercado.
Una fue considerada "real" — según sus resultados, los participantes posteriormente intercambiaron bienes; las otras tres fueron necesarias para comparación. En dos ejecuciones, todos fueron representados por Claude Opus 4.5, mientras que en otras dos, los participantes fueron divididos aleatoriamente entre Opus 4.
5 y el modelo más ligero Haiku 4.5. En la ejecución "real", los agentes cerraron 186 acuerdos en más de 500 lotes por un valor ligeramente superior a $4.
000. Estos no fueron compras instantáneas de un clic: los agentes tuvieron que buscar intereses coincidentes, disputar precios, responder a contraofiertas y llevar la conversación a un acuerdo. La conclusión principal resultó no ser que la IA se desempeñó bien en general, sino que la calidad del modelo influyó directamente en el resultado.
Según Anthropic, los usuarios con Opus cerraron en promedio aproximadamente dos acuerdos más que los usuarios con Haiku. Cuando el mismo artículo era vendido por Opus, el precio en promedio resultaba $3,64 más alto, y en la evaluación general, Opus como vendedor aportaba aproximadamente $2,68 adicionales, mientras que como comprador, a la inversa, reducía el precio en aproximadamente $2,45. En ejemplos individuales, la diferencia se veía aún más notable: el mismo rubí cultivado en laboratorio que un agente Opus vendió por $65, Haiku lo vendió por solo $35; una bicicleta plegable rota se fue por $65 en una ejecución frente a $38 en otra.
Curiosamente, el estilo de las instrucciones casi no cambió el resultado. Algunos empleados le pedían a sus agentes que fueran suaves y amables, otros que negociaran agresivamente y comenzaran con ofertas reducidas. No se observó un efecto estadísticamente significativo: los prompts agresivos no aumentaron la probabilidad de una venta y no ayudaron de manera consistente a obtener un mejor precio.
Sin embargo, se hicieron evidentes otras características del comercio con agentes. Un agente compró a una persona un snowboard casi idéntico al que ya tenía, aparentemente tomando los gustos del propietario demasiado literalmente. Otro, a solicitud de una empleada, eligió un regalo "para el propio Claude" — un paquete de 19 pelotas de ping-pong por $3.
También hubo acuerdos no sobre cosas sino sobre experiencias: por ejemplo, los agentes acordaron un "encuentro de perros" gratuito para el día. La observación más desagradable para Anthropic fue diferente: las personas representadas por el modelo más débil casi no notaron que estaban recibiendo peores términos. En las encuestas, los participantes calificaron la equidad de los acuerdos aproximadamente igual, aunque objetivamente la diferencia en precios y resultados ya existía.
Si esto se trasladara de un experimento de oficina al comercio real, surge un nuevo riesgo: la desigualdad entre usuarios podría surgir no de sus habilidades, sino de la calidad del agente contratado, y la parte perdedora ni siquiera se dará cuenta de que está siendo sistemáticamente superada. Por lo tanto, Project Deal no solo parece una demostración divertida de Claude, sino una advertencia temprana sobre cómo se organizará el mercado cuando la IA comience a comerciar en lugar de las personas.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.