TechCrunch→ original

Anthropic testou um mercado onde agentes de IA negoceiam e fecham negócios sozinhos

Anthropic realizou um experimento Project Deal: 69 funcionários delegaram compra e venda de itens para agentes de IA que negociaram uns com os outros no…

Processado por IA de TechCrunch; editado por Hamidun News
Anthropic testou um mercado onde agentes de IA negoceiam e fecham negócios sozinhos
Fonte: TechCrunch. Colagem: Hamidun News.
◐ Ouvir artigo

A Anthropic testou um mercado onde agentes de IA negociam uns com os outros e fecham acordos sem participação humana em cada etapa, e isso já não parece ficção científica. No experimento Project Deal, a empresa criou um marketplace interno onde Claude representava tanto vendedores quanto compradores, publicava lotes por conta própria, conduzia negociações, fazia contrapropostas e finalizava acordos. É importante notar que não se tratava de uma simulação em dados de teste: os funcionários realmente trocaram coisas reais e dinheiro após a conclusão do experimento.

O experimento envolveu 69 funcionários da Anthropic no escritório de San Francisco. Cada um recebeu um orçamento condicional de $100, que foi posteriormente compensado com cartões-presente com base em suas compras e vendas. Antes do lançamento, Claude conduzia uma entrevista curta: descobria o que a pessoa estava disposta a vender, o que queria comprar, por qual preço e exatamente como o agente deveria conduzir as negociações.

Depois disso, um agente separado com um prompt de sistema individual era criado para cada participante. As negociações ocorreram dentro dos canais do Slack, e as pessoas não confirmavam cada acordo manualmente: uma vez iniciados, os agentes agiam independentemente. A Anthropic lançou simultaneamente quatro versões do mercado.

Uma foi considerada "real" — com base em seus resultados, os participantes posteriormente trocaram mercadorias; as outras três eram necessárias para comparação. Em duas execuções, todos foram representados pelo Claude Opus 4.5, enquanto em duas outras, os participantes foram aleatoriamente divididos entre Opus 4.

5 e o modelo mais leve Haiku 4.5. Na execução "real", os agentes fecharam 186 acordos em mais de 500 lotes no valor de pouco mais de $4.

000. Estas não foram compras instantâneas em um clique: os agentes tiveram que buscar interesses coincidentes, disputar preços, responder a contrapropostas e levar a conversa a um acordo. A conclusão principal resultou não ser que a IA conseguiu em geral, mas que a qualidade do modelo influenciou diretamente o resultado.

De acordo com a Anthropic, usuários com Opus fecharam em média cerca de dois acordos a mais do que usuários com Haiku. Quando o mesmo item era vendido por Opus, o preço em média resultava $3,64 mais alto, e na avaliação geral, Opus como vendedor gerava cerca de $2,68 extras, enquanto como comprador, inversamente, reduzia o preço em aproximadamente $2,45. Em exemplos individuais, a diferença parecia ainda mais notável: o mesmo rubi cultivado em laboratório que um agente Opus vendeu por $65, Haiku vendeu por apenas $35; uma bicicleta dobrável quebrada foi vendida por $65 em uma execução versus $38 em outra.

Curiosamente, o estilo das instruções quase não mudou o resultado. Alguns funcionários pediram aos seus agentes para serem suaves e amigáveis, outros para negociar duramente e começar com propostas reduzidas. Nenhum efeito estatisticamente significativo foi observado: prompts agressivos não aumentaram a chance de venda e não ajudaram consistentemente a obter um preço melhor.

No entanto, outras características da negociação de agentes se tornaram aparentes. Um agente comprou para uma pessoa um snowboard quase idêntico ao que ela já tinha, aparentemente tomando os gostos do proprietário de forma muito literal. Outro, a pedido de uma funcionária, escolheu um presente "para o próprio Claude" — um pacote de 19 bolas de pingue-pongue por $3.

Havia também acordos não sobre coisas, mas sobre experiências: por exemplo, agentes concordaram com um "encontro de cães" gratuito para o dia. A observação mais desagradável para a Anthropic foi diferente: pessoas representadas pelo modelo mais fraco quase não notaram que estavam recebendo condições piores. Em pesquisas, os participantes avaliaram a justiça dos acordos de forma aproximadamente igual, embora objetivamente a diferença em preços e resultados já existisse.

Se isso se mover de um experimento de escritório para o comércio real, um novo risco emerge: a desigualdade entre usuários poderia surgir não de suas habilidades, mas da qualidade do agente contratado, e o lado perdedor nem mesmo perceberá que está sendo sistematicamente derrotado. Portanto, Project Deal parece não apenas uma demonstração divertida do Claude, mas um aviso antecipado sobre como o mercado será organizado quando a IA começar a negociar em vez de pessoas.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…