TechCrunch→ оригинал

اختبرت Anthropic سوقًا حيث تتفاوض وكلاء الذكاء الاصطناعي وتُبرم الصفقات بأنفسهم

أجرت Anthropic تجربة Project Deal: أوكل 69 موظفًا إلى وكلاء الذكاء الاصطناعي شراء وبيع العناصر، التي تفاوضت مع بعضها البعض على Slack دون تدخل بشري. في أسبوع واح

اختبرت Anthropic سوقًا حيث تتفاوض وكلاء الذكاء الاصطناعي وتُبرم الصفقات بأنفسهم
Источник: TechCrunch. Коллаж: Hamidun News.

Anthropic показала, что рынок, где ИИ-агенты торгуются друг с другом без участия человека в каждом шаге, уже не выглядит фантастикой. В эксперименте Project Deal компания создала внутреннюю площадку объявлений, на которой Claude представлял и продавцов, и покупателей, сам публиковал лоты, вел переговоры, делал встречные предложения и фиксировал сделки. Важно, что речь шла не о симуляции на тестовых данных: сотрудники действительно обменивались реальными вещами и деньгами после завершения эксперимента.

Эксперимент прошел среди 69 сотрудников Anthropic в офисе в Сан-Франциско. Каждому выдали условный бюджет в $100, который потом компенсировали подарочными картами с учетом покупок и продаж. До запуска Claude проводил короткое интервью: выяснял, что человек готов продать, что хочет купить, за какую цену и как именно агент должен вести переговоры.

После этого для каждого участника создавался отдельный агент с индивидуальным системным промптом. Торги шли внутри Slack-каналов, а люди не подтверждали каждую сделку вручную: после старта агенты действовали самостоятельно. Anthropic параллельно запустила четыре версии рынка.

Одна считалась «реальной» — именно по ее результатам участники потом обменялись товарами, еще три нужны были для сравнения. В двух запусках всех представлял Claude Opus 4.5, а в двух других участников случайным образом делили между Opus 4.

5 и более легкой моделью Haiku 4.5. В «реальном» прогоне агенты заключили 186 сделок по более чем 500 лотам на сумму чуть выше $4 тыс.

Это были не мгновенные покупки в один клик: агентам приходилось искать совпадения интересов, спорить о цене, отвечать на контрпредложения и доводить разговор до соглашения. Главный вывод оказался не в том, что ИИ вообще справился, а в том, что качество модели напрямую влияло на результат. По данным Anthropic, пользователи с Opus в среднем заключали примерно на две сделки больше, чем пользователи с Haiku.

Если один и тот же товар продавал Opus, цена в среднем оказывалась выше на $3,64, а в общей оценке Opus как продавец приносил около $2,68 сверху, а как покупатель, наоборот, снижал цену примерно на $2,45. На отдельных примерах разница выглядела еще заметнее: один и тот же выращенный в лаборатории рубин агент Opus продал за $65, тогда как Haiku — только за $35; сломанный складной велосипед в одном прогоне ушел за $65 против $38 в другом. Любопытно, что стиль инструкций почти не менял исход.

Некоторые сотрудники просили своих агентов быть мягкими и дружелюбными, другие — торговаться жестко и начинать с заниженных предложений. Статистически значимого эффекта это не дало: агрессивные подсказки не увеличили шанс продажи и не помогли стабильно выбивать лучшую цену. Зато проявились другие особенности агентной торговли.

Один агент купил человеку почти такой же сноуборд, какой у него уже был, явно слишком буквально восстановив вкусы владельца. Другой по просьбе сотрудницы выбрал подарок «для самого Claude» — пакет с 19 шариками для пинг-понга за $3. Были и сделки не про вещи, а про опыт: например, агенты договорились о бесплатной «собачьей встрече» на день.

Самое неприятное наблюдение для Anthropic в другом: люди, которых представляла более слабая модель, почти не замечали, что получают худшие условия. В опросах участники оценивали справедливость сделок примерно одинаково, хотя объективно разница в ценах и исходах уже была. Если перенести это из офисного эксперимента в реальную коммерцию, появляется новый риск: неравенство между пользователями может возникать не из-за их навыков, а из-за качества нанятого агента, причем проигрывающая сторона даже не поймет, что ее систематически обыгрывают.

Поэтому Project Deal выглядит не просто забавной демонстрацией Claude, а ранним предупреждением о том, как будет устроен рынок, когда ИИ начнет торговаться вместо людей.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…