Anthropic протестировала рынок, где ИИ-агенты сами торгуются и заключают сделки
Anthropic провела эксперимент Project Deal: 69 сотрудников доверили покупку и продажу вещей ИИ-агентам, которые торговались друг с другом в Slack без вмешательс

Anthropic показала, что рынок, где ИИ-агенты торгуются друг с другом без участия человека в каждом шаге, уже не выглядит фантастикой. В эксперименте Project Deal компания создала внутреннюю площадку объявлений, на которой Claude представлял и продавцов, и покупателей, сам публиковал лоты, вел переговоры, делал встречные предложения и фиксировал сделки. Важно, что речь шла не о симуляции на тестовых данных: сотрудники действительно обменивались реальными вещами и деньгами после завершения эксперимента.
Эксперимент прошел среди 69 сотрудников Anthropic в офисе в Сан-Франциско. Каждому выдали условный бюджет в $100, который потом компенсировали подарочными картами с учетом покупок и продаж. До запуска Claude проводил короткое интервью: выяснял, что человек готов продать, что хочет купить, за какую цену и как именно агент должен вести переговоры.
После этого для каждого участника создавался отдельный агент с индивидуальным системным промптом. Торги шли внутри Slack-каналов, а люди не подтверждали каждую сделку вручную: после старта агенты действовали самостоятельно. Anthropic параллельно запустила четыре версии рынка.
Одна считалась «реальной» — именно по ее результатам участники потом обменялись товарами, еще три нужны были для сравнения. В двух запусках всех представлял Claude Opus 4.5, а в двух других участников случайным образом делили между Opus 4.
5 и более легкой моделью Haiku 4.5. В «реальном» прогоне агенты заключили 186 сделок по более чем 500 лотам на сумму чуть выше $4 тыс.
Это были не мгновенные покупки в один клик: агентам приходилось искать совпадения интересов, спорить о цене, отвечать на контрпредложения и доводить разговор до соглашения. Главный вывод оказался не в том, что ИИ вообще справился, а в том, что качество модели напрямую влияло на результат. По данным Anthropic, пользователи с Opus в среднем заключали примерно на две сделки больше, чем пользователи с Haiku.
Если один и тот же товар продавал Opus, цена в среднем оказывалась выше на $3,64, а в общей оценке Opus как продавец приносил около $2,68 сверху, а как покупатель, наоборот, снижал цену примерно на $2,45. На отдельных примерах разница выглядела еще заметнее: один и тот же выращенный в лаборатории рубин агент Opus продал за $65, тогда как Haiku — только за $35; сломанный складной велосипед в одном прогоне ушел за $65 против $38 в другом. Любопытно, что стиль инструкций почти не менял исход.
Некоторые сотрудники просили своих агентов быть мягкими и дружелюбными, другие — торговаться жестко и начинать с заниженных предложений. Статистически значимого эффекта это не дало: агрессивные подсказки не увеличили шанс продажи и не помогли стабильно выбивать лучшую цену. Зато проявились другие особенности агентной торговли.
Один агент купил человеку почти такой же сноуборд, какой у него уже был, явно слишком буквально восстановив вкусы владельца. Другой по просьбе сотрудницы выбрал подарок «для самого Claude» — пакет с 19 шариками для пинг-понга за $3. Были и сделки не про вещи, а про опыт: например, агенты договорились о бесплатной «собачьей встрече» на день.
Самое неприятное наблюдение для Anthropic в другом: люди, которых представляла более слабая модель, почти не замечали, что получают худшие условия. В опросах участники оценивали справедливость сделок примерно одинаково, хотя объективно разница в ценах и исходах уже была. Если перенести это из офисного эксперимента в реальную коммерцию, появляется новый риск: неравенство между пользователями может возникать не из-за их навыков, а из-за качества нанятого агента, причем проигрывающая сторона даже не поймет, что ее систематически обыгрывают.
Поэтому Project Deal выглядит не просто забавной демонстрацией Claude, а ранним предупреждением о том, как будет устроен рынок, когда ИИ начнет торговаться вместо людей.