Habr AI→ оригинал

حوّلت Perplexity البحث بـ AI إلى وكيل ينشئ ملفات Excel ويتحقق من البيانات بنفسه

تلقى Perplexity Computer مهمة بحثية، وخلال 7 دقائق و7 ثوانٍ أنتج ملف Excel من أربع أوراق يضم 33 رابطًا وعشرة اختلافات في المقارنات المعيارية. النقطة الأساسية لي

حوّلت Perplexity البحث بـ AI إلى وكيل ينشئ ملفات Excel ويتحقق من البيانات بنفسه
Источник: Habr AI. Коллаж: Hamidun News.

Perplexity Computer показал, как AI-инструмент может уйти от роли «умного поиска» к роли исполнителя. В тесте на реальной исследовательской задаче система за 7 минут 7 секунд собрала Excel на четыре листа, сослалась на 33 источника и отдельно пометила десять расхождений в бенчмарках.

Как прошёл тест

Пользователь попросил систему собрать все AI-модели, выпущенные с 7 по 14 марта 2026 года, найти по каждой результаты бенчмарков минимум из трёх независимых источников, отметить несовпадающие цифры и затем посчитать соотношение цены и производительности. На выходе получился не просто список ссылок, а рабочий файл с ранжированием семи моделей, списком спорных метрик и пояснениями, почему в разных публикациях встречаются разные значения. Самое интересное было не в Excel как таковом, а в способе сборки.

Computer не копировал текст из браузера в ячейки вручную и не сводил результат в один длинный ответ. Он написал Python-скрипт build_spreadsheet.py, запустил его, столкнулся с ошибками, сам же их исправил и пересобрал файл.

То есть система не ограничилась поиском и суммаризацией: она создала артефакт, который можно открыть, проверить и сразу использовать в работе.

Почему это не поиск

По описанию Perplexity, Computer — это агентный слой, запущенный 25 февраля 2026 года поверх набора из 19 моделей. Центральную оркестрацию и кодовые задачи ведёт Claude Opus 4.6, глубокое исследование уходит в Gemini, быстрые фактологические проверки — в Grok, а отдельные медиа-задачи маршрутизируются в другие модели. Пользователь задаёт не цепочку команд, а цель, после чего система сама режет её на подзадачи, распределяет работу и собирает ответ в финальный результат.

«Perplexity больше не поисковик.

Это другая категория инструмента.» Тест это хорошо показал на деталях. Например, Computer нашёл разрыв в оценке GPT-5.4 по GPQA Diamond: 92,8% в блоге OpenAI против 74,8% у NxCode, и связал расхождение с разными настройками reasoning effort. Ещё полезнее был вывод по стоимости: Nemotron 3 Super от NVIDIA при цене $0,10/$0,50 за миллион токенов дал показатель стоимость/производительность $0,37 против $9,17 у GPT-5.4. Причём этот расчёт система сделала сама, без отдельной просьбы.

Что анонсировали дальше 11 марта 2026 года на конференции

Ask 2026 компания показала, что Computer — не разовая демо-функция, а часть более широкого продукта. В персональной версии агент может работать на выделенном Mac mini, иметь постоянный доступ к локальным файлам и подключённым сервисам, следить за триггерами и запускать задачи в фоне. Для чувствительных действий предусмотрено подтверждение пользователя, а аварийный выключатель даёт быстрый ручной контроль.

Параллельно компания показала, как собирается монетизировать и расширять этот подход. Доступ к Personal Computer открыт через waitlist для тарифа Max за $200 в месяц, а корпоративная версия уже умеет подключаться к Snowflake, Databricks, Salesforce и HubSpot. Для разработчиков вынесли те же внутренние компоненты, на которых работает Computer, а в исследовательский контур добавили платные базы данных и мобильную синхронизацию.

Ключевые пункты анонса такие: Personal Computer с постоянным доступом к файлам, приложениям и сессиям Корпоративная версия с коннекторами к Snowflake, Databricks, Salesforce и HubSpot Четыре API для разработчиков: Search, Agent, Embeddings и Sandbox Прямой доступ к данным Statista, CB Insights и PitchBook внутри исследований * Запуск на iOS с кросс-девайсной синхронизацией и последующим выходом на Android ## Что это значит Главный сдвиг здесь в том, что ценность AI всё меньше измеряется красивым ответом в чате и всё больше — готовым рабочим результатом: таблицей, отчётом, расчётом, списком спорных данных. У Perplexity остаются слабые места — непрозрачная система кредитов, зависимость от экосистемы Apple для personal-версии и непроверенные корпоративные цифры. Но сама траектория понятна: AI-поиск превращается в исследовательского агента, который не только находит, но и делает.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…