Браузерный агент
Браузерный агент — AI-система, которая автономно управляет браузером для выполнения веб-задач: навигации по страницам, заполнения форм, извлечения данных и взаимодействия с веб-приложениями без участия пользователя.
Браузерный агент — специализированный AI-агент, оснащённый инструментами для управления браузером: открытие URL, клики на элементы, ввод текста, прокрутка страниц, работа с JavaScript-интерфейсами. Агент принимает высокоуровневую задачу и самостоятельно планирует и выполняет необходимые действия в браузере, не требуя пошаговых инструкций.
Архитектурно большинство браузерных агентов строятся на связке LLM с инструментами Playwright, Puppeteer или Chrome DevTools Protocol, либо используют специализированные платформы — Browserbase, Stagehand, Playwright MCP. Агент получает HTML-дерево страницы или её скриншот, выбирает следующее действие и анализирует обновлённое состояние браузера для продолжения работы.
Браузерный агент закрывает существенный пробел: большинство информации и сервисов в интернете доступны только через пользовательский интерфейс, а не через API. Это позволяет автоматизировать мониторинг цен, заполнение форм, сбор данных из публичных источников и тестирование веб-приложений.
К 2026 году браузерные агенты используются в продуктах OpenAI (Operator), Anthropic (Computer Use с браузерными инструментами), а также в специализированных системах для автоматизации QA и web-скрапинга. Ключевые нерешённые задачи — устойчивость к динамически изменяемым интерфейсам, обработка CAPTCHA и управление сессиями авторизации.