TNW→ оригинал

Galtea raises $3.2 million for an enterprise AI agent validation platform

Galtea, a spin-off of Barcelona Supercomputing Center, has raised $3.2 million for a platform that tests enterprise AI agents. The service generates realistic s

◐ Слушать статью

Испанский стартап Galtea привлёк $3,2 млн на платформу, которая помогает компаниям проверять AI-агентов до запуска в рабочую среду. Команда делает ставку на то, что главный риск сегодня не в красивом демо, а в поведении модели в реальных корпоративных сценариях.

Почему это стало важно

Galtea выросла из Barcelona Supercomputing Center и была основана всего полтора года назад, но уже заняла понятную нишу: тестирование корпоративных AI-агентов до выхода в продакшен. Для бизнеса это болезненная точка. Агент может уверенно пройти демонстрацию, а потом ошибаться на реальных данных, путать инструкции, выдавать опасные советы или сбоить в длинных многошаговых процессах.

Особенно сложно то, что корпоративный агент редко живёт в изоляции. Он читает базы знаний, вызывает инструменты, ходит в CRM, ищет документы и должен соблюдать внутренние политики. Чем больше у него полномочий и интеграций, тем труднее предсказать поведение только по ручным тестам.

Поэтому спрос смещается от простых benchmark-оценок к проверке конкретных бизнес-сценариев, где ошибка имеет цену в деньгах, репутации и комплаенсе. По сути, стартап работает на стыке QA, безопасности и AI governance. Чем активнее компании внедряют агентов в поддержку, внутренний поиск, аналитику и документооборот, тем выше цена ошибки.

Если обычный чат-бот ответит неточно, это неприятно. Если агент с доступом к системам начнёт принимать неверные решения, проблема быстро становится операционной и юридической.

Как устроена проверка

Ключевая идея Galtea — использовать AI для генерации реалистичных тестовых сценариев, которые заранее выявляют слабые места системы. Вместо ручной проверки нескольких удачных промптов компания получает набор стресс-тестов, больше похожих на то, что происходит после реального запуска. Такой подход особенно важен для агентов, которые работают с длинным контекстом, инструментами и корпоративными правилами доступа.

Платформа, судя по описанию, помогает искать несколько классов проблем сразу: сбои в логике и выполнении многошаговых задач галлюцинации и уверенные неверные ответы предвзятые или некорректные результаты уязвимости и риски безопасности * ошибки, которые проявляются только в рабочих сценариях Для корпоративных команд это выглядит как переход от «проверили на демо» к более зрелому процессу допуска в продакшен. Если такие инструменты приживутся, AI-агенты начнут проходить примерно тот же путь, что давно проходят обычные программные продукты: тестирование, контроль рисков и повторяемая оценка качества перед релизом.

Кто поддержал раунд Galtea закрыла раунд на $3,2 млн.

Лид-инвестором выступил 42CAP, также в сделке участвовал Mozilla Ventures. Для молодого B2B-стартапа это не гигантская сумма, но она хорошо показывает, куда смещается интерес рынка: не только в создание новых моделей и интерфейсов, но и в инфраструктуру доверия вокруг них. На рынке постепенно формируется отдельный слой продуктов, которые не создают самих агентов, а проверяют их надёжность, объяснимость и управляемость.

Интерес инвесторов к таким компаниям показывает, что вокруг генеративного AI строится полноценная сервисная экосистема. Следующая волна конкуренции, вероятно, будет идти не только по качеству модели, но и по тому, насколько безопасно её можно встроить в бизнес-процессы. Отдельно важен и профиль самой компании.

Спин-офф из Barcelona Supercomputing Center звучит как заявка на сильную исследовательскую базу и инженерный подход, а не только на быстрый запуск модного AI-сервиса. На раннем рынке это может стать преимуществом: крупным заказчикам обычно важны не обещания, а воспроизводимость тестов, понятные критерии оценки и возможность объяснить, почему агент вообще считается безопасным для запуска.

Что это значит

Рынок AI постепенно взрослеет: компаниям уже мало агента, который впечатляет на презентации. Им нужен инструмент, который покажет, где система сломается до того, как это увидят клиенты, сотрудники или служба безопасности. Именно поэтому платформы вроде Galtea могут стать обязательным слоем между экспериментом и реальным внедрением.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.
Загружаем комментарии…