Databricks e Infosys: por que os dados travam a implementação de IA
A principal barreira à IA corporativa se mostrou mais chata do que os próprios modelos: os dados. As empresas querem passar de chatbots para automação de proces

Компании все активнее обсуждают искусственный интеллект на уровне совета директоров, но реальный запуск ИИ в бизнесе чаще тормозят не модели и не вычисления, а состояние корпоративных данных. Пока потребительские сервисы приучили рынок к мгновенному эффекту, внутри больших организаций быстро выясняется более прозаичная вещь: без единой, управляемой и пригодной для эксплуатации инфраструктуры данных ИИ остается красивой демонстрацией, а не рабочим инструментом. Главная проблема в том, что данные в компаниях обычно живут в слишком разных слоях.
Часть лежит в аналитических витринах и озерах данных, часть — в транзакционных системах вроде CRM, ERP и внутренних приложений, а еще часть размазана по файлам, почте, базам знаний, тикетам и облачным сервисам. Для обычной отчетности такой ландшафт еще можно терпеть. Но когда бизнес хочет дать модели доступ к данным в реальном времени, встроить ИИ в процессы или запустить агентов, которые не только отвечают на вопросы, но и совершают действия, фрагментация становится прямым ограничением.
Модель может быть сильной, но если она не видит актуальный контекст, не понимает происхождение данных и не работает в рамках четких прав доступа, результат получается нестабильным и рискованным. Именно поэтому разговор о корпоративном ИИ все чаще смещается от моделей к архитектуре. Один из ключевых тезисов — предприятиям нужен не набор разрозненных ИИ-инструментов, а новая data stack, где данные хранятся в открытых форматах, описаны метаданными, доступны через единые политики и пригодны одновременно для аналитики и для операционных сценариев.
Отсюда интерес к архитектурам, которые соединяют мир OLAP и OLTP: с одной стороны, компаниям нужна глубина аналитики, история и масштаб, с другой — низкая задержка, транзакционность и возможность быстро действовать. В таком подходе Databricks продвигает Lakebase как бессерверный Postgres-слой для оперативных ИИ-нагрузок, а Unity Catalog — как единый слой управления доступом, происхождением данных и governance для данных и ИИ-активов. Смысл не в конкретных продуктах, а в самой тенденции: бизнесу нужен фундамент, на котором ИИ может работать в проде, а не только в пилоте.
Отдельный вопрос — как измерять эффект. На ранней стадии компаниям часто хватает красивых метрик вроде числа запросов к чат-боту или процента сотрудников, открывших копилотов. Но по мере взросления этого уже мало.
Если ИИ должен автоматизировать процессы, сокращать цикл операции, повышать конверсию или создавать новые направления выручки, его приходится оценивать как полноценную бизнес-систему. Поэтому в обсуждении новой data stack появляется и тема измерения ценности: эффект ИИ надо связывать не с вау-эффектом, а с конкретными результатами для бизнеса. Это особенно важно на фоне перехода к агентному ИИ, где модель получает больше автономии, а значит, требования к наблюдаемости, журналированию, качеству данных и политике доступа становятся гораздо жестче.
Эволюция корпоративного ИИ здесь выглядит достаточно понятной. Сначала компании внедряют индивидуальные инструменты продуктивности — помощников для поиска, суммаризации, написания кода или подготовки документов. Затем переходят к автоматизации процессов: обработке заявок, маршрутизации задач, внутренней поддержке, финансовым и операционным сценариям.
И только после этого открывается третий этап — запуск новых продуктов и линий бизнеса, которые изначально строятся вокруг ИИ. На каждом следующем этапе требования к данным растут. То, что еще работало для персонального копилота, перестает работать для процесса, где нужна точность, полный журнал действий и возможность безопасно выполнять операции от имени компании.
Отсюда и главный вывод: следующая битва за корпоративный ИИ идет не за лучший интерфейс к модели, а за перестройку данных под машинное использование. Победят не те компании, которые быстрее всех подключили очередной чат-бот, а те, кто сумел сделать данные едиными, управляемыми и совместимыми с агентными сценариями. Для бизнеса это означает неприятную, но полезную правду: путь к масштабному ИИ начинается не с выбора модели, а с пересборки data stack.