Databricks e Infosys: por que os dados travam a implementação de IA
A principal barreira à IA corporativa se mostrou mais chata do que os próprios modelos: os dados. As empresas querem passar de chatbots para automação de…
Processado por IA de MIT Technology Review; editado por Hamidun News
As empresas discutem cada vez mais inteligência artificial no nível de conselho, mas o verdadeiro lançamento de IA nos negócios é frequentemente travado não por modelos ou computação, mas pelo estado dos dados corporativos. Enquanto os serviços de consumidor treinaram o mercado para esperar impacto instantâneo, dentro de grandes organizações logo fica claro que sem uma infraestrutura de dados unificada, gerenciada e operacionalmente adequada, a IA permanece uma demonstração bonita e não uma ferramenta funcional. O principal problema é que os dados corporativos normalmente vivem em camadas muito diferentes.
Alguns ficam em data marts e data lakes analíticos, alguns em sistemas transacionais como CRM, ERP e aplicativos internos, e o resto está espalhado por arquivos, email, bases de conhecimento, tickets e serviços em nuvem. Para relatórios típicos, tal paisagem ainda pode ser tolerada. Mas quando uma empresa quer dar a um modelo acesso em tempo real aos dados, incorporar IA em processos ou lançar agentes que não apenas respondem perguntas mas também executam ações, a fragmentação se torna uma limitação direta.
Um modelo pode ser poderoso, mas se não conseguir ver o contexto atual, não entender a linhagem dos dados e não operar dentro de direitos de acesso claros, o resultado se torna instável e arriscado. É precisamente por isso que a conversa sobre IA corporativa está se deslocando cada vez mais de modelos para arquitetura. Uma das teses principais é que empresas não precisam de um conjunto de ferramentas IA disparatadas, mas de um novo data stack onde os dados sejam armazenados em formatos abertos, descritos por metadados, acessíveis através de políticas unificadas e adequados simultaneamente para análise e cenários operacionais.
Daí o interesse em arquiteturas que fazem a ponte entre os mundos OLAP e OLTP: por um lado, empresas precisam de profundidade de análise, histórico e escala, por outro — latência baixa, transacionalidade e a capacidade de agir rapidamente. Nesta abordagem, Databricks promove Lakebase como uma camada Postgres sem servidor para cargas de trabalho de IA operacional, e Unity Catalog como uma camada unificada para gerenciamento de acesso, linhagem de dados e governança para dados e ativos de IA. O ponto não é os produtos específicos, mas a tendência em si: negócios precisam de uma fundação sobre a qual IA possa funcionar em produção, não apenas em um piloto.
Uma questão separada é como medir o impacto. Em estágio inicial, empresas frequentemente se contentam com métricas atraentes como o número de consultas de chatbot ou a porcentagem de funcionários que abriram copilots. Mas conforme amadurecem, isso não é mais suficiente.
Se a IA deve automatizar processos, reduzir ciclos de operação, aumentar conversão ou criar novas linhas de receita, ela deve ser avaliada como um sistema empresarial completo. Portanto, na discussão de um novo data stack, a questão de medir valor também aparece: o impacto da IA deve estar vinculado não ao fator uau, mas a resultados concretos de negócio. Isso é especialmente importante conforme fazemos a transição para IA agente, onde o modelo ganha mais autonomia, e assim os requisitos de observabilidade, registro, qualidade de dados e política de acesso se tornam muito mais rigorosos.
A evolução da IA corporativa aqui parece bastante clara. Primeiro, as empresas implantam ferramentas individuais de produtividade — assistentes para busca, sumarização, escrita de código ou preparação de documentos. Depois fazem a transição para automação de processos: tratamento de tickets, roteamento de tarefas, suporte interno, cenários financeiros e operacionais.
E apenas depois disso a terceira fase se abre — lançamento de novos produtos e linhas de negócio que são construídos em torno de IA desde o início. Com cada estágio sucessivo, os requisitos de dados crescem. O que ainda funcionava para um copilot pessoal não funciona mais para um processo onde precisão, registro completo de ações e a capacidade de executar com segurança operações em nome da empresa são necessários.
Daí a conclusão principal: a próxima batalha pela IA corporativa não é sobre a melhor interface de modelo, mas sobre reestruturar dados para uso por máquinas. Aquelas empresas vencerão que conseguiram unificar, gerenciar e tornar dados compatíveis com cenários de agentes. Para negócios, isto significa uma verdade incômoda mas útil: o caminho para IA em escala não começa com a escolha de um modelo, mas com a reconstrução do data stack.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.