Databricks e Infosys: por qué los datos frenan la implementación de IA
La principal barrera para la IA empresarial resultó ser más aburrida que los propios modelos: los datos. Las empresas quieren pasar de chatbots a…
Procesado por IA desde MIT Technology Review; editado por Hamidun News
Las empresas discuten cada vez más inteligencia artificial a nivel de junta directiva, pero el despliegue real de IA en los negocios suele estar limitado no por modelos o computación, sino por el estado de los datos corporativos. Mientras que los servicios de consumidor han entrenado al mercado para esperar impacto instantáneo, dentro de grandes organizaciones rápidamente queda claro que sin una infraestructura de datos unificada, gestionada y operacionalmente adecuada, la IA sigue siendo una demostración bonita y no una herramienta funcional. El problema principal es que los datos corporativos típicamente viven en demasiadas capas diferentes.
Algunos residen en almacenes analíticos y data lakes, algunos en sistemas transaccionales como CRM, ERP y aplicaciones internas, y el resto está disperso en archivos, correo electrónico, bases de conocimiento, tickets y servicios en la nube. Para informes típicos, tal panorama aún puede tolerarse. Pero cuando una empresa quiere dar a un modelo acceso en tiempo real a los datos, incrustar IA en procesos o lanzar agentes que no solo responden preguntas sino también ejecutan acciones, la fragmentación se convierte en una limitación directa.
Un modelo puede ser potente, pero si no puede ver el contexto actual, no entiende el linaje de los datos y no opera dentro de derechos de acceso claros, el resultado se vuelve inestable y arriesgado. Es precisamente por esto que la conversación sobre IA corporativa se está desplazando cada vez más de modelos a arquitectura. Una de las tesis clave es que las empresas no necesitan un conjunto de herramientas IA dispares, sino un nuevo data stack donde los datos se almacenen en formatos abiertos, descritos por metadatos, accesibles a través de políticas unificadas y adecuados simultáneamente para análisis y escenarios operacionales.
De ahí el interés en arquitecturas que cierren la brecha entre los mundos OLAP y OLTP: por un lado, las empresas necesitan la profundidad de análisis, historial y escala, por otro — baja latencia, transaccionalidad y la capacidad de actuar rápidamente. En este enfoque, Databricks promueve Lakebase como una capa Postgres sin servidor para cargas de trabajo IA operacionales, y Unity Catalog como una capa unificada para gestión de acceso, linaje de datos y gobernanza para datos y activos de IA. El punto no son los productos específicos, sino la tendencia en sí: los negocios necesitan una base sobre la cual la IA pueda funcionar en producción, no solo en un piloto.
Una pregunta separada es cómo medir el impacto. En fase temprana, las empresas a menudo se conforman con métricas atractivas como el número de consultas a chatbot o el porcentaje de empleados que abrieron copilots. Pero conforme maduran, esto ya no es suficiente.
Si la IA debe automatizar procesos, reducir ciclos de operación, aumentar conversión o crear nuevas líneas de ingresos, debe evaluarse como un sistema empresarial completo. Por lo tanto, en la discusión de un nuevo data stack, la pregunta de medir valor también aparece: el impacto de la IA debe vincularse no al factor sorpresa, sino a resultados comerciales concretos. Esto es especialmente importante mientras hacemos la transición a IA de agentes, donde el modelo gana más autonomía, y por lo tanto los requisitos de observabilidad, registro, calidad de datos y política de acceso se vuelven mucho más estrictos.
La evolución de la IA corporativa aquí se ve bastante clara. Primero, las empresas despliegan herramientas individuales de productividad — asistentes para búsqueda, sumarización, escritura de código o preparación de documentos. Luego hacen la transición a automatización de procesos: manejo de tickets, enrutamiento de tareas, soporte interno, escenarios financieros y operacionales.
Y solo después de eso se abre la tercera fase — lanzamiento de nuevos productos y líneas de negocio que se construyen alrededor de IA desde el principio. Con cada fase sucesiva, los requisitos de datos crecen. Lo que aún funcionaba para un copilot personal ya no funciona para un proceso donde se necesita precisión, registro completo de acciones y la capacidad de ejecutar con seguridad operaciones en nombre de la empresa.
De ahí la conclusión principal: la próxima batalla por la IA corporativa no es sobre la mejor interfaz de modelo, sino sobre reestructurar datos para uso por máquinas. Ganarán aquellas empresas que lograron unificar, gestionar y hacer los datos compatibles con escenarios de agentes. Para los negocios, esto significa una verdad incómoda pero útil: el camino hacia IA a escala no comienza con la elección de un modelo, sino con la reconstrucción del data stack.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.