Habr AI→ original

VK dévoile DataCopilot — système multi-agent pour données et documentation d'entreprise

VK a présenté DataCopilot — un assistant IA interne pour les dépôts de données et la documentation d'entreprise. Le système est issu d'un audit de demandes…

Traité par IA depuis Habr AI ; édité par Hamidun News
VK dévoile DataCopilot — système multi-agent pour données et documentation d'entreprise
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

VK a montré DataCopilot — un système multi-agents pour les données corporatives et la documentation

VK a présenté DataCopilot — un assistant IA interne pour travailler avec un référentiel de données corporatives et une documentation spécialisée. Le projet est né non pas d'une tendance autour des LLM, mais de l'analyse de demandes réelles des analystes, gestionnaires et ingénieurs qui passent du temps chaque jour sur des questions répétitives.

Comment ils ont commencé

L'équipe n'a pas commencé en choisissant un modèle ou en concevant un autre schéma RAG. D'abord, VK a examiné la routine autour de Data Office et la plateforme de données : quelles questions arrivent au support, ce que les employés demandent le plus souvent dans les chats, où les gens perdent du temps à chercher le bon tableau de bord, la description d'un champ ou le processus d'approbation. Cet audit a fourni une liste claire de tâches qui pourraient être automatisées sans reconstruire l'ensemble du DWH et sans essayer de créer une "intelligence universelle" pour tous les cas à la fois.

À partir de cette liste, ils ont formé l'image de l'assistant du futur. Il devrait comprendre le catalogue des tableaux de bord, expliquer ce qui et où est stocké, fournir des conseils sur la documentation d'entreprise, aider aux accès et générer des modèles fonctionnels pour ETL. C'est-à-dire, pas un chatbot "pour le bien du chat", mais une interface aux données et aux connaissances internes de l'entreprise.

Pour les analystes et les gestionnaires, cela économise du temps ; pour les ingénieurs, cela réduit le flux de demandes identiques.

Pourquoi pas RAG

Pour certaines demandes, le RAG classique fonctionne effectivement : un utilisateur pose une question, le système trouve les documents pertinents et assemble une réponse basée sur ceux-ci. Mais dans un environnement corporatif, cela devient rapidement insuffisant. Une question peut exiger de passer par le catalogue des tableaux de bord, les descriptions de tables spécifiques, les instructions d'accès et un modèle de script.

Si tout cela est remis à une seule chaîne sans spécialisation, la qualité de la réponse commence à fluctuer, et le contexte supplémentaire ne fait que gêner. C'est pourquoi VK parie sur une architecture multi-agents — essentiellement, sur un essaim d'assistants spécialisés. Un agent peut être responsable de la recherche et de l'interprétation de la documentation, un autre de la navigation dans le référentiel, un troisième de la génération de code, un quatrième des scénarios de provisionnement d'accès.

Au-dessus d'eux se trouve un coordinateur qui comprend le type de demande, choisit l'itinéraire et assemble la réponse finale. Cette approche s'aligne mieux avec la structure réelle des données corporatives, où les sources, les règles et les actions diffèrent considérablement les unes des autres.

Ce que le système peut faire

D'après la description du projet, DataCopilot est construit comme un outil de travail pratique, pas comme une démonstration des capacités du modèle. Il couvre les points où un employé doit normalement basculer entre les chats d'assistance, le catalogue de données, les instructions internes et ses propres brouillons. En conséquence, l'utilisateur obtient soit une réponse courte avec le contexte nécessaire, soit un artefact semi-fini qui peut être rapidement adapté à la tâche.

  • Aide à trouver le bon tableau de bord et à comprendre quelles données il contient
  • Explique exactement où l'information est stockée et comment elle se rapporte à d'autres entités
  • Conseille comment soumettre une demande d'accès sans aller au support
  • Répond à des questions spécifiques sur la documentation interne et les règles de fonctionnement du DWH
  • Écrit des scripts qui peuvent être intégrés dans les processus ETL et affinés pour votre pipeline

Un point important ici est que le système fonctionne à l'intersection de la connaissance et de l'action. Il ne fait pas que raconter des documents mais aide aussi à passer à l'étape suivante : préparer une demande, ébaucher un script, raccourcir le chemin vers la table nécessaire. C'est généralement ce qui distingue une IA corporative utile d'une simple "recherche intelligente". Parallèlement, la responsabilité de l'application finale des résultats reste avec l'humain : surtout quand il s'agit d'accès, de migrations de données et de code pour les processus ETL de production.

Ce que cela signifie

L'histoire de DataCopilot montre où l'IA corporative se dirige vraiment : pas vers un seul chatbot omniscient, mais vers un ensemble d'agents spécialisés autour d'un flux de travail spécifique. Pour les équipes qui ont un DWH, un catalogue de tableaux de bord, des réglementations et un flux de questions répétitives, cette approche peut fournir beaucoup plus de valeur qu'un RAG abstrait au-dessus de tous les documents à la fois.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…