Habr AI→ original

VK apresenta DataCopilot — sistema multiagente para dados corporativos e documentação

VK apresentou DataCopilot — um assistente IA interno para repositórios de dados corporativos e documentação. O sistema surgiu de uma auditoria de…

Processado por IA de Habr AI; editado por Hamidun News
VK apresenta DataCopilot — sistema multiagente para dados corporativos e documentação
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

VK apresentou DataCopilot — um sistema multi-agente para dados corporativos e documentação

VK apresentou DataCopilot — um assistente AI interno para trabalhar com um repositório de dados corporativo e documentação especializada. O projeto nasceu não de uma tendência em torno de LLMs, mas da análise de requisições reais de analistas, gerentes e engenheiros que gastam tempo todos os dias em perguntas repetitivas.

Como começaram

A equipe não começou escolhendo um modelo ou projetando outro esquema RAG. Primeiro, VK analisou a rotina em torno do Data Office e da plataforma de dados: quais perguntas chegam ao suporte, o que os funcionários perguntam mais frequentemente em chats, onde as pessoas perdem tempo procurando pelo dashboard certo, descrição de campo ou processo de aprovação. Essa auditoria forneceu uma lista clara de tarefas que poderiam ser automatizadas sem reconstruir todo o DWH e sem tentar criar "inteligência universal" para todos os casos de uma vez.

A partir dessa lista, formaram a imagem do futuro assistente. Ele deveria entender o catálogo de dashboards, explicar o que e onde está armazenado, fornecer dicas sobre documentação corporativa, ajudar com acessos e gerar templates funcionais para ETL. Ou seja, não um chatbot "pelo bem do chat", mas uma interface para os dados e conhecimento interno da empresa.

Para analistas e gerentes, isso economiza tempo; para engenheiros, reduz o fluxo de requisições idênticas.

Por que não RAG

Para alguns requisitos, o RAG clássico realmente funciona: um usuário faz uma pergunta, o sistema encontra documentos relevantes e monta uma resposta com base neles. Mas em um ambiente corporativo, isso rapidamente se torna insuficiente. Uma pergunta pode exigir passar pelo catálogo de dashboards, descrições de tabelas específicas, instruções de acesso e um template de script.

Se tudo isso for entregue a uma única cadeia sem especialização, a qualidade da resposta começa a flutuar, e contexto extra apenas atrapalha. Por isso VK aposta em arquitetura multi-agente — essencialmente, em um enxame de assistentes especializados. Um agente pode ser responsável pela busca e interpretação de documentação, outro pela navegação no repositório, um terceiro pela geração de código, um quarto por cenários de provisionamento de acesso.

Acima deles há um coordenador que entende o tipo de requisição, escolhe a rota e monta a resposta final. Essa abordagem se alinha melhor com a estrutura real dos dados corporativos, onde fontes, regras e ações diferem significativamente uma da outra.

O que o sistema pode fazer

Baseado na descrição do projeto, DataCopilot é construído como uma ferramenta prática de trabalho, não como uma demonstração de capacidades do modelo. Ele cobre os pontos onde um funcionário normalmente tem que alternar entre chats de suporte, o catálogo de dados, instruções internas e seus próprios rascunhos. Como resultado, o usuário obtém ou uma resposta curta com o contexto necessário ou um artefato semi-pronto que pode ser rapidamente adaptado à tarefa.

  • Ajuda a encontrar o dashboard certo e entender quais dados ele contém
  • Explica exatamente onde a informação está armazenada e como se relaciona com outras entidades
  • Aconselha como submeter uma requisição de acesso sem ir ao suporte
  • Responde questões específicas sobre documentação interna e regras de operação do DWH
  • Escreve scripts que podem ser levados para processos ETL e refinados para seu pipeline

Um ponto importante aqui é que o sistema funciona na interseção entre conhecimento e ação. Ele não apenas retell documentos mas também ajuda a dar o próximo passo: preparar uma requisição, esboçar um script, encurtar o caminho até a tabela necessária. Isso é geralmente o que distingue um AI corporativo útil de apenas outro "search inteligente". Ao mesmo tempo, a responsabilidade pela aplicação final dos resultados permanece com o humano: especialmente quando se trata de acesso, migrações de dados e código para processos ETL de produção.

O que isso significa

A história do DataCopilot mostra para onde o AI corporativo realmente está se movendo: não em direção a um único chatbot onisciente, mas em direção a um conjunto de agentes especializados em torno de um fluxo de trabalho específico. Para equipes que têm um DWH, um catálogo de dashboards, regulamentações e um fluxo de perguntas repetitivas, essa abordagem pode entregar muito mais valor do que RAG abstrato em cima de todos os documentos de uma vez.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…