Técnicas e métodos

Vector Database

Um vector database é um armazenamento de dados construído especificamente para armazenar vetores numéricos de alta dimensionalidade e executar busca rápida de vizinhos mais próximos aproximados (ANN) em milhões ou bilhões deles, possibilitando recuperação semântica em escala.

Enquanto um banco de dados relacional indexa colunas estruturadas e um armazenamento de documentos indexa valores de campos, um vector database indexa vetores de ponto flutuante — os embeddings que representam texto, imagens ou outros dados. Sua consulta primária não é "encontrar linhas onde campo equals valor" mas "encontrar os K vetores mais similares a este vetor de consulta." Isso exige estruturas de índice especializadas porque a comparação por força bruta de cada vetor armazenado contra uma consulta é computacionalmente proibitiva em escala.

Vector databases alcançam busca rápida através de algoritmos de vizinhos mais próximos aproximados (ANN). O mais amplamente adotado é HNSW (Hierarchical Navigable Small Worlds), um índice baseado em grafo no qual cada nó se conecta aos nós próximos; a busca navega o grafo avidamente, sacrificando correção perfeita para ganhos de velocidade de ordens de magnitude. Outras abordagens incluem IVF (Inverted File Index, que particiona o espaço em clusters e busca apenas os relevantes), ScaNN (variante de quantização aprendida do Google) e product quantization, que comprime vetores para reduzir pegada de memória. A maioria dos sistemas de produção expõe parâmetros de trade-off recall-latência para que operadores possam afinar para seus requisitos.

Vector databases são a espinha dorsal da infraestrutura de pipelines de geração aumentada por recuperação, motores de busca semântica e sistemas de recomendação. Sem busca ANN eficiente, sistemas RAG estariam limitados a algumas centenas de documentos em vez de milhões. Consultas híbridas que combinam busca de similaridade ANN com filtros de atributo — por exemplo, restringir a busca a documentos pertencentes a um inquilino específico — são um recurso crítico para implantações SaaS multi-inquilino, e todos os vector databases maduros suportam este padrão.

O mercado consolidou-se em torno de sistemas especializados — Pinecone, Weaviate, Qdrant e Milvus — ao lado de bancos de dados de propósito geral que adicionaram capacidades vetoriais, incluindo PostgreSQL com pgvector, Redis, MongoDB Atlas e Elasticsearch. Todos os principais provedores de nuvem oferecem serviços de busca vetorial gerenciados. Uma tendência notável através de 2025–2026 é o surgimento de índices vetoriais baseados em disco como DiskANN que permitem busca em escala de bilhões sem carregar todos os vetores em RAM, reduzindo significativamente custos de infraestrutura para grandes implantações.

Exemplo

Uma empresa de legal tech armazena embeddings de 50 milhões de cláusulas contratuais no Qdrant; quando um advogado busca por 'cláusulas de indenização excluindo danos consequentes', o índice ANN retorna as 20 cláusulas mais semanticamente similares em menos de 100 milissegundos.

Termos relacionados

Embedding RAG (Retrieval-Augmented Generation)Busca Semântica Chunking

← Glossário