Techniques et méthodes

Base de données vectorielle

Une base de données vectorielle est un système de stockage spécialisé pour des vecteurs numériques de haute dimensionnalité, permettant une recherche rapide par plus proches voisins approximés (ANN) sur des millions ou des milliards d'éléments, et facilitant la récupération sémantique à l'échelle.

Tandis qu'une base de données relationnelle indexe des colonnes structurées et un magasin de documents indexe les valeurs de champs, une base de données vectorielle indexe des vecteurs en virgule flottante — les embeddings qui représentent du texte, des images ou d'autres données. Sa requête principale n'est pas « trouver les lignes où le champ égale la valeur » mais « trouver les K vecteurs les plus similaires à ce vecteur de requête ». Cela nécessite des structures d'index spécialisées car la comparaison par force brute de chaque vecteur stocké par rapport à une requête est computationnellement prohibitive à l'échelle.

Les bases de données vectorielles accomplissent une recherche rapide via les algorithmes de plus proches voisins approximés (ANN). Le plus largement adopté est HNSW (Hierarchical Navigable Small Worlds), un index basé sur des graphes où chaque nœud se connecte à des nœuds proches ; la recherche navigue dans le graphe de manière avide, sacrifiant la correction parfaite pour des gains de vitesse d'ordres de grandeur. D'autres approches incluent IVF (Inverted File Index, qui partitionne l'espace en clusters et ne recherche que les clusters pertinents), ScaNN (variante de quantification apprise de Google), et la quantification de produit, qui compresse les vecteurs pour réduire l'empreinte mémoire. La plupart des systèmes de production exposent des paramètres de compromis recall-latence permettant aux opérateurs d'ajuster selon leurs besoins.

Les bases de données vectorielles sont l'épine dorsale infrastructurelle des pipelines de génération augmentée par récupération, des moteurs de recherche sémantique et des systèmes de recommandation. Sans une recherche ANN efficace, les systèmes RAG seraient limités à quelques centaines de documents plutôt qu'à des millions. Les requêtes hybrides qui combinent la recherche de similarité ANN avec des filtres d'attributs — par exemple, limiter la recherche aux documents appartenant à un locataire spécifique — sont une caractéristique critique pour les déploiements SaaS multi-locataires, et toutes les bases de données vectorielles matures supportent ce modèle.

Le marché s'est consolidé autour de systèmes spécialisés — Pinecone, Weaviate, Qdrant et Milvus — aux côtés des bases de données polyvalentes qui ont ajouté des capacités vectorielles, incluant PostgreSQL avec pgvector, Redis, MongoDB Atlas et Elasticsearch. Tous les grands fournisseurs de cloud proposent des services de recherche vectorielle gérés. Une tendance notable de 2025–2026 est l'émergence des index vectoriels basés sur le disque tels que DiskANN qui permettent une recherche à l'échelle du milliard sans charger tous les vecteurs en mémoire RAM, réduisant significativement les coûts d'infrastructure pour les déploiements à grande échelle.

Exemple

Une entreprise de technologie juridique stocke les embeddings de 50 millions de clauses contractuelles dans Qdrant ; lorsqu'un avocat cherche « clauses d'indemnisation excluant les dommages indirects », l'index ANN retourne les 20 clauses sémantiquement les plus similaires en moins de 100 millisecondes.

Termes liés

Embedding RAG (Génération Augmentée par Récupération)Recherche sémantique Chunking

Dernières actualités sur le sujet

Le module NGT Memory montre comment donner une mémoire persistante aux LLM sans base de données vectorielle2026-04-30

← Glossaire