Техники и методы

Векторная база данных

Векторная база данных — специализированная система хранения и поиска, оптимизированная для нахождения эмбеддингов, ближайших по расстоянию к запросу, среди миллионов или миллиардов векторов за миллисекунды.

Векторная база данных — программная система, предназначенная для хранения числовых векторов (эмбеддингов) и выполнения над ними приближённого поиска ближайших соседей (Approximate Nearest Neighbor, ANN). В отличие от реляционных СУБД, оптимизированных для точных совпадений и диапазонных запросов, векторные базы данных решают задачу «найти K векторов, наиболее похожих на вектор-запрос» — ключевой операционный примитив для семантического поиска, рекомендательных систем и RAG-архитектур.

Производительность достигается за счёт специализированных индексных структур. HNSW (Hierarchical Navigable Small World) строит многоуровневый граф связей между векторами, обеспечивая поиск за O(log N) вместо O(N). IVF (Inverted File Index) разбивает векторное пространство на кластеры для ускорения перебора. Среди продуктов: Pinecone (managed cloud), Weaviate и Qdrant (open-source, реализован на Rust), Milvus (LF AI & Data), PostgreSQL-расширение pgvector. Традиционные системы — Elasticsearch, Redis, MongoDB — добавили поддержку векторного поиска как отдельный модуль.

Векторные базы данных стали инфраструктурным фундаментом для RAG-систем, корпоративных поисковиков и рекомендательных движков. Они позволяют AI-ассистентам работать с содержимым сотен тысяч документов без включения их в контекстное окно языковой модели, которое ограничено по размеру и дорого в обработке.

К 2026 году рынок векторных баз данных оценивается в несколько миллиардов долларов. Pinecone и Qdrant активно развиваются в enterprise-сегменте, pgvector стал стандартным выбором для команд, не желающих вводить отдельную инфраструктуру. На бенчмарках ANN Benchmarks лидирующие системы достигают десятков тысяч запросов в секунду при точности поиска выше 99% для векторов размерности 1536. Конкуренция между специализированными решениями и расширениями традиционных СУБД остаётся высокой.

Пример

Корпоративный поисковик по внутренней документации хранит эмбеддинги 200 000 фрагментов в Qdrant; при запросе сотрудника система за несколько миллисекунд возвращает десять наиболее семантически близких фрагментов, которые языковая модель использует для формирования ответа со ссылками на источники.

Связанные термины

Эмбеддинг (векторное представление)RAG (генерация с дополненной выборкой)Семантический поиск Чанкинг

← Глоссарий