Техники и методы

Реранжирование

Реранжирование — этап обработки результатов поиска, на котором специализированная модель переупорядочивает предварительно отобранные документы по степени релевантности запросу, повышая точность ответов в RAG-системах.

Реранжирование — метод улучшения качества информационного поиска, при котором набор кандидатов, полученный быстрым первичным поиском по векторному сходству, повторно оценивается более точной cross-encoder-моделью, учитывающей совместный контекст запроса и документа.

На первом этапе (retrieval) из векторной базы извлекаются десятки или сотни документов с помощью bi-encoder: запрос и документ кодируются независимо, сходство вычисляется косинусной мерой — это быстро, но грубо. На втором этапе (reranking) cross-encoder получает пару «запрос + документ» целиком и выдаёт единственную оценку релевантности; совместная обработка значительно точнее, хотя требует существенно больших вычислительных ресурсов.

Без реранжирования RAG-системы нередко возвращают семантически близкие, но фактически нерелевантные фрагменты, что провоцирует галлюцинации или неточные ответы. Добавление этого шага стабильно повышает метрику NDCG@10 на 10–30% в типичных корпоративных приложениях.

В 2025–2026 годах широко применяются специализированные reranker-модели: Cohere Rerank, BGE Reranker от BAAI, компактные модели серии ms-marco-MiniLM. Провайдеры облачных RAG-платформ — Amazon Bedrock, Azure AI Search, Google Vertex AI — интегрировали реранжирование как встроенную опцию конвейера.

Пример

В корпоративном поисковом ассистенте первичный поиск возвращает 50 фрагментов из базы документов, после чего Cohere Rerank сортирует их по точному соответствию вопросу — в контекст LLM передаются только топ-5.

Связанные термины

Семантический поиск RAG (генерация с дополненной выборкой)Модель эмбеддингов

← Глоссарий