Реранжирование
Реранжирование — этап обработки результатов поиска, на котором специализированная модель переупорядочивает предварительно отобранные документы по степени релевантности запросу, повышая точность ответов в RAG-системах.
Реранжирование — метод улучшения качества информационного поиска, при котором набор кандидатов, полученный быстрым первичным поиском по векторному сходству, повторно оценивается более точной cross-encoder-моделью, учитывающей совместный контекст запроса и документа.
На первом этапе (retrieval) из векторной базы извлекаются десятки или сотни документов с помощью bi-encoder: запрос и документ кодируются независимо, сходство вычисляется косинусной мерой — это быстро, но грубо. На втором этапе (reranking) cross-encoder получает пару «запрос + документ» целиком и выдаёт единственную оценку релевантности; совместная обработка значительно точнее, хотя требует существенно больших вычислительных ресурсов.
Без реранжирования RAG-системы нередко возвращают семантически близкие, но фактически нерелевантные фрагменты, что провоцирует галлюцинации или неточные ответы. Добавление этого шага стабильно повышает метрику NDCG@10 на 10–30% в типичных корпоративных приложениях.
В 2025–2026 годах широко применяются специализированные reranker-модели: Cohere Rerank, BGE Reranker от BAAI, компактные модели серии ms-marco-MiniLM. Провайдеры облачных RAG-платформ — Amazon Bedrock, Azure AI Search, Google Vertex AI — интегрировали реранжирование как встроенную опцию конвейера.