Habr AI→ оригинал

Telegram-бот с RAG без векторных БД: пример на Cloudflare Workers

Как создать Telegram-бота с функциями поиска по базе знаний без векторных БД и дорогой инфраструктуры? Разработчик подробно показал рабочий стек: TypeScript + T

Telegram-бот с RAG без векторных БД: пример на Cloudflare Workers
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Telegram-бот с поиском по базе знаний — популярная задача. Обычно для этого используют векторные БД типа Pinecone или Weaviate, эмбеддинги и платную облачную инфраструктуру. Разработчик из Habr показал, что это не обязательно: есть способ дешевле и проще.

Почему векторные БД — не единственный выход RAG (Retrieval-Augmented

Generation) не требует обязательно векторных эмбеддингов. Для базы знаний среднего размера достаточно полнотекстового поиска по ключевым словам. Алгоритм Jaccard вычисляет схожесть двух текстов через пересечение слов — простой, быстрый, не требует машинного обучения.

Вот как это работает в практике: если база содержит FAQ про техподдержку, и пользователь пишет «как перезагрузить устройство», бот разбивает запрос на слова, ищет совпадения в документах, берёт те с наибольшим пересечением и передаёт их в LLM. Результаты могут быть даже лучше, чем с дорогими API для эмбеддингов, если содержимое хорошо структурировано. Быстрее — потому что не нужно ждать генерации эмбеддингов.

Главная выгода: ноль зависимостей от внешних сервисов, кроме одного LLM-API для генерации ответов. История диалогов и сама база знаний хранятся прямо на Cloudflare KV — встроенное хранилище, включённое в бесплатный план. Никакой очереди на развёртывание инфраструктуры, никаких месячных счётов за хранилище векторов.

Как работает архитектура

Поток работает так: пользователь пишет вопрос в Telegram → бот ищет релевантные документы из базы знаний через алгоритм Jaccard → берёт топ-3 результата и передаёт их вместе с вопросом в Groq API (свободный LLM) → Groq генерирует ответ, основываясь на найденных документах → бот отправляет результат в чат. История диалога сохраняется в KV для контекста между сообщениями. Это позволяет боту помнить предыдущие вопросы и уточнять ответы в зависимости от контекста беседы.

Примечательно: Groq выбран не просто так. Это быстрый LLM-сервис с щедрыми лимитами бесплатного плана, идеален для боталка и RAG-систем, где нужна мгновенная генерация ответа. Сама база знаний хранится как набор документов в KV: ключ — ID документа, значение — текст.

При запросе бот загружает все документы, применяет Jaccard к каждому и ранжирует по оценке схожести. Это решение масштабируется до тысяч документов без проблем.

Какой стек нужен

Для реализации понадобится минимум компонентов: TypeScript — язык, на котором пишется весь код, с поддержкой типов Telegraf — легковесная и популярная библиотека для работы с Telegram API Cloudflare Workers — serverless-платформа для деплоя (бесплатный план с щедрыми лимитами) Cloudflare KV — встроенное хранилище для базы знаний и истории диалогов * Groq API — свободный LLM-сервис для генерации ответов на основе найденных документов Деплой происходит одной командой через Wrangler — CLI-утилиту для Cloudflare Workers. Никакого настраивания серверов, не нужен свой хостинг, не нужны Docker-контейнеры. Если бот не выходит за рамки бесплатного плана Workers (миллион запросов в месяц), стоимость будет ровно нулевой. Для сравнения: типичная установка с векторной БД требует минимум $20-50 в месяц только за хранилище.

Что это значит для разработчиков

Это открывает дорогу для простых RAG-систем, которые раньше выглядели слишком дорогими или сложными для реализации. Для небольших команд, стартапов и энтузиастов — это способ быстро запустить AI-бота с поиском по знаниям практически бесплатно. Классический пример: внутриофисный бот, который отвечает по FAQ, корпоративным политикам, техническим гайдам и документации. Раньше такой проект требовал выделения бюджета на инфраструктуру, обслуживания сложной системы. Теперь всё это может жить в одном KV-бакете и запуститься за час. Это особенно полезно для команд, которые хотят быстро добавить AI-функцию без больших инвестиций.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…