Habr AI→ original

Telegram-бот с RAG без векторных БД: пример на Cloudflare Workers

Как создать Telegram-бота с функциями поиска по базе знаний без векторных БД и дорогой инфраструктуры? Разработчик подробно показал рабочий стек: TypeScript + T

Telegram-бот с RAG без векторных БД: пример на Cloudflare Workers
Source : Habr AI. Collage: Hamidun News.
◐ Écouter l'article

Telegram-бот с поиском по базе знаний — популярная задача. Обычно для этого используют векторные БД типа Pinecone или Weaviate, эмбеддинги и платную облачную инфраструктуру. Разработчик из Habr показал, что это не обязательно: есть способ дешевле и проще.

Почему векторные БД — не единственный выход RAG (Retrieval-Augmented

Generation) не требует обязательно векторных эмбеддингов. Для базы знаний среднего размера достаточно полнотекстового поиска по ключевым словам. Алгоритм Jaccard вычисляет схожесть двух текстов через пересечение слов — простой, быстрый, не требует машинного обучения.

Вот как это работает в практике: если база содержит FAQ про техподдержку, и пользователь пишет «как перезагрузить устройство», бот разбивает запрос на слова, ищет совпадения в документах, берёт те с наибольшим пересечением и передаёт их в LLM. Результаты могут быть даже лучше, чем с дорогими API для эмбеддингов, если содержимое хорошо структурировано. Быстрее — потому что не нужно ждать генерации эмбеддингов.

Главная выгода: ноль зависимостей от внешних сервисов, кроме одного LLM-API для генерации ответов. История диалогов и сама база знаний хранятся прямо на Cloudflare KV — встроенное хранилище, включённое в бесплатный план. Никакой очереди на развёртывание инфраструктуры, никаких месячных счётов за хранилище векторов.

Как работает архитектура

Поток работает так: пользователь пишет вопрос в Telegram → бот ищет релевантные документы из базы знаний через алгоритм Jaccard → берёт топ-3 результата и передаёт их вместе с вопросом в Groq API (свободный LLM) → Groq генерирует ответ, основываясь на найденных документах → бот отправляет результат в чат. История диалога сохраняется в KV для контекста между сообщениями. Это позволяет боту помнить предыдущие вопросы и уточнять ответы в зависимости от контекста беседы.

Примечательно: Groq выбран не просто так. Это быстрый LLM-сервис с щедрыми лимитами бесплатного плана, идеален для боталка и RAG-систем, где нужна мгновенная генерация ответа. Сама база знаний хранится как набор документов в KV: ключ — ID документа, значение — текст.

При запросе бот загружает все документы, применяет Jaccard к каждому и ранжирует по оценке схожести. Это решение масштабируется до тысяч документов без проблем.

Какой стек нужен

Для реализации понадобится минимум компонентов: TypeScript — язык, на котором пишется весь код, с поддержкой типов Telegraf — легковесная и популярная библиотека для работы с Telegram API Cloudflare Workers — serverless-платформа для деплоя (бесплатный план с щедрыми лимитами) Cloudflare KV — встроенное хранилище для базы знаний и истории диалогов * Groq API — свободный LLM-сервис для генерации ответов на основе найденных документов Деплой происходит одной командой через Wrangler — CLI-утилиту для Cloudflare Workers. Никакого настраивания серверов, не нужен свой хостинг, не нужны Docker-контейнеры. Если бот не выходит за рамки бесплатного плана Workers (миллион запросов в месяц), стоимость будет ровно нулевой. Для сравнения: типичная установка с векторной БД требует минимум $20-50 в месяц только за хранилище.

Что это значит для разработчиков

Это открывает дорогу для простых RAG-систем, которые раньше выглядели слишком дорогими или сложными для реализации. Для небольших команд, стартапов и энтузиастов — это способ быстро запустить AI-бота с поиском по знаниям практически бесплатно. Классический пример: внутриофисный бот, который отвечает по FAQ, корпоративным политикам, техническим гайдам и документации. Раньше такой проект требовал выделения бюджета на инфраструктуру, обслуживания сложной системы. Теперь всё это может жить в одном KV-бакете и запуститься за час. Это особенно полезно для команд, которые хотят быстро добавить AI-функцию без больших инвестиций.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Vous voulez cesser de lire sur l'IA et commencer à l'utiliser?

AI News est un fil d'actualité IA. Hamidun Academy vous apprend à utiliser l'IA dans votre travail.

Qu'en pensez-vous ?
Chargement des commentaires…