New Computer Aumentó la Precisión de Búsqueda de Memoria del Agente en 50% con LangSmith
New Computer es una startup que construye un asistente de IA personal con memoria a largo plazo. El equipo mejoró la precisión de búsqueda en un 50%…
Procesado por IA desde LangChain Blog; editado por Hamidun News
Стартап New Computer добился роста точности поиска в системе памяти AI-агента на 50%, применив инструмент наблюдаемости LangSmith. В основе успеха — не новая архитектура, а дисциплинированная методология тестирования промптов.
Зачем агентам долгосрочная память
Продукт New Computer — персональный AI-ассистент, который по-настоящему помнит пользователя: его предпочтения, прошлые разговоры, привычки и жизненный контекст. Такой подход принципиально отличает ассистента от обычного чат-бота, который каждый раз начинает с чистого листа. Реализация долгосрочной памяти — технически нетривиальная задача. Нельзя просто сохранять всё сказанное и каждый раз отправлять это в контекст модели: объём данных растёт, а стоимость запросов делает такой подход нежизнеспособным. Вместо этого системы памяти строятся на принципе поиска: из накопленной базы извлекаются только релевантные фрагменты. Здесь и возникает метрика recall (полнота поиска): насколько часто система находит именно те воспоминания, которые нужны прямо сейчас. Низкий recall означает, что агент «не вспоминает» важные детали даже тогда, когда они есть в базе. Для персонального ассистента — это критическая проблема.
Что дал
LangSmith LangSmith — инструмент наблюдаемости от LangChain: он логирует каждый шаг работы LLM-приложения, позволяет создавать тестовые датасеты и сравнивать версии системы в наглядном интерфейсе. Команда New Computer выстроила итерационный процесс вокруг нескольких функций: Comparison View — визуальное сопоставление двух прогонов: видно, какие сценарии улучшились, а какие деградировали Отслеживание регрессий — автоматическое выявление случаев, где новая версия системы проигрывает предыдущей Быстрый цикл итераций — изменил промпт → запустил тест → сравнил результаты → принял или откатил Логирование разговоров — полная история запросов помогла выявить паттерны, при которых поиск по памяти давал сбой Главный инсайт: без структурированного сравнения регрессии оставались невидимыми. Когда промпт улучшал одни сценарии, он незаметно ломал другие.
LangSmith сделал эти поломки заметными сразу — до попадания изменений в продакшн.
От интуиции к измеримым результатам
До внедрения LangSmith команда работала по принципу «попробовали — кажется, лучше». Субъективные оценки не позволяли уверенно сравнивать версии: слишком много переменных, слишком мало измеримых данных. После перехода к сравнительному тестированию каждое изменение промпта стало проходить через набор тестовых сценариев. Результаты фиксировались, сопоставлялись с предыдущей версией — и только после подтверждённого улучшения изменения принимались. Регрессия превратилась из случайного «что-то сломалось» в диагностируемую, управляемую проблему. Итог — рост recall на 50%: агент стал на полтора раза чаще находить релевантные воспоминания из прошлых разговоров. Для персонального ассистента, чья ценность измеряется качеством памяти, — это принципиальное улучшение продукта.
Что это значит
Кейс New Computer показывает: качество AI-продукта сегодня определяется не только архитектурой или выбором базовой модели, но и системой наблюдаемости. Команды, которые видят свои регрессии в реальном времени, итерируют быстрее — и это напрямую конвертируется в метрики. Инструменты вроде LangSmith переводят разработку LLM-приложений из режима «кажется, работает» в режим измеримых, воспроизводимых улучшений.
¿Necesitas IA funcionando dentro de tu empresa — no solo en tu feed de noticias?
Construyo IA en producción para empresas — CRM a medida, herramientas internas, agentes autónomos, automatización de procesos. Tuya, adaptada a tu proceso, sin coste por usuario. Creado por Zhemal Khamidun, CPO de AlpinaGPT (plataforma de IA, 6.000+ usuarios).
Lo esencial de la IA — una vez por semana
Siete historias que de verdad importaron, elegidas a mano. Sin ruido ni notas de prensa.
¡Listo! Revisa tu correo para la confirmación.