Cet article n'est pas encore traduit en français — l'original russe est affiché.
LangChain Blog→ original

New Computer Améliore la Précision de la Recherche en Mémoire de l'Agent de 50% avec LangSmith

New Computer est une startup construisant un assistant IA personnel avec mémoire à long terme. L'équipe a augmenté la précision de recherche de 50% en…

Traité par IA depuis LangChain Blog ; édité par Hamidun News
New Computer Améliore la Précision de la Recherche en Mémoire de l'Agent de 50% avec LangSmith
Source : LangChain Blog. Collage: Hamidun News.
◐ Écouter l'article

Стартап New Computer добился роста точности поиска в системе памяти AI-агента на 50%, применив инструмент наблюдаемости LangSmith. В основе успеха — не новая архитектура, а дисциплинированная методология тестирования промптов.

Зачем агентам долгосрочная память

Продукт New Computer — персональный AI-ассистент, который по-настоящему помнит пользователя: его предпочтения, прошлые разговоры, привычки и жизненный контекст. Такой подход принципиально отличает ассистента от обычного чат-бота, который каждый раз начинает с чистого листа. Реализация долгосрочной памяти — технически нетривиальная задача. Нельзя просто сохранять всё сказанное и каждый раз отправлять это в контекст модели: объём данных растёт, а стоимость запросов делает такой подход нежизнеспособным. Вместо этого системы памяти строятся на принципе поиска: из накопленной базы извлекаются только релевантные фрагменты. Здесь и возникает метрика recall (полнота поиска): насколько часто система находит именно те воспоминания, которые нужны прямо сейчас. Низкий recall означает, что агент «не вспоминает» важные детали даже тогда, когда они есть в базе. Для персонального ассистента — это критическая проблема.

Что дал

LangSmith LangSmith — инструмент наблюдаемости от LangChain: он логирует каждый шаг работы LLM-приложения, позволяет создавать тестовые датасеты и сравнивать версии системы в наглядном интерфейсе. Команда New Computer выстроила итерационный процесс вокруг нескольких функций: Comparison View — визуальное сопоставление двух прогонов: видно, какие сценарии улучшились, а какие деградировали Отслеживание регрессий — автоматическое выявление случаев, где новая версия системы проигрывает предыдущей Быстрый цикл итераций — изменил промпт → запустил тест → сравнил результаты → принял или откатил Логирование разговоров — полная история запросов помогла выявить паттерны, при которых поиск по памяти давал сбой Главный инсайт: без структурированного сравнения регрессии оставались невидимыми. Когда промпт улучшал одни сценарии, он незаметно ломал другие.

LangSmith сделал эти поломки заметными сразу — до попадания изменений в продакшн.

От интуиции к измеримым результатам

До внедрения LangSmith команда работала по принципу «попробовали — кажется, лучше». Субъективные оценки не позволяли уверенно сравнивать версии: слишком много переменных, слишком мало измеримых данных. После перехода к сравнительному тестированию каждое изменение промпта стало проходить через набор тестовых сценариев. Результаты фиксировались, сопоставлялись с предыдущей версией — и только после подтверждённого улучшения изменения принимались. Регрессия превратилась из случайного «что-то сломалось» в диагностируемую, управляемую проблему. Итог — рост recall на 50%: агент стал на полтора раза чаще находить релевантные воспоминания из прошлых разговоров. Для персонального ассистента, чья ценность измеряется качеством памяти, — это принципиальное улучшение продукта.

Что это значит

Кейс New Computer показывает: качество AI-продукта сегодня определяется не только архитектурой или выбором базовой модели, но и системой наблюдаемости. Команды, которые видят свои регрессии в реальном времени, итерируют быстрее — и это напрямую конвертируется в метрики. Инструменты вроде LangSmith переводят разработку LLM-приложений из режима «кажется, работает» в режим измеримых, воспроизводимых улучшений.

ZK
Hamidun News
Actualités IA sans bruit. Sélection éditoriale quotidienne de plus de 400 sources. Produit de Zhemal Khamidun, Head of AI chez Alpina Digital.

Besoin d'une IA qui travaille dans votre entreprise — pas seulement dans votre fil d'actualité?

Je construis de l'IA en production pour les entreprises — CRM sur mesure, outils internes, agents autonomes, automatisation des processus. Vous en êtes propriétaire, adaptée à votre processus, sans coût par utilisateur. Réalisé par Zhemal Khamidun, CPO d'AlpinaGPT (plateforme IA, 6 000+ utilisateurs).

Qu'en pensez-vous ?
Chargement des commentaires…