Habr AI→ оригинал

Инженер четыре месяца диктовал дневник AI-агенту — и понял, что память важнее модели

Разработчик четыре месяца диктовал личный дневник голосовыми сообщениями в Telegram. Старый игровой ноутбук распознавал речь через faster-whisper, сохранял…

AI-обработка оригинала Habr AI; редакция Hamidun News
Инженер четыре месяца диктовал дневник AI-агенту — и понял, что память важнее модели
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Разработчик провёл четыре месяца, ежедневно диктуя личный дневник голосовыми сообщениями в Telegram, и обнаружил неожиданное: в AI-системах надёжная память важнее мощности самой модели.

Как устроена система

Схема на первый взгляд простая: голосовые сообщения в Telegram → распознавание речи через faster-whisper на старом игровом ноутбуке → сохранение в Markdown-файлы → AI-агент собирает месячные отчёты и ищет закономерности в жизни пользователя. Всё работает локально, без облачных сервисов и платных API. Это принципиальная часть архитектуры: система должна работать каждый день без привязки к внешним сервисам и их сбоям. Старый игровой ноутбук справляется — faster-whisper достаточно быстр даже без топовой видеокарты. Стоимость эксплуатации минимальная. Основные расходы — запросы к LLM при генерации месячных отчётов, но при разумной частоте это вписывается в несколько долларов в месяц.

Переломный момент и главный урок

Всё шло нормально, пока AI не начал уверенно объяснять «закономерности» в жизни автора — хотя на самом деле не читал большую часть архива. Агент не предупредил, что контекст неполный. Он просто достраивал связи там, где данных не было.

«Самая важная часть системы — не LLM и не агент, а память, которой можно доверять», — делает вывод автор.

Это изменило приоритеты при разработке. Качество хранилища, покрытие архива, надёжность индексирования — всё это оказалось важнее выбора между разными языковыми моделями. Если агент не видит полного контекста, он будет строить ложные паттерны вне зависимости от того, насколько мощна базовая модель.

Что мешало на практике

Четыре месяца реального использования вскрыли несколько проблем, которые не очевидны в демо-режиме: faster-whisper стабильно ошибается на именах собственных, иностранных терминах и аббревиатурах Голос в шумной обстановке даёт много артефактов — записи приходится проверять Markdown-файлы без структурированных метаданных плохо поддаются поиску по дате и теме Агент без доступа к полному архиву строит ложные паттерны и не предупреждает об этом * Месячные отчёты без дедупликации повторяют одни и те же темы снова и снова Часть проблем решается постобработкой транскрипций. Часть требует переосмысления самой архитектуры хранилища.

Что можно переделать Автор приходит к нескольким конкретным выводам.

Транскрипции нужно обогащать метаданными: дата, настроение, ключевые темы — тогда агент сможет точнее фильтровать нужные фрагменты, не читая весь архив целиком. Система должна явно сообщать, какой процент архива был прочитан при формировании ответа. Молчаливая галлюцинация — главная опасность любого агента с долгосрочной памятью. Стоит также разделить «горячую» память последних недель и «холодный» архив, обращаясь к нему только при явном запросе на исторический анализ.

Что это значит Личные AI-дневники — рабочий формат, который реально меняет рефлексию и самоанализ.

Но их ценность определяет не модель, а качество памяти. Прежде чем выбирать LLM и настраивать агента, стоит спроектировать хранилище, которое агент не сможет «дофантазировать».

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…