Как AI-агент за один вечер разобрал фотоархив из 36 000 снимков и почту с 2005 года
Разработчик с Хабра потратил один вечер на то, что откладывал 20 лет: разобрал фотоархив из 36 000 файлов и 222 ГБ с помощью AI-агента на локальных моделях…
AI-обработка оригинала Habr AI; редакция Hamidun News
Пользователь Хабра описал, как за один вечер разобрал фотоархив из 36 000 файлов и 222 ГБ, накопленных за 20 лет, — с помощью AI-агента на локальных моделях. Заодно расчистил почту, к которой не прикасались с 2005 года.
Проблема, которую откладывают годами Цифровой мусор накапливается незаметно.
Смартфоны делают дубли, мессенджеры засоряют галерею скриншотами, жёсткие диски переносятся с ноутбука на ноутбук — и через 20 лет получается 222 ГБ хаоса, который страшно трогать. Ручной разбор — это десятки часов монотонной работы. Большинство начинают, доходят до второго часа и бросают. Автор формулирует это точно: «объём убивает любое намерение». Задача психологически неподъёмна не из-за сложности — из-за масштаба. Каждый раз, открывая папку с тысячами фотографий без структуры, мозг отказывается за это браться. Решением стал AI-агент — программа, которая делает всю монотонную работу сама, пока владелец занимается чем-то другим.
Как устроен агент Агент работает локально — ни одно личное фото не уходит на внешние серверы.
Это принципиальный выбор: семейные снимки не становятся обучающими данными для чужих моделей, приватность остаётся на своей стороне. Работа строится в несколько этапов: Сканирование всех папок, включая старые бэкапы и забытые накопители Поиск дублей — по контентному хешу и EXIF-метаданным Определение даты и места съёмки из данных камеры Классификация содержимого через vision-модель: люди, природа, документы, скриншоты Удаление мусора — тёмных кадров, случайных снимков из кармана, очевидных копий Раскладка по структуре: год → событие → тип контента Агент не просто перекладывает файлы — он принимает решения о том, что оставить, а что выбросить, опираясь на визуальный анализ. Принцип human-in-the-loop сохраняется: финальные решения по спорным случаям остаются за пользователем, но их уже единицы, а не тысячи.
Почта с 2005 года Параллельно разбиралась почта — ящик, к которому не прикасались с 2005 года.
Та же история: огромный объём, нет порядка, всё свалено в кучу. Рассылки, уведомления, важные переписки, финансовые чеки — всё перемешано за два десятка лет. Агент прошёлся по письмам, выделил важные треды, удалил рекламу и автоматические уведомления, сохранил документы в отдельных папках.
«Есть задачи, которые не делаются никогда.
Не потому что сложные, а потому что объём убивает любое намерение на втором часу», — пишет автор. За один вечер — расчищенный архив двадцатилетней давности.
Локальные модели как ключ Весь стек — открытые модели на домашнем железе.
Vision-модель классифицирует изображения по содержимому, локальный LLM управляет логикой агента и принимает структурные решения. Никаких API-ключей, никаких абонентских плат, никакой зависимости от внешних сервисов. Повторить опыт может любой, у кого есть современный ноутбук с 16+ ГБ RAM. Не нужен дорогостоящий GPU — локальные модели уровня LLaVA или Ollama работают на обычном железе. Код и подход из статьи адаптируются под любую коллекцию.
Что это значит
Кейс показывает новый класс применений AI-агентов: не офисные задачи и не написание кода, а разгребание личного цифрового наследия, накопленного за годы. У большинства людей такой архив есть, руки до него не доходят годами. Технологии уже доступны и работают на обычном железе. Следующие логичные применения — старые документы и сканы, переписки в мессенджерах, каталогизация личной библиотеки.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.