Fix Price запустила VLM-сервис контроля полок и ценников в 8 000 магазинах
Fix Price автоматизировала контроль полок и ценников в своих 8 000+ магазинах через сервис компьютерного зрения на базе внешних VLM. Вместо обучения…
AI-обработка оригинала Habr AI; редакция Hamidun News
Fix Price автоматизировала контроль выкладки товаров и ценников в своих 8 000+ магазинах, развернув сервис компьютерного зрения на базе внешних Vision Language Models — без разработки собственных ML-моделей с нуля и без многолетнего цикла обучения.
8 000 магазинов, одна задача
Fix Price — сеть магазинов фиксированных цен с аудиторией десятков миллионов покупателей по России и СНГ. Более 8 000 точек продаж означают тысячи полок, которые ежедневно нужно проверять: правильно ли расставлены товары по планограмме, есть ли ценники у каждой позиции, нет ли пустых мест. Ручной контроль в таком масштабе нереален — нельзя каждый день отправлять ревизора в каждый из 8 000 магазинов.
При этом цена ошибки прямая: пустая полка или неверный ценник — это потерянная продажа здесь и сейчас плюс негативный опыт покупателя, который запоминается надолго. В сети такого размера даже небольшой процент подобных ситуаций складывается в ощутимые финансовые потери. Перед центром аналитики данных Fix Price встала задача: автоматически выявлять нарушения выкладки и ошибки в ценниках — быстро, в промышленном масштабе и без избыточных инвестиций в собственную CV-инфраструктуру.
Почему VLM, а не своя модель
Классический путь в computer vision для ретейла — обучить кастомную нейросеть на размеченных фотографиях полок. Подход рабочий, но требует тысяч аннотированных изображений, команды ML-инженеров, инфраструктуры для обучения и долгого цикла при смене ассортимента. Fix Price выбрала альтернативу — внешние Vision Language Models (VLM).
Это мультимодальные модели, которые умеют анализировать изображение и отвечать на вопросы о нём на естественном языке — принцип, аналогичный GPT-4o Vision или Claude с поддержкой изображений. Ключевые преимущества VLM-подхода в этом кейсе: Быстрый старт без большого размеченного датасета Одна модель одновременно проверяет выкладку, ценники и наличие товара Новые типы проверок добавляются через изменение промпта — без переобучения Гибкость при расширении на новые категории и форматы точек продаж * Снижение затрат на разработку и поддержку по сравнению с кастомным CV ## Как работает сервис Изображения поступают с камер наблюдения или мобильных устройств сотрудников магазина. VLM получает фото и анализирует кадр по набору критериев: соответствие планограмме, наличие ценника у каждой позиции, отсутствие пустых мест на полке.
На выходе — структурированный список нарушений с привязкой к конкретному магазину. Ответственный сотрудник получает сигнал и устраняет проблему до контакта с покупателем. Скорость реакции растёт, ручные обходы с блокнотом — сокращаются.
«Думаю, все из нас знают, как покупатели реагируют на отсутствие ценника или неверную цену на нём — какие чувства вызывает пустая полка, где нет товара, за которым приходишь», —
Кристина Истратова, руководитель центра аналитики данных Fix Price.
Что это значит
Кейс Fix Price показывает: VLM снизили порог входа в промышленный computer vision настолько, что крупный ретейлер запустил рабочий сервис без многолетнего ML-проекта. 8 000 магазинов — это не пилот, а реальная производственная нагрузка. Для остального ретейла это чёткий сигнал: автоматизация контроля полок больше не требует собственной ML-лаборатории.
Хотите не читать про ИИ, а внедрить его?
«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.
Главное из мира ИИ — раз в неделю
7 ключевых событий недели, отобранных вручную. Без шума, репостов и пресс-релизов.
Готово! Проверьте почту — мы отправили подтверждение.