Habr AI→ оригинал

Fix Price запустила VLM-сервис контроля полок и ценников в 8 000 магазинах

Fix Price автоматизировала контроль полок и ценников в своих 8 000+ магазинах через сервис компьютерного зрения на базе внешних VLM. Вместо обучения…

AI-обработка оригинала Habr AI; редакция Hamidun News
Fix Price запустила VLM-сервис контроля полок и ценников в 8 000 магазинах
Источник: Habr AI. Коллаж: Hamidun News.
◐ Слушать статью

Fix Price автоматизировала контроль выкладки товаров и ценников в своих 8 000+ магазинах, развернув сервис компьютерного зрения на базе внешних Vision Language Models — без разработки собственных ML-моделей с нуля и без многолетнего цикла обучения.

8 000 магазинов, одна задача

Fix Price — сеть магазинов фиксированных цен с аудиторией десятков миллионов покупателей по России и СНГ. Более 8 000 точек продаж означают тысячи полок, которые ежедневно нужно проверять: правильно ли расставлены товары по планограмме, есть ли ценники у каждой позиции, нет ли пустых мест. Ручной контроль в таком масштабе нереален — нельзя каждый день отправлять ревизора в каждый из 8 000 магазинов.

При этом цена ошибки прямая: пустая полка или неверный ценник — это потерянная продажа здесь и сейчас плюс негативный опыт покупателя, который запоминается надолго. В сети такого размера даже небольшой процент подобных ситуаций складывается в ощутимые финансовые потери. Перед центром аналитики данных Fix Price встала задача: автоматически выявлять нарушения выкладки и ошибки в ценниках — быстро, в промышленном масштабе и без избыточных инвестиций в собственную CV-инфраструктуру.

Почему VLM, а не своя модель

Классический путь в computer vision для ретейла — обучить кастомную нейросеть на размеченных фотографиях полок. Подход рабочий, но требует тысяч аннотированных изображений, команды ML-инженеров, инфраструктуры для обучения и долгого цикла при смене ассортимента. Fix Price выбрала альтернативу — внешние Vision Language Models (VLM).

Это мультимодальные модели, которые умеют анализировать изображение и отвечать на вопросы о нём на естественном языке — принцип, аналогичный GPT-4o Vision или Claude с поддержкой изображений. Ключевые преимущества VLM-подхода в этом кейсе: Быстрый старт без большого размеченного датасета Одна модель одновременно проверяет выкладку, ценники и наличие товара Новые типы проверок добавляются через изменение промпта — без переобучения Гибкость при расширении на новые категории и форматы точек продаж * Снижение затрат на разработку и поддержку по сравнению с кастомным CV ## Как работает сервис Изображения поступают с камер наблюдения или мобильных устройств сотрудников магазина. VLM получает фото и анализирует кадр по набору критериев: соответствие планограмме, наличие ценника у каждой позиции, отсутствие пустых мест на полке.

На выходе — структурированный список нарушений с привязкой к конкретному магазину. Ответственный сотрудник получает сигнал и устраняет проблему до контакта с покупателем. Скорость реакции растёт, ручные обходы с блокнотом — сокращаются.

«Думаю, все из нас знают, как покупатели реагируют на отсутствие ценника или неверную цену на нём — какие чувства вызывает пустая полка, где нет товара, за которым приходишь», —

Кристина Истратова, руководитель центра аналитики данных Fix Price.

Что это значит

Кейс Fix Price показывает: VLM снизили порог входа в промышленный computer vision настолько, что крупный ретейлер запустил рабочий сервис без многолетнего ML-проекта. 8 000 магазинов — это не пилот, а реальная производственная нагрузка. Для остального ретейла это чёткий сигнал: автоматизация контроля полок больше не требует собственной ML-лаборатории.

ЖХ
Hamidun News
AI‑новости без шума. Ежедневный редакторский отбор из 400+ источников. Продукт Жемала Хамидуна, Head of AI в Alpina Digital.

Хотите не читать про ИИ, а внедрить его?

«AI News» — это полезные новости из мира ИИ. Системно научиться работать с нейросетями и применять их в работе — в Hamidun Academy.

Что вы думаете?
Загружаем комментарии…