Fix Price lançou um serviço de VLM para controle de prateleiras e etiquetas de preço em 8.000 lojas
A Fix Price automatizou o controle de prateleiras e etiquetas de preço em suas mais de 8.000 lojas com um serviço de visão computacional baseado em VLMs…
Processado por IA de Habr AI; editado por Hamidun News
A Fix Price automatizou o monitoramento de displays de produtos e etiquetas de preço em suas 8 mil+ lojas, implantando um serviço de visão computacional baseado em Vision Language Models externos — sem desenvolver modelos ML proprietários do zero e sem ciclos de treinamento de vários anos.
8 mil lojas, uma tarefa
A Fix Price é uma rede de lojas de preço fixo com audiência de dezenas de milhões de clientes na Rússia e CEI. Mais de 8 mil pontos de venda significam milhares de prateleiras que precisam ser verificadas todos os dias: os produtos estão dispostos corretamente de acordo com o planograma, há etiqueta de preço para cada item, não há espaços vazios. Controle manual nessa escala é irrealista — não se pode enviar um auditor para cada uma das 8 mil lojas todos os dias.
Ao mesmo tempo, o custo do erro é direto: uma prateleira vazia ou etiqueta de preço incorreta significa uma venda perdida aqui e agora, além de uma experiência negativa do cliente que fica na memória. Em uma rede desse tamanho, até um pequeno percentual de situações assim se acumula em perdas financeiras tangíveis. O centro de análise de dados da Fix Price enfrentou um desafio: detectar automaticamente violações de display e erros de preço — rápido, em escala industrial e sem investimentos excessivos em sua própria infraestrutura de CV.
Por que VLM, não um modelo customizado
A abordagem clássica em visão computacional para varejo é treinar uma rede neural customizada em fotos anotadas de prateleiras. A abordagem funciona, mas exige milhares de imagens anotadas, uma equipe de engenheiros de ML, infraestrutura de treinamento e um longo ciclo quando o sortimento muda. A Fix Price escolheu uma alternativa — Vision Language Models externos (VLM). Esses são modelos multimodais que conseguem analisar uma imagem e responder perguntas sobre ela em linguagem natural — um princípio similar ao GPT-4o Vision ou Claude com suporte a imagens. As principais vantagens da abordagem VLM nesse caso:
- Início rápido sem um grande dataset anotado
- Um modelo verifica simultaneamente displays, etiquetas de preço e disponibilidade de produto
- Novos tipos de verificação são adicionados alterando o prompt — sem retreinamento
- Flexibilidade ao expandir para novas categorias e formatos de lojas
- Redução de custos de desenvolvimento e manutenção em comparação com CV customizado
Como o serviço funciona
Imagens chegam de câmeras de vigilância ou dispositivos móveis de funcionários da loja. O VLM recebe uma foto e analisa o quadro de acordo com um conjunto de critérios: conformidade com o planograma, presença de etiqueta de preço para cada item, ausência de espaços vazios na prateleira. O resultado é uma lista estruturada de violações vinculadas a uma loja específica. O funcionário responsável recebe o alerta e corrige o problema antes do contato com o cliente. A velocidade de reação aumenta, as inspeções manuais com caderno diminuem.
"Acho que todos nós sabemos como os clientes reagem à falta de etiqueta de preço ou preço incorreto nela — que sentimentos uma prateleira vazia desperta quando não há o produto que você procura", —
Kristina Istratova, Chefe do Centro de Análise de Dados, Fix Price.
O que isso significa
O caso Fix Price mostra: VLMs baixaram a barreira de entrada para visão computacional industrial tanto que uma grande varejista lançou um serviço funcional sem um projeto de ML de vários anos. 8 mil lojas não é um piloto, mas uma carga de produção real. Para o resto do varejo, este é um sinal claro: automatizar o controle de prateleiras não exige mais seu próprio laboratório de ML.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.