Habr AI→ original

Fix Price lançou um serviço de VLM para controle de prateleiras e etiquetas de preço em 8.000 lojas

A Fix Price automatizou o controle de prateleiras e etiquetas de preço em suas mais de 8.000 lojas com um serviço de visão computacional baseado em VLMs…

Processado por IA de Habr AI; editado por Hamidun News
Fix Price lançou um serviço de VLM para controle de prateleiras e etiquetas de preço em 8.000 lojas
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A Fix Price automatizou o monitoramento de displays de produtos e etiquetas de preço em suas 8 mil+ lojas, implantando um serviço de visão computacional baseado em Vision Language Models externos — sem desenvolver modelos ML proprietários do zero e sem ciclos de treinamento de vários anos.

8 mil lojas, uma tarefa

A Fix Price é uma rede de lojas de preço fixo com audiência de dezenas de milhões de clientes na Rússia e CEI. Mais de 8 mil pontos de venda significam milhares de prateleiras que precisam ser verificadas todos os dias: os produtos estão dispostos corretamente de acordo com o planograma, há etiqueta de preço para cada item, não há espaços vazios. Controle manual nessa escala é irrealista — não se pode enviar um auditor para cada uma das 8 mil lojas todos os dias.

Ao mesmo tempo, o custo do erro é direto: uma prateleira vazia ou etiqueta de preço incorreta significa uma venda perdida aqui e agora, além de uma experiência negativa do cliente que fica na memória. Em uma rede desse tamanho, até um pequeno percentual de situações assim se acumula em perdas financeiras tangíveis. O centro de análise de dados da Fix Price enfrentou um desafio: detectar automaticamente violações de display e erros de preço — rápido, em escala industrial e sem investimentos excessivos em sua própria infraestrutura de CV.

Por que VLM, não um modelo customizado

A abordagem clássica em visão computacional para varejo é treinar uma rede neural customizada em fotos anotadas de prateleiras. A abordagem funciona, mas exige milhares de imagens anotadas, uma equipe de engenheiros de ML, infraestrutura de treinamento e um longo ciclo quando o sortimento muda. A Fix Price escolheu uma alternativa — Vision Language Models externos (VLM). Esses são modelos multimodais que conseguem analisar uma imagem e responder perguntas sobre ela em linguagem natural — um princípio similar ao GPT-4o Vision ou Claude com suporte a imagens. As principais vantagens da abordagem VLM nesse caso:

  • Início rápido sem um grande dataset anotado
  • Um modelo verifica simultaneamente displays, etiquetas de preço e disponibilidade de produto
  • Novos tipos de verificação são adicionados alterando o prompt — sem retreinamento
  • Flexibilidade ao expandir para novas categorias e formatos de lojas
  • Redução de custos de desenvolvimento e manutenção em comparação com CV customizado

Como o serviço funciona

Imagens chegam de câmeras de vigilância ou dispositivos móveis de funcionários da loja. O VLM recebe uma foto e analisa o quadro de acordo com um conjunto de critérios: conformidade com o planograma, presença de etiqueta de preço para cada item, ausência de espaços vazios na prateleira. O resultado é uma lista estruturada de violações vinculadas a uma loja específica. O funcionário responsável recebe o alerta e corrige o problema antes do contato com o cliente. A velocidade de reação aumenta, as inspeções manuais com caderno diminuem.

"Acho que todos nós sabemos como os clientes reagem à falta de etiqueta de preço ou preço incorreto nela — que sentimentos uma prateleira vazia desperta quando não há o produto que você procura", —

Kristina Istratova, Chefe do Centro de Análise de Dados, Fix Price.

O que isso significa

O caso Fix Price mostra: VLMs baixaram a barreira de entrada para visão computacional industrial tanto que uma grande varejista lançou um serviço funcional sem um projeto de ML de vários anos. 8 mil lojas não é um piloto, mas uma carga de produção real. Para o resto do varejo, este é um sinal claro: automatizar o controle de prateleiras não exige mais seu próprio laboratório de ML.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…