Gemini e busca semântica: AI seleciona móveis com base em plantas com 87% de precisão
Na construção civil e no design de interiores, especialistas ainda passam horas folheando catálogos manualmente para selecionar móveis a partir de um desenho…
Processado por IA de Habr AI; editado por Hamidun News
A seleção de móveis com base em um desenho arquitetônico é uma tarefa que na construção e design de interiores ainda é feita principalmente manualmente. Um especialista pega o desenho, abre o catálogo de um fornecedor e começa a revisar metodicamente as posições: comparando dimensões, materiais, estilo. Um projeto leva de 20 a 40 horas-pessoa apenas nesta etapa.
Quando há múltiplos objetos, os custos se multiplicam proporcionalmente. Uma equipe russa de desenvolvedores decidiu fechar essa lacuna construindo um sistema de IA que automatiza todo o processo de seleção e fornece recomendações com 87% de precisão. O problema situa-se na intersecção da visão computacional e recuperação da informação.
Um desenho arquitetônico é um documento especializado com notações, símbolos convencionais, grades de escala e camadas multiniveladas. Simplesmente reconhecer um objeto em uma imagem não é suficiente: é necessário entender a solução de planejamento como um todo, identificar zonas funcionais, extrair áreas de assento para categorias específicas de móveis e levar em conta as restrições reais de espaço. O coração do sistema é uma arquitetura multimodal com Gemini como coordenador principal.
Este modelo se encarrega de entender o desenho: reconhece o layout, identifica os cômodos, determina onde fica o quarto, onde fica a sala de estar, quais são as zonas de circulação e onde há restrições de altura, iluminação ou configuração de paredes. Isso não é apenas OCR e não é reconhecimento trivial de objetos — Gemini trabalha com a semântica do documento arquitetônico, extraindo dados estruturados para a próxima camada do sistema. Após o desenho ser decomposto em unidades semânticas, entra em ação a busca semântica no catálogo.
Cada item já foi vetorizado: as características do produto — dimensões, material, estilo, paleta de cores, segmento de preço — são transformadas em embeddings vetoriais. O sistema compara os requisitos do desenho com essa representação vetorial e encontra as correspondências mais próximas. O resultado não é apenas uma lista de centenas de itens adequados, mas uma seleção classificada com uma explicação de por que este modelo específico é recomendado para um local particular do plano.
A arquitetura técnica não se limita a dois componentes. Além do Gemini e da busca semântica, o pipeline envolve modelos para pré-processamento de desenhos: normalização de escala, separação de camadas, limpeza de artefatos de digitalização. Desenhos reais de organizações de projeto chegam em diferentes estados — desde exportações CAD limpas até documentos em papel digitalizados com rasgos e manchas.
O sistema deve funcionar de forma estável com toda essa gama sem pré-processamento manual. Alcançar 87% de precisão não foi conseguido na primeira tentativa. A equipe iterou sobre vários nós-chave: a qualidade da análise de desenhos em diferentes formatos, a estratégia de vetorização dos dados do catálogo e o mecanismo de classificação final.
Um desafio particular foram os layouts incomuns — quando um arquiteto usa notações não-padrão ou o desenho contém apenas um fragmento do cômodo. Para casos extremos, adicionaram lógica de fallback e uma camada adicional de validação de resultados. O valor prático do desenvolvimento está em escalar o tempo de trabalho dos especialistas.
Se antes um designer conseguia trabalhar detalhadamente em 2–3 projetos por semana, com o sistema de IA ele verifica e corrige recomendações já prontas em vez de formulá-las do zero. Para construtoras que trabalham com complexos residenciais padrão, isso significa a capacidade de gerenciar dezenas de objetos em paralelo sem aumento proporcional de pessoal. O projeto demonstra como sistemas de IA multimodal estão começando a automatizar tarefas operacionais que há muito eram consideradas muito especializadas para processamento por máquina.
Desenhos arquitetônicos são um tipo complexo de dados não estruturados, e o fato de Gemini lidar com sua análise semântica abre as portas para soluções semelhantes em campos relacionados: esquemas de engenharia, desenhos estruturais, especificações técnicas. O próximo passo lógico é a integração com plataformas BIM e exportação direta de recomendações para a documentação do projeto.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.