Habr AI→ original

Gemini e busca semântica: AI seleciona móveis com base em plantas com 87% de precisão

Na construção civil e no design de interiores, especialistas ainda passam horas folheando catálogos manualmente para selecionar móveis a partir de um desenho…

Processado por IA de Habr AI; editado por Hamidun News
Gemini e busca semântica: AI seleciona móveis com base em plantas com 87% de precisão
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A seleção de móveis com base em um desenho arquitetônico é uma tarefa que na construção e design de interiores ainda é feita principalmente manualmente. Um especialista pega o desenho, abre o catálogo de um fornecedor e começa a revisar metodicamente as posições: comparando dimensões, materiais, estilo. Um projeto leva de 20 a 40 horas-pessoa apenas nesta etapa.

Quando há múltiplos objetos, os custos se multiplicam proporcionalmente. Uma equipe russa de desenvolvedores decidiu fechar essa lacuna construindo um sistema de IA que automatiza todo o processo de seleção e fornece recomendações com 87% de precisão. O problema situa-se na intersecção da visão computacional e recuperação da informação.

Um desenho arquitetônico é um documento especializado com notações, símbolos convencionais, grades de escala e camadas multiniveladas. Simplesmente reconhecer um objeto em uma imagem não é suficiente: é necessário entender a solução de planejamento como um todo, identificar zonas funcionais, extrair áreas de assento para categorias específicas de móveis e levar em conta as restrições reais de espaço. O coração do sistema é uma arquitetura multimodal com Gemini como coordenador principal.

Este modelo se encarrega de entender o desenho: reconhece o layout, identifica os cômodos, determina onde fica o quarto, onde fica a sala de estar, quais são as zonas de circulação e onde há restrições de altura, iluminação ou configuração de paredes. Isso não é apenas OCR e não é reconhecimento trivial de objetos — Gemini trabalha com a semântica do documento arquitetônico, extraindo dados estruturados para a próxima camada do sistema. Após o desenho ser decomposto em unidades semânticas, entra em ação a busca semântica no catálogo.

Cada item já foi vetorizado: as características do produto — dimensões, material, estilo, paleta de cores, segmento de preço — são transformadas em embeddings vetoriais. O sistema compara os requisitos do desenho com essa representação vetorial e encontra as correspondências mais próximas. O resultado não é apenas uma lista de centenas de itens adequados, mas uma seleção classificada com uma explicação de por que este modelo específico é recomendado para um local particular do plano.

A arquitetura técnica não se limita a dois componentes. Além do Gemini e da busca semântica, o pipeline envolve modelos para pré-processamento de desenhos: normalização de escala, separação de camadas, limpeza de artefatos de digitalização. Desenhos reais de organizações de projeto chegam em diferentes estados — desde exportações CAD limpas até documentos em papel digitalizados com rasgos e manchas.

O sistema deve funcionar de forma estável com toda essa gama sem pré-processamento manual. Alcançar 87% de precisão não foi conseguido na primeira tentativa. A equipe iterou sobre vários nós-chave: a qualidade da análise de desenhos em diferentes formatos, a estratégia de vetorização dos dados do catálogo e o mecanismo de classificação final.

Um desafio particular foram os layouts incomuns — quando um arquiteto usa notações não-padrão ou o desenho contém apenas um fragmento do cômodo. Para casos extremos, adicionaram lógica de fallback e uma camada adicional de validação de resultados. O valor prático do desenvolvimento está em escalar o tempo de trabalho dos especialistas.

Se antes um designer conseguia trabalhar detalhadamente em 2–3 projetos por semana, com o sistema de IA ele verifica e corrige recomendações já prontas em vez de formulá-las do zero. Para construtoras que trabalham com complexos residenciais padrão, isso significa a capacidade de gerenciar dezenas de objetos em paralelo sem aumento proporcional de pessoal. O projeto demonstra como sistemas de IA multimodal estão começando a automatizar tarefas operacionais que há muito eram consideradas muito especializadas para processamento por máquina.

Desenhos arquitetônicos são um tipo complexo de dados não estruturados, e o fato de Gemini lidar com sua análise semântica abre as portas para soluções semelhantes em campos relacionados: esquemas de engenharia, desenhos estruturais, especificações técnicas. O próximo passo lógico é a integração com plataformas BIM e exportação direta de recomendações para a documentação do projeto.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…