MIT News→ original

IA aprendeu a encontrar objetos personalizados em imagens

Imagine que você está tentando encontrar o brinquedo favorito de seu filho em um quarto bagunçado. Para um ser humano, essa é uma tarefa relativamente…

Processado por IA de MIT News; editado por Hamidun News
IA aprendeu a encontrar objetos personalizados em imagens
Fonte: MIT News. Colagem: Hamidun News.
◐ Ouvir artigo

Imagine que você está tentando encontrar o brinquedo favorito de seu filho em um quarto bagunçado. Para um ser humano, essa é uma tarefa relativamente simples, mas para a inteligência artificial, é um verdadeiro desafio. Um novo desenvolvimento em aprendizado de máquina nos aproxima da solução deste problema. Pesquisadores apresentaram um método que permite que modelos de IA generativa encontrem objetos personalizados em imagens de forma muito mais eficaz.

O problema de identificar objetos únicos em novas cenas é um dos principais desafios na visão por computador. Os modelos existentes geralmente funcionam bem no reconhecimento de categorias gerais de objetos (por exemplo, "cachorro" ou "carro"), mas enfrentam dificuldades quando se trata de uma instância específica e única (por exemplo, "este cachorro específico" ou "este carro específico"). Isso ocorre porque os modelos são treinados em enormes quantidades de dados contendo muitos exemplos de categorias gerais, mas muito menos exemplos de objetos únicos.

O novo método de treinamento resolve esse problema usando dados personalizados. Em vez de treinar o modelo em categorias gerais, os pesquisadores usam imagens de um objeto específico de diferentes ângulos e sob diferentes condições de iluminação. Isso permite que o modelo "aprenda" o objeto e desenvolva a capacidade de identificá-lo mesmo em ambientes desconhecidos. Após o treinamento, um modelo vision-language é capaz de determinar a localização de um item único em uma nova imagem com maior precisão.

Este avanço tem um enorme potencial para vários campos. Em robótica, permitirá que robôs interajam mais efetivamente com seu ambiente e realizem tarefas complexas que exigem a identificação de objetos específicos. Por exemplo, um robô poderia encontrar a ferramenta correta em uma bancada ou entregar um item específico a uma pessoa em particular. No e-commerce, permitirá melhorar a busca de produtos baseada em imagens e oferecer aos usuários resultados mais relevantes. Imagine poder fotografar algo que você gosta, e o sistema encontra automaticamente em lojas online.

O desenvolvimento também é importante para o avanço de sistemas de assistência para pessoas com deficiência. Por exemplo, a tecnologia poderia ajudar pessoas com baixa visão a se orientar no espaço e encontrar os objetos de que precisam. Além disso, pode ser usada em sistemas de segurança para identificar pessoas ou objetos específicos em tempo real.

Em conclusão, o novo método de treinamento de modelos de IA generativa para identificar objetos personalizados é um passo importante no desenvolvimento da visão por computador. Ele abre novas possibilidades para diversos campos, da robótica ao e-commerce e sistemas de assistência para pessoas. No futuro, provavelmente veremos cada vez mais aplicações desta tecnologia, tornando nossas vidas mais simples e convenientes.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…