Bloomberg Tech→ original

Apple aprende a ler nos lábios: por que Cupertino precisa da startup israelense Q.ai

Apple está fazendo o que sabe melhor mais uma vez: adquirindo silenciosamente tecnologias que em alguns anos perceberemos como algo completamente natural…

Processado por IA de Bloomberg Tech; editado por Hamidun News
Apple aprende a ler nos lábios: por que Cupertino precisa da startup israelense Q.ai
Fonte: Bloomberg Tech. Colagem: Hamidun News.
◐ Ouvir artigo

Apple está fazendo o que sabe melhor mais uma vez: adquirindo silenciosamente tecnologias que em alguns anos perceberemos como algo completamente natural. Desta vez, o foco caiu sobre a startup israelense Q.ai. Esses caras estão lidando com algo bastante específico, mas extremamente promissor — ensinam algoritmos a entender expressões faciais humanas e literalmente ler sinais não-verbais. Se seu iPhone anteriormente apenas reconhecia seu rosto para desbloquear, em breve ele começará a entender o que você está sentindo e o que está prestes a fazer, mesmo que não pronuncie uma palavra.

Para entender a magnitude deste evento, é necessário recordar o histórico das relações da Apple com engenheiros israelenses. Esta está longe de ser a primeira vez que Cupertino busca talento nesta região. Foi lá que nasceram as tecnologias que formaram a base do FaceID após a compra da PrimeSense. Apple constrói metodicamente um ecossistema onde a interação com um dispositivo se torna a mais natural possível. Já percorremos o caminho dos botões para telas sensíveis ao toque e das telas sensíveis ao toque para a voz. Agora chega a era da interface silenciosa, onde até mesmo a voz se torna redundante.

O que exatamente a Q.ai consegue fazer e por que isso é tão importante agora? Seus desenvolvimentos permitem analisar microexpressões e movimentos musculares faciais com precisão incrível. No contexto da Vision Pro, isso soa como a peça de quebra-cabeça que faltava. Um dos principais problemas dos headsets VR e AR modernos continua sendo transmitir emoções vivas do avatar e controlar sem controladores volumosos. Se o sistema souber que você cerrou ligeiramente a mandíbula ou piscou, poderá interpretar isso como um comando ou mudança de contexto. Isso resolve o problema do constrangimento social, quando o usuário tem que dar comandos Siri em voz alta em lugares públicos, atraindo atenção indesejada.

Mas não é apenas sobre headsets de realidade mista. Imagine uma Siri que não apenas espera uma palavra-chave, mas entende pela sua expressão facial que você está insatisfeito com a resposta ou procurando confirmação de seu pensamento. Esta é uma transição fundamental de IA reativa, que simplesmente responde a consultas, para IA proativa que lê o contexto antes de você formulá-lo. Apple está claramente apostando em multimodalidade. Enquanto Google e OpenAI competem sobre qual chatbot escreve melhor redações, Tim Cook e sua equipe estão construindo uma ponte entre biologia e silício, transformando a câmera em um órgão sensorial completo.

Claro, uma questão razoável sobre privacidade surge aqui. Se Apple começar a coletar dados detalhados sobre como os músculos do nosso rosto se movem em resposta a certo conteúdo, isso se tornará uma mina de ouro para análise comportamental e, simultaneamente, um pesadelo potencial para defensores de privacidade. No entanto, a empresa passou anos construindo uma imagem como defensora da privacidade, deslocando todos os cálculos para o próprio dispositivo. Muito provavelmente, os algoritmos da Q.ai funcionarão localmente dentro dos chips das séries A e M, o que dará à Apple uma enorme vantagem sobre as soluções em nuvem dos concorrentes, que precisam enviar dados para servidores.

A tecnologia de fala silenciosa ou silent speech — isto não é apenas sobre conveniência, mas também sobre inclusividade. Para pessoas com deficiências de fala, os desenvolvimentos da Q.ai poderiam se tornar um verdadeiro salvador, permitindo comunicar com o mundo através de um intermediário digital que entende a menor articulação. Apple sempre deu enorme atenção aos recursos de acessibilidade, e esta aquisição se encaixa perfeitamente em sua filosofia. Vemos como a empresa reúne diferentes direções: de motores de redes neurais a sensores avançados de captura de imagem, criando uma plataforma para o próximo salto tecnológico.

A longo prazo, isso poderia levar ao abandono completo dos métodos de entrada aos quais estamos acostumados em certos cenários. Por que digitar ou falar se o dispositivo entende suas intenções através de expressões faciais? Isso abre portas para usar gadgets em condições de silêncio absoluto ou em lugares muito barulhentos onde a voz é inútil. Cupertino está jogando o longo jogo, e Q.ai é um investimento na década em que a linha entre humano e computador se tornará quase transparente, e os dispositivos começarão a nos entender melhor do que nos entendemos.

Ponto principal: Apple está preparando o terreno para interfaces do futuro, onde o controle acontecerá no nível de intenções e expressões faciais. Estamos prontos para nossos smartphones saberem mais sobre nosso humor do que nossos entes queridos?

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…