Bloomberg Tech→ original

Apple aprende a leer los labios: por qué Cupertino necesita la startup israelí Q.ai

Apple está haciendo lo que mejor sabe hacer una vez más: adquiriendo silenciosamente tecnologías que en un par de años percibiremos como algo completamente…

Procesado por IA desde Bloomberg Tech; editado por Hamidun News
Apple aprende a leer los labios: por qué Cupertino necesita la startup israelí Q.ai
Fuente: Bloomberg Tech. Collage: Hamidun News.
◐ Escuchar artículo

Apple está haciendo lo que mejor sabe hacer una vez más: adquiriendo silenciosamente tecnologías que en un par de años percibiremos como algo completamente natural. Esta vez, el foco cayó en la startup israelí Q.ai. Estos chicos están tratando con algo bastante específico, pero extremadamente prometedor — enseñan a los algoritmos a entender las expresiones faciales humanas y leer literalmente señales no verbales. Si su iPhone anteriormente solo reconocía su cara para desbloquearla, pronto comenzará a entender qué está sintiendo y qué está a punto de hacer, incluso si no dice una palabra.

Para entender la magnitud de este evento, es necesario recordar el historial de las relaciones de Apple con ingenieros israelíes. Esta está lejos de ser la primera vez que Cupertino busca talento en esta región. Fue allí donde nacieron las tecnologías que formaron la base del FaceID tras la compra de PrimeSense. Apple construye metódicamente un ecosistema donde la interacción con un dispositivo se vuelve lo más natural posible. Ya hemos recorrido el camino de los botones a las pantallas táctiles y de las pantallas táctiles a la voz. Ahora llega la era de la interfaz silenciosa, donde incluso la voz se vuelve redundante.

¿Qué exactamente puede hacer Q.ai y por qué es tan importante ahora? Sus desarrollos permiten analizar microexpresiones y movimientos musculares faciales con una precisión increíble. En el contexto de Vision Pro, esto suena como la pieza de rompecabezas que faltaba. Uno de los principales problemas de los auriculares VR y AR modernos sigue siendo transmitir las emociones vivas del avatar y controlar sin controles voluminosos. Si el sistema sabe que ha apretado ligeramente la mandíbula o entrecerrado los ojos, podrá interpretar esto como un comando o cambio de contexto. Esto resuelve el problema de la torpeza social, cuando el usuario tiene que dar comandos a Siri en voz alta en lugares públicos, atrayendo una atención indeseada.

Pero no se trata solo de auriculares de realidad mixta. Imagina una Siri que no solo espera una palabra clave, sino que entiende por tu expresión facial que estás insatisfecho con la respuesta o buscas confirmación de tu pensamiento. Esta es una transición fundamental de la IA reactiva, que simplemente responde a consultas, a la IA proactiva que lee el contexto antes de que lo formules. Apple está claramente apostando por la multimodalidad. Mientras que Google y OpenAI compiten sobre cuyo chatbot escribe mejor ensayos, Tim Cook y su equipo están construyendo un puente entre la biología y el silicio, convirtiendo la cámara en un órgano sensorial completo.

Por supuesto, una pregunta razonable sobre la privacidad surge aquí. Si Apple comienza a recopilar datos detallados sobre cómo se mueven los músculos de nuestra cara en respuesta a cierto contenido, esto se convertirá en una mina de oro para el análisis del comportamiento y, simultáneamente, en una pesadilla potencial para los defensores de la privacidad. Sin embargo, la empresa ha pasado años construyendo una imagen como defensora de la privacidad, trasladando todos los cálculos al dispositivo mismo.

Lo más probable es que los algoritmos de Q.ai funcionen localmente dentro de los chips de las series A y M, lo que le dará a Apple una enorme ventaja sobre las soluciones en la nube de los competidores, que necesitan enviar datos a servidores.

La tecnología de habla silenciosa o silent speech — esto no es solo sobre conveniencia, sino también sobre inclusividad. Para las personas con discapacidades del habla, los desarrollos de Q.ai podrían convertirse en un verdadero salvavidas, permitiéndoles comunicarse con el mundo a través de un intermediario digital que entiende la más leve articulación. Apple siempre ha prestado una enorme atención a las funciones de accesibilidad, y esta adquisición encaja perfectamente en su filosofía. Vemos cómo la empresa reúne diferentes direcciones: desde motores de redes neuronales hasta sensores avanzados de captura de imágenes, creando una plataforma para el próximo salto tecnológico.

A largo plazo, esto podría llevar al abandono completo de los métodos de entrada a los que estamos acostumbrados en ciertos escenarios. ¿Por qué escribir o hablar si el dispositivo entiende tus intenciones a través de expresiones faciales? Esto abre las puertas para usar gadgets en condiciones de silencio absoluto o en lugares muy ruidosos donde la voz es inútil. Cupertino está jugando el largo juego, y Q.ai es una inversión en la década en que la línea entre humano y computadora se vuelva casi transparente, y los dispositivos comiencen a entendernos mejor de lo que nos entendemos a nosotros mismos.

Punto principal: Apple está preparando el terreno para las interfaces del futuro, donde el control sucederá al nivel de intenciones y expresiones faciales. ¿Estamos listos para que nuestros smartphones sepan más sobre nuestro estado de ánimo que nuestros seres queridos?

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…