The Verge→ original

Google Gemini Aprende a Generar Modelos 3D Interactivos y Simulaciones

Google ha añadido a Gemini la capacidad de generar modelos 3D interactivos y simulaciones físicas directamente en respuesta a las preguntas de los usuarios…

Procesado por IA desde The Verge; editado por Hamidun News
Google Gemini Aprende a Generar Modelos 3D Interactivos y Simulaciones
Fuente: The Verge. Collage: Hamidun News.
◐ Escuchar artículo

Google ha actualizado Gemini: ahora el chatbot puede generar modelos 3D interactivos y simulaciones físicas directamente en la conversación. Solo hay que hacer una pregunta — y en lugar de un texto estático o una imagen, el sistema construye un objeto con el que se puede interactuar en tiempo real. Esta es una de las expansiones más notables de formatos de respuesta en modelos de lenguaje grandes en los últimos meses.

La función funciona de la siguiente manera: en respuesta a una solicitud, Gemini crea un modelo tridimensional con un conjunto de elementos de control interactivos. El usuario puede rotar el objeto con el ratón, mover controles deslizantes, introducir valores numéricos — e inmediatamente ver cómo cambia el comportamiento del sistema. Sin descargas, transiciones a servicios de terceros o espera de renderizado: todo sucede dentro de la interfaz del chat, sin herramientas adicionales.

Esta es una diferencia fundamental respecto a situaciones en las que un chatbot simplemente generaba un enlace a una simulación externa u ofrecía descargar un archivo. Un editor de The Verge probó la función con un ejemplo específico. Le pidió a Gemini que construyera una simulación de la Luna orbitando la Tierra — sin código ni configuración previa.

El chatbot generó una escena tridimensional con varias herramientas de control: un control deslizante para ajustar la velocidad orbital, un conmutador para controlar la visibilidad de la trayectoria orbital y un botón de pausa. La física funcionó correctamente, los objetos se movieron con suavidad y todos los elementos de control respondieron instantáneamente. Tal resultado anteriormente requería el trabajo de un programador y software especializado.

Hasta ahora, los chatbots generativos se ocupaban principalmente de texto, código e imágenes. Las simulaciones interactivas son un nivel cualitativamente diferente: requieren no solo dibujar un objeto, sino generar la lógica de funcionamiento de su comportamiento, incluyendo física y reacción a la entrada del usuario. En esencia, Gemini ahora actúa no solo como generador de contenido, sino como constructor de herramientas educativas y de investigación sobre la marcha, sin involucrar a desarrolladores.

La aplicación de tal formato de respuesta es evidente en varios campos. En educación: en lugar de leer una descripción de las órbitas planetarias, un estudiante puede mover un control deslizante y ver cómo los cambios de velocidad afectan la trayectoria. En ingeniería — visualizar rápidamente un mecanismo o proceso físico sin ejecutar software especializado como MATLAB o SolidWorks.

En medicina — examinar una estructura anatómica desde todos los ángulos. En diseño — evaluar la forma de un objeto en tres dimensiones directamente durante la discusión, sin salir de la conversación. Google aún no ha revelado detalles técnicos sobre cómo exactamente Gemini genera la lógica de las simulaciones — si escribe código bajo el capó usando WebGL, Three.

js o utiliza un enfoque diferente. Ni la metodología ni las limitaciones sobre tipos de objetos compatibles han sido anunciadas oficialmente. Sin embargo, desde la perspectiva del usuario final, los detalles de implementación no son esenciales: lo que importa es el resultado, y ya se ve convincente en la fase de las primeras demostraciones.

Esta actualización se inscribe en una tendencia competitiva más amplia. Los grandes laboratorios de IA compiten no solo en la precisión de las respuestas de texto, sino también en la riqueza de formatos de salida. OpenAI lanzó Canvas para la edición colaborativa de documentos y código, Anthropic desarrolla artefactos con HTML interactivo, y ahora Google está añadiendo simulaciones 3D y físicas.

Los chatbots se están transformando gradualmente de asistentes de texto en entornos de trabajo multiformato. Para los usuarios de Gemini, esto significa capacidades ampliadas sin necesidad de habilidades técnicas adicionales. ¿Quieres entender cómo funciona un péndulo?

— Pregunta. ¿Quieres ver una molécula en tres dimensiones? — Pregunta también.

¿Quieres comparar el comportamiento de dos resortes diferentes? — Establece los parámetros y observa. El límite entre una pregunta y un libro de texto interactivo continúa borrándose, y las simulaciones 3D son una de las confirmaciones más vívidas de esto.

ZK
Hamidun News
Noticias de AI sin ruido. Selección editorial diaria de más de 400 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

¿Qué te parece?
Cargando comentarios…