Google presenta Gemini Omni Flash — modelo para crear videos a partir de texto e imágenes

Google lanzó Gemini Omni Flash — un nuevo modelo para generar videos a partir de texto, imágenes y grabaciones de audio. Comprende física, edita video mediante lenguaje natural y mantiene la consistencia de los personajes. Disponible en la app Gemini, YouTube Shorts y Google Flow. Todos los videos están marcados con una marca de agua oculta para verificación de autenticidad.

Khamidun Zhemal

Monitoreo de AI · DeepMind Blog

22 may 2026· 2 min·actualizado 12 jul 2026

Procesado por IA desde DeepMind Blog; editado por Hamidun News

Google presenta Gemini Omni Flash — modelo para crear videos a partir de texto e imágenes — Fuente: DeepMind Blog. Collage: Hamidun News.

◐ Escuchar artículo

Google presenta Gemini Omni Flash — un nuevo modelo de inteligencia artificial que crea videos de alta calidad a partir de una combinación de texto, imágenes, grabaciones de audio y otros videos simultáneamente. Este es el primer gran paso hacia la generación completa de video, donde la IA se convierte en director digital, guionista y editor en uno solo.

Física y lógica en una sola ventana

Gemini Omni Flash procesa varios tipos de datos de entrada en paralelo y los transforma en contenido de video. El modelo se destaca especialmente por su precisa simulación de física: modela correctamente la gravedad, la energía cinética, la dinámica de fluidos e interacción de objetos en el espacio tridimensional. Esto significa que los movimientos se ven naturales — los objetos caen correctamente, el líquido fluye lógicamente, la tela se dobla realistamente, el cabello flota en el aire.

Anteriormente, estos detalles requerían trabajo manual de artistas 3D y especialistas en simulación. Ahora la IA lo maneja sobre la marcha, procesando tu idea en tiempo real. Para la producción de video, esto significa que los directores pueden experimentar con ideas mucho más rápidamente.

La innovación principal es que el modelo razona sobre qué debería suceder a continuación. No simplemente genera una secuencia mecánica de fotogramas, como lo hacían los primeros generadores de video. En su lugar, Omni comprende el contexto y el conocimiento mundial integrado de Google: quién está dónde, qué sucedería lógicamente en una escena específica, cómo deberían moverse los personajes en relación con otros y el entorno.

Edición a través de la conversación

La segunda característica revolucionaria es la edición de video mediante lenguaje natural. No abres la edición final, no buscas el clip necesario en la biblioteca, no aplicas efectos manualmente. Simplemente escribes: "añade más gente al fondo", "cambia el color del vestido del personaje de azul a rojo", "haz la escena más soleada y alegre".

El modelo entiende estas solicitudes y edita el video sin exportación intermedia, reconversión y reimportación. Se mantiene toda la dinámica, consistencia de personajes, iluminación — solo lo necesario cambia. Esto ahorra horas de trabajo rutinario.

Todos los videos se marcan automáticamente con una marca de agua oculta SynthID — una firma invisible para el ojo humano pero legible por máquinas. Esto es crítico para la verificación: se puede probar de manera concluyente que el video fue creado por IA, no grabado en cámara. De esta manera se previene la desinformación y los deepfakes se revelan a primera vista.

Dónde se lanzó y qué sigue

Gemini app — aplicación web y móvil
Google Flow — asistente digital personal
YouTube Shorts — gratuito para todos los usuarios
Suscripciones Google AI Plus, Pro y Ultra

Los desarrolladores y empresas obtendrán acceso a través de API más adelante. Google señala que aún está trabajando en el despliegue seguro de funciones de edición de audio y síntesis de voz. Aquí se requiere mayor precaución — la voz es un atributo de identidad más sensible.

Qué significa esto

El contenido de video se vuelve tan rápido de crear como texto o correo electrónico. Anteriormente, para video profesional se necesitaban conocimientos especiales de edición de video, software costoso como Adobe Premiere, y horas de trabajo rutinario en interfaces. Ahora la idea creativa se convierte en un prompt de texto, y ya está listo un hermoso video en minutos. Esto acelerará dramáticamente la creación de contenido para marketing, educación, entretenimiento y comunicación interna corporativa. Los pequeños negocios podrán competir con los grandes en calidad de materiales de video. Probablemente pronto aparezcan estándares para marcar obligatoriamente el contenido de video generado por IA, y quien primero se adapte al trabajo con generación de video obtendrá una ventaja competitiva.

Hamidun News

Noticias de AI sin ruido. Selección editorial diaria de más de 50 fuentes. Producto de Zhemal Khamidun, Head of AI en Alpina Digital.

Canal de Telegram RSS hamidun.com

¿Quieres dejar de leer sobre IA y empezar a usarla?

AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.

🎓 Academy — 7 días gratis Consulta gratuita