Google presenta Gemini Omni Flash — modelo para crear videos a partir de texto e imágenes
Google lanzó Gemini Omni Flash — un nuevo modelo para generar videos a partir de texto, imágenes y grabaciones de audio. Comprende física, edita video mediante
Procesado por IA desde DeepMind Blog; editado por Hamidun News
Google presenta Gemini Omni Flash — un nuevo modelo de inteligencia artificial que crea videos de alta calidad a partir de una combinación de texto, imágenes, grabaciones de audio y otros videos simultáneamente. Este es el primer gran paso hacia la generación completa de video, donde la IA se convierte en director digital, guionista y editor en uno solo.
Física y lógica en una sola ventana
Gemini Omni Flash procesa varios tipos de datos de entrada en paralelo y los transforma en contenido de video. El modelo se destaca especialmente por su precisa simulación de física: modela correctamente la gravedad, la energía cinética, la dinámica de fluidos e interacción de objetos en el espacio tridimensional. Esto significa que los movimientos se ven naturales — los objetos caen correctamente, el líquido fluye lógicamente, la tela se dobla realistamente, el cabello flota en el aire.
Anteriormente, estos detalles requerían trabajo manual de artistas 3D y especialistas en simulación. Ahora la IA lo maneja sobre la marcha, procesando tu idea en tiempo real. Para la producción de video, esto significa que los directores pueden experimentar con ideas mucho más rápidamente.
La innovación principal es que el modelo razona sobre qué debería suceder a continuación. No simplemente genera una secuencia mecánica de fotogramas, como lo hacían los primeros generadores de video. En su lugar, Omni comprende el contexto y el conocimiento mundial integrado de Google: quién está dónde, qué sucedería lógicamente en una escena específica, cómo deberían moverse los personajes en relación con otros y el entorno.
Edición a través de la conversación
La segunda característica revolucionaria es la edición de video mediante lenguaje natural. No abres la edición final, no buscas el clip necesario en la biblioteca, no aplicas efectos manualmente. Simplemente escribes: "añade más gente al fondo", "cambia el color del vestido del personaje de azul a rojo", "haz la escena más soleada y alegre".
El modelo entiende estas solicitudes y edita el video sin exportación intermedia, reconversión y reimportación. Se mantiene toda la dinámica, consistencia de personajes, iluminación — solo lo necesario cambia. Esto ahorra horas de trabajo rutinario.
Todos los videos se marcan automáticamente con una marca de agua oculta SynthID — una firma invisible para el ojo humano pero legible por máquinas. Esto es crítico para la verificación: se puede probar de manera concluyente que el video fue creado por IA, no grabado en cámara. De esta manera se previene la desinformación y los deepfakes se revelan a primera vista.
Dónde se lanzó y qué sigue
- Gemini app — aplicación web y móvil
- Google Flow — asistente digital personal
- YouTube Shorts — gratuito para todos los usuarios
- Suscripciones Google AI Plus, Pro y Ultra
Los desarrolladores y empresas obtendrán acceso a través de API más adelante. Google señala que aún está trabajando en el despliegue seguro de funciones de edición de audio y síntesis de voz. Aquí se requiere mayor precaución — la voz es un atributo de identidad más sensible.
Qué significa esto
El contenido de video se vuelve tan rápido de crear como texto o correo electrónico. Anteriormente, para video profesional se necesitaban conocimientos especiales de edición de video, software costoso como Adobe Premiere, y horas de trabajo rutinario en interfaces. Ahora la idea creativa se convierte en un prompt de texto, y ya está listo un hermoso video en minutos. Esto acelerará dramáticamente la creación de contenido para marketing, educación, entretenimiento y comunicación interna corporativa. Los pequeños negocios podrán competir con los grandes en calidad de materiales de video. Probablemente pronto aparezcan estándares para marcar obligatoriamente el contenido de video generado por IA, y quien primero se adapte al trabajo con generación de video obtendrá una ventaja competitiva.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.