En este momento estás viendo Proceso para generar videos desde Google Ommi

Proceso para generar videos desde Google Ommi

Prompt que genera el video

Cinematic 4K video of a modern, sleek smartphone floating mid-air against a dark, minimalist studio background. On the phone screen, vibrant 3D digital marketing charts and a glowing ‘ROI +300%’ metric burst upward in a clean, fluid animation. Soft neon purple and cyber blue lighting reflecting on the phone’s glass. Smooth, slow push-in camera movement, creating a sense of growth and momentum. High-end tech commercial style, clean, impactful, and professional

Objetivo del Prompt

El objetivo principal de este prompt es generar un video comercial de producto de alta gama (estilo tech commercial) con una estética ultra-pulida, minimalista y corporativa.

Busca transmitir conceptos de crecimiento, tecnología premium, éxito financiero (ROI) y modernidad. El prompt está diseñado para que el modelo de IA genere una toma de estudio controlada, evitando elementos caóticos y priorizando el fotorrealismo, la iluminación ambiental dirigida y un movimiento de cámara suave que aporte dinamismo sin perder elegancia.

Análisis Estructural

Para entender cómo interpreta la IA esta instrucción, dividí el prompt en sus 5 componentes clave:

Segmento del PromptObjeto / Función TécnicaExplicación del Impacto Visual
«Cinematic 4K video of a modern, sleek smartphone floating mid-air against a dark, minimalist studio background.»Sujeto Principal y Entorno (Establecimiento de Escena)Define qué estamos viendo (un teléfono inteligente), su estado físico (flotando, lo que añade un toque mágico/premium) y el fondo (estudio oscuro y minimalista). Esto asegura que la IA no genere fondos ruidosos o distractores. El modificador «Cinematic 4K» establece la resolución y textura visual deseada.
«On the phone screen, vibrant 3D digital marketing charts and a glowing ‘ROI +300%’ metric burst upward in a clean, fluid animation.»Acción Dinámica y Puntos de InterésEs el núcleo narrativo del video. Describe el movimiento dentro de la pantalla del teléfono. El uso de palabras como «burst upward» (brotar hacia arriba) y «clean, fluid» le indica a la IA que la animación debe ser suave y ascendente, reforzando la idea de «crecimiento».
«Soft neon purple and cyber blue lighting reflecting on the phone’s glass.»Iluminación y Materialidad (Atmósfera)Configura el esquema de color y las propiedades de renderizado del objeto. Las reflexiones en el vidrio («reflecting on the phone’s glass») añaden tridimensionalidad y realismo físico, mientras que los tonos «púrpura neón» y «azul cyber» dan una atmósfera tecnológica moderna (estilo cyberpunk sutil o corporativo moderno).
«Smooth, slow push-in camera movement, creating a sense of growth and momentum.»Cinemática y Movimiento de CámaraControla el comportamiento de la cámara virtual. Un «push-in» (acercamiento/zoom físico hacia el objeto) genera una sensación de inmersión y enfoque. El prompt asocia el movimiento físico con una emoción o intención («growth and momentum»), ayudando a la IA a calibrar la velocidad del plano.
«High-end tech commercial style, clean, impactful, and professional»Estilo Estético y Dirección de ArteActúa como un filtro de estilo general para el codificador de video de la IA. Palabras clave como «high-end tech commercial», «clean» e «impactful» aseguran que el resultado final emule la publicidad de marcas premium (como Apple, Google o Samsung) en lugar de un video casero o una animación de baja calidad.

Variables y Parámetros Identificados para Personalización

Para que puedas reutilizar esta estructura y generar otros contenidos, he extraído los parámetros clave. Al modificar los valores entre llaves { }, podrás crear infinitas variaciones manteniendo la calidad técnica original.

Plantilla de Prompt Parametrizada:

«Cinematic 4K video of a {Sujeto_Principal}, {Estado_Sujeto} against a {Entorno_Fondo}. On the {Sujeto_Superficie}, {Elemento_Dinamico} in a {Tipo_Animacion}. {Esquema_Iluminacion} reflecting on {Material_Sujeto}. {Movimiento_Camara}, creating a sense of {Emocion_Intencion}. {Estilo_Directorio_Arte} style, clean, impactful, and professional»

Catálogo de Variables Sugeridas:

Puedes intercambiar los valores de la plantilla utilizando este catálogo como referencia:

  1. {Sujeto_Principal} (El producto o elemento central):
  • Ejemplos: «luxury watch», «sleek electric car», «minimalist running shoe», «premium cosmetics bottle».
  1. {Estado_Sujeto} (Disposición en el espacio):
  • Ejemplos: «floating mid-air», «rotating slowly on a pedestal», «half-submerged in clear water», «standing majestically».
  1. {Entorno_Fondo} (El escenario de fondo):
  • Ejemplos: «a dark, minimalist studio background», «an abstract geometric concrete background», «a soft, out-of-focus natural garden», «a clean sand dune landscape under twilight».
  1. {Sujeto_Superficie} / {Elemento_Dinamico} (Acción u holograma interno):
  • Ejemplos: «On the watch face, intricate golden gears turning smoothly», «Around the car, glowing wind-tunnel aerodynamic lines flowing backward», «From the shoe sole, colorful liquid paint splashes bursting outward».
  1. {Tipo_Animacion} (Calidad del movimiento secundario):
  • Ejemplos: «clean, fluid animation», «high-speed explosive motion», «hyper-detailed slow-motion», «elegant, synchronized dance».
  1. {Esquema_Iluminacion} (Paleta de colores y luces):
  • Ejemplos: «Soft neon purple and cyber blue lighting», «Warm golden hour sunlight with long dramatic shadows», «High-contrast cinematic monochrome lighting», «Futuristic emerald green and silver rim lights».
  1. {Material_Sujeto} (Propiedades físicas para el reflejo):
  • Ejemplos: «the phone’s glass», «the metallic titanium chassis», «the polished carbon fiber body», «the wet matte texture».
  1. {Movimiento_Camara} (Dirección del plano):
  • Ejemplos: «Smooth, slow push-in camera movement», «Dynamic 360-degree orbital camera pan», «Slow vertical crane-up motion», «Cinematic macro tilt-shift glide».
  1. {Emocion_Intencion} (Subtexto psicológico del movimiento):
  • Ejemplos: «growth and momentum», «prestige and heritage», «raw power and speed», «serenity and pure luxury».
  1. {Estilo_Directorio_Arte} (Género comercial de referencia):
  • Ejemplos: «High-end tech commercial», «Luxury fashion editorial», «Sportswear adrenaline commercial», «Organic beauty advertisement».

Ejemplo Práctico de Reutilización

Si quisiéramos adaptar el prompt original para promocionar un reloj inteligente deportivo de alto rendimiento, usando la estructura analizada, el nuevo prompt optimizado sería:

«Cinematic 4K video of a sporty, rugged smartwatch rotating slowly on a pedestal against a dark, minimalist studio background. On the watch screen, vibrant colorful fitness rings and a glowing ‘10,000 steps’ milestone metric burst upward in a clean, fluid animation. Vivid orange and electric teal lighting reflecting on the metallic bezel and glass. Smooth, slow push-in camera movement, creating a sense of energy and achievement. High-end sports tech commercial style, clean, impactful, and professional.»

¿Cuál es la diferencia entre la opción Video desde Gemini, Veo y Omni?

Aunque las tres están relacionadas con la inteligencia artificial para video de Google, representan cosas distintas: el entorno de usuario, el motor antiguo y el motor nuevo.

a. La opción de «Video» desde Gemini (La Interfaz):

Es simplemente la pestaña o la casa dentro de la aplicación de Gemini donde entras a crear contenido. No es un modelo de IA en sí mismo, sino el espacio de usuario (ubicado en el menú lateral o en el botón «+») diseñado para interactuar, escribir los prompts y editar tus clips mediante chat de forma amigable.

b. Google Veo (El motor anterior):

Fue la familia de modelos especializados en video de Google (como Veo 3.1). Era un «especialista»: tú le dabas texto o una imagen, y te devolvía un video de alta calidad cinematográfica de hasta 60 segundos. Sin embargo, era un sistema de un solo intento (si el video no salía bien, tenías que generar otro desde cero) y no aceptaba audio como entrada. Actualmente está quedando relegado al ámbito de desarrollo técnico y APIs de Vertex AI.

c. Google Omni (El nuevo motor multimodal):

Es el nuevo cerebro de última generación que impulsa la creación de video y que llegó para reemplazar por completo a Veo dentro de la aplicación de Gemini. A diferencia de Veo, Omni es un modelo nativo multimodal: procesa texto, imágenes, audio y video simultáneamente. Su gran superpoder es el entendimiento del mundo y la edición conversacional (multi-turn); puedes pedirle que genere algo y luego decirle por chat: «ahora cambia el fondo a un atardecer» o «mantén el mismo teléfono pero que flote más rápido», y modificará el video manteniendo la coherencia física y de los objetos de forma fluida.

En resumen: Entras a la pestaña de Video en Gemini (la interfaz), la cual utiliza el motor Google Omni (el cerebro actual) para jubilar el flujo rígido que antes tenía Google Veo.


Puedes seguir mi publicaciones y contactarme por DM desde LinkedIn.

Gus Terrera

Apasionado por el agile testing y la ia.