En este momento estás viendo Google Flow y un primer ensayo

Google Flow y un primer ensayo

Punto de partida

Google Flow es una herramienta de inteligencia artificial de Google que funciona como tu equipo de producción virtual.

Le damos las instrucciones escribiendo un texto detallado (el «prompt»), que es como entregar un guión y dar órdenes al director de fotografía. En ese texto puedes describir:

  • La escena: Una oficina, una playa, el espacio.
  • Los personajes: Quiénes son y qué hacen.
  • La acción: Si conversan, corren o señalan algo.
  • El estilo: Si quieres que se vea hiperrealista, como un dibujo animado, o cinematográfico.

Básicamente este texto representa la estructura principal de prompt.

Luego, Google Flow interpreta tu «guion» y genera un video de alta calidad que da vida a tu idea, creando las imágenes, el movimiento y la atmósfera que pediste.

En resumen: Es una herramienta que convierte tus ideas escritas en videos.


Primer ensayo

Para realizar la primera prueba con «Google Flow» pensé primero en generar un prompt con «Google Gemini» que me sirviera para usarlo en «Google Flow» y así generar el video.

El input a «Google Gemini» fue definirle como objetivo que quería que me ayudara a realizar una prueba generando un video para lo cual necesita que actuara como especialista en Google Flow y luego le pasé el «guión», algo muy básico porque incluso quería probar justamente esa instancia. El video debe mostrar una oficina moderna de grandes ventanales que dan a un jardin, con escritorios modernos en el que se apoyan notebooks, paredes con un panel en el que se muestra un gráfico de torta, un gráfico de barras y un dashboard con las columnas TODO, DOING, DONE, un cartel con el nombre QA Office, y un grupo de personas de entre 25 a 45 años, vestidos informalmente que se los nota conversando y algunos señalando el dashboard. La imagen debe ser hiperrealista.

El output de «Google Gemini» fue explicarme que utilizá una estructura que define claramente el sujeto, el entorno, los detalles clave, la atmósfera y el estilo visual, para ayudar a Flow a que interprete cada elemento con mayor precisión.

El prompt para copiar y pegar en Flow fue:

Prompt:

Subject: A hyperrealistic video of a team meeting in a modern office. A diverse group of 6-8 people, men and women between 25 and 45 years old, are dressed in business casual attire. They are actively collaborating, with some individuals conversing animatedly, while two of them are pointing towards a large digital dashboard on the wall, explaining the metrics shown.

Setting: The scene is a spacious, open-plan modern office with a clean, minimalist aesthetic. The office features floor-to-ceiling windows that offer a clear view of a lush, green garden outside, filling the space with natural light. The interior has polished concrete floors and white walls. Modern, sleek desks are arranged neatly, each with a high-end laptop on it.

Key Details:

  • Wall Panel: On one of the main walls, there is a large, illuminated digital panel displaying:
    • A pie chart with vibrant colors (blue, green, orange).
    • A bar chart showing upward trending data.
    • A Kanban-style dashboard with three columns clearly labeled: TODO, DOING, DONE.
  • Signage: A stylish, metallic sign on the wall or a desk plaque clearly reads «QA Office«.
  • Characters’ Actions: The team members should exhibit natural and engaged body language. Show subtle movements like nodding, smiling, and gesturing to foster a sense of dynamic conversation. The two people pointing at the dashboard should have a confident and explanatory posture.

Style & Mood:

  • Visual Style: Hyperrealistic, cinematic, 8K resolution, sharp focus, professional color grading. The lighting should be bright and natural, coming from the large windows.
  • Mood: Productive, collaborative, positive, and innovative.

y me entregó un Análisis de la Estructura del Prompt (Por Qué Funciona)

Subject (Sujeto): Empezamos definiendo lo más importante: las personas y su acción principal. Especificamos el número de personas, su rango de edad, vestimenta y, crucialmente, su interacción. Esto le da a Flow el foco central de la animación.

Setting (Entorno): Describimos el escenario con gran detalle. «Oficina moderna» es un buen comienzo, pero al añadir «grandes ventanales», «vista a un jardín», «pisos de concreto pulido» y «paredes blancas», creamos una imagen mental mucho más rica para la IA, lo que resulta en un entorno más coherente y realista.

Key Details (Detalles Clave): Esta es la sección más crítica para tu solicitud específica.

  • Wall Panel: No solo pedimos «gráficos», sino que especificamos qué gráficos (gráfico de torta, gráfico de barras) y un dashboard con columnas exactas (TODO, DOING, DONE). Esta precisión es fundamental para que Flow genere exactamente lo que necesitas.
  • Signage: Indicar «un cartel con el nombre QA Office» y sugerir su material («metálico y estilizado») asegura que este elemento no se pierda y tenga la apariencia profesional deseada.
  • Characters’ Actions: Detallar las acciones («conversando animadamente», «señalando el dashboard») transforma una imagen estática en una escena de video dinámica y creíble.

Style & Mood (Estilo y Atmósfera): Aquí definimos la calidad y el sentimiento del video.

  • Visual Style: Términos como Hyperrealistic, cinematic, 8K, sharp focus y professional color grading son instrucciones directas para el motor de renderizado de Flow, indicándole que priorice la alta fidelidad y una estética de calidad cinematográfica.
  • Mood: Palabras como Productive, collaborative, positive influyen en las expresiones faciales de los personajes y en la paleta de colores general del video.

Camera Shot (Toma de Cámara): Finalmente, dirigir la cámara es esencial para un video. Al especificar una Medium shot (plano medio) y un slow panning movement (movimiento de paneo lento), estamos creando una toma deliberada que es mucho más profesional que una simple escena estática.

Luego accedí a Flow [] y pegué el prompt, y me dió dos resultados (como en el caso anterior) de los cuales elegí uno y es el que te muestro a continuación:

video generado con Google Flow

Segundo ensayo

Obtenido este primer resultado, le pedí con otro prompt a Gemini que identificara puntos de mejora en el texto narrado y luego mejorara la estructura del prompt para volver a incorporarla en Flow y generar la segunda versión del video.

Gemini me devolvió el siguiente análisis:

Identificación de Puntos de Mejora del Video Inicial

Basado en la experiencia con herramientas de IA generativa, el primer video, aunque probablemente bueno, tendría las siguientes áreas de mejora potenciales:

Narrativa y Dinamismo de los Personajes:

  • Movimientos Robóticos o Genéricos: Es probable que los personajes conversaran de manera repetitiva o que el gesto de «señalar» fuera estático, sin un propósito claro. La interacción pudo sentirse superficial.
  • Falta de Foco Narrativo: El video mostraba una escena, pero no contaba una microhistoria. ¿Por qué conversan? ¿Están celebrando, resolviendo un problema, planificando? Esta falta de intención se traduce en una conexión emocional más débil.
  • Expresiones Faciales Limitadas: Las expresiones podrían haber sido neutras o poco variadas, sin reflejar una emoción específica (satisfacción por los resultados, concentración en un problema, etc.).

Realismo y Detalle del Entorno:

  • Dashboard Estático: Lo más seguro es que los gráficos y el tablero Kanban fueran imágenes fijas. Un dashboard real es dinámico; los datos se resaltan, se actualizan o se interactúa con ellos.
  • Entorno «Demasiado Perfecto»: El hiperrealismo a veces puede crear escenas que se sienten estériles. Faltarían pequeños detalles de «vida real»: una taza de café en un escritorio, un post-it, un reflejo de luz que se mueve sutilmente.

Cinematografía y Enfoque Visual:

  • Movimiento de Cámara Simple: Un paneo lento de izquierda a derecha es una buena base, pero puede resultar un poco monótono. Las producciones profesionales utilizan movimientos más complejos (dolly, zoom suave, cambios de foco) para guiar la atención del espectador.
  • Foco Constante: Probablemente todo el plano estuvo enfocado (foco profundo). Un cambio de foco (por ejemplo, del rostro de una persona al dashboard) es una técnica cinematográfica potente para dirigir la narrativa.

A continuación, entregó la Mejora de la Estructura del Prompt (Versión 2.0)

Refinó el prompt con una narrativa central, acciones mucho más específicas, detalles dinámicos y una dirección de cámara más sofisticada.

Prompt V2:

Scene Narrative: The video captures the successful conclusion of a project sprint. A project lead is proudly explaining the team’s achievements to her colleagues by referencing a live data dashboard. The atmosphere is one of accomplishment and forward-looking optimism.

Subject & Characters:

  • Primary Subject: A female project lead, around 35 years old, with an energetic and confident posture. She is pointing to the «DONE» column on the dashboard, smiling as she speaks to two other team members.
  • Secondary Subjects: Two team members (one male, one female, late 20s) are looking at the lead and the dashboard, nodding in agreement and showing expressions of satisfaction. In the background, other team members are conversing softly in smaller groups.
  • Attire: Stylish and modern business casual (e.g., smart trousers, elegant blouses, open-collar shirts, clean sneakers).

Setting & Environment:

  • Location: A brightly lit, spacious modern office named «QA Office» (signage visible). Floor-to-ceiling windows show a vibrant garden with subtle movements, like leaves swaying gently in the wind.
  • Details: Desks are clean but lived-in, featuring high-end laptops, a designer coffee mug on one desk, and a notebook with pen next to a laptop. Natural light from the windows creates soft, moving reflections on the polished concrete floor.

Key Dynamic Elements:

  • Interactive Dashboard: The large wall panel is the focal point.
    • Kanban Board: The columns TODO, DOING, DONE are visible. A task card in the «DONE» column should be subtly highlighted or pulse with a soft green light, indicating it’s the topic of discussion.
    • Charts: The bar chart shows clear upward growth, with the most recent bar subtly animating or shimmering to draw attention. The pie chart is crisp and clear.

Style, Mood & Audio:

  • Visual Style: Hyperrealistic, cinematic 8K, shot on a prime lens with a shallow depth of field. The focus should be sharp on the main subjects, with the background slightly blurred to create depth.
  • Mood: Accomplished, proud, collaborative, motivational.
  • Audio: The scene should include subtle ambient sounds: the low murmur of background conversations, the soft click of a mouse, and the clear, confident (inaudible) speech of the project lead.

Camera & Cinematography:

  • Opening Shot: Start with a close-up on the highlighted task card in the «DONE» column of the dashboard.
  • Camera Movement: Execute a slow «pull-out and reveal» shot. As the camera pulls back, it reveals the project lead pointing at the card, and then the engaged faces of her colleagues. The camera continues a gentle arc movement to the right, capturing the wider office environment and the «QA Office» sign before the scene ends.
  • Focus: Start with the focus on the dashboard, then smoothly shift focus (rack focus) to the project lead’s face as the camera pulls back.

Finalmente, entregó un Resumen de las Mejoras Clave en el Prompt V2:

  • Narrativa Explícita: Se añade la sección Scene Narrative para darle a la IA un contexto y un propósito, lo que mejora drásticamente la naturalidad de las acciones y expresiones.
  • Roles Definidos: En lugar de un «grupo», ahora hay una «líder de proyecto» y «miembros del equipo», creando una jerarquía visual y una interacción más lógica.
  • Elementos Dinámicos: Se solicita explícitamente que el dashboard y los gráficos tengan animaciones sutiles (highlighted card, shimmering bar), lo que los hace parecer «vivos».
  • Cinematografía Avanzada: La instrucción de cámara pasa de un simple paneo a una secuencia profesional (pull-out and reveal, rack focus), lo que guía la atención del espectador y hace que el video sea mucho más atractivo visualmente.
  • Detalles de Realismo: Pequeños toques como «hojas de árbol moviéndose», «taza de café de diseñador» y «reflejos de luz» rompen la perfección estéril y añaden credibilidad.
  • Audio Ambiental: La adición de una capa de audio sugerida contribuye enormemente a la inmersión.

Luego accedí a Flow [] y pegué el prompt, y me dió dos resultados (como en el caso anterior) de los cuales elegí uno y es el que te muestro a continuación:

video generado con Google Flow

Punto para reflexionar

Teniendo la estructura básica del prompt para utilizar en Google Flow y el resultado de los dos análisis, servirán para desarrollar una versión mejorada de prompt para Flow con el que muy probablemente lograré mejores resultados luego del correspondiente refinamiento.

Gus Terrera

Apasionado por el agile testing y la ia.