Google

Google lanza VEO: su revolucionaria IA para generar videos a partir de texto

En la Google I/O 2024, la empresa presentó nuevos modelos de IA generativa. Estrena Veo, un nuevo generador de video, y renueva Imagen 3, la IA de conversión de texto a imagen.

Luis Cortina

14 de may. de 2024 — 6 min read

Google VEO IA para crear videos

Google ha revelado VEO, su innovadora tecnología de inteligencia artificial capaz de crear videos de alta calidad a partir de simples descripciones textuales.

Esta poderosa herramienta, presentada en el Google I/O 2024, promete transformar la forma en que creamos y experimentamos contenido audiovisual, para competir con Sora, la herramienta de OpenAI para crear videos a partir de texto.

Una nueva era en la creación de videos

0:00

/0:08

Google VEO IA

La industria del video se encuentra al borde de una revolución sin precedentes. Con VEO, Google ha dado un paso gigantesco hacia la democratización de la creación de contenido audiovisual, brindando a usuarios y creadores una herramienta extraordinariamente accesible y poderosa.

Cómo funciona VEO

VEO es un modelo de inteligencia artificial generativa capaz de interpretar entradas de texto y transformarlas en videos de alta definición (1080p) y una duración superior a un minuto.

Gracias a su avanzada comprensión del lenguaje natural y la semántica visual, VEO puede capturar con precisión los detalles y el tono deseados, dando vida a las visiones creativas de los usuarios.

Amplio abanico de estilos

Una de las características más impresionantes de VEO es su capacidad para generar videos en una amplia gama de estilos visuales, desde el realismo fotográfico hasta el surrealismo, pasando por la animación y el timelapse.

Esta versatilidad abre un mundo de posibilidades creativas, permitiendo a los usuarios explorar y experimentar con diferentes géneros y técnicas cinematográficas.

Entradas de texto detalladas

Para obtener los mejores resultados con VEO, es fundamental proporcionar entradas de texto detalladas y descriptivas. Cuanto más específicas sean las instrucciones, mejor será la calidad y la precisión del video generado.

Por ejemplo, una entrada como "Un vaquero solitario monta su caballo a través de una llanura abierta ante una hermosa puesta de sol, una luz suave y colores cálidos" podría generar un video cautivador y atmosférico.

Demostraciones impresionantes

Durante el Google I/O 2024, la compañía mostró algunas demostraciones impresionantes de las capacidades de VEO. Los videos generados por la IA exhibieron un manejo excepcional de la física del mundo real, con detalles como autos llegando a casas o barcos navegando en el océano, todo ello en alta definición.

Integración con otros productos de Google

Aunque VEO es una herramienta independiente, Google tiene planes para integrarla con otros productos populares en el futuro.

Por ejemplo, se espera que VEO se incorpore a YouTube Shorts, permitiendo a los creadores generar videos de manera rápida y sencilla a partir de simples prompts de texto.

0:00

/0:08

VEO Google

Acceso anticipado y lista de espera

En la actualidad, VEO se encuentra en una fase de acceso anticipado limitado. Google ha abierto una lista de espera para aquellos interesados en probar la herramienta antes de su lanzamiento público.

Los creadores seleccionados podrán acceder a VEO a través de la plataforma VideoFX.

✍️ Prompt: “A panning shot of a serene mountain landscape, the camera slowly revealing snow-capped peaks, granite rocks and a crystal-clear lake reflecting the sky.” pic.twitter.com/v3tZTzaEdA
— Google DeepMind (@GoogleDeepMind) May 14, 2024

Imagen 3: la IA de texto a imagen de Google

Además de VEO, Google también presentó Imagen 3, su nuevo modelo de inteligencia artificial capaz de generar imágenes fotorrealistas a partir de texto.

Esta herramienta, optimizada para la creación de imágenes que incluyan texto, complementa perfectamente las capacidades de VEO, brindando a los usuarios una suite completa de herramientas generativas.

Interpretación avanzada del lenguaje natural

Al igual que VEO, Imagen 3 destaca por su avanzada comprensión del lenguaje natural. Mediante prompts extensos y detallados, los usuarios pueden generar imágenes que capturen con precisión los detalles y el estilo deseados, incluyendo texto con apariencias específicas.

Acceso anticipado a Imagen 3

Al igual que VEO, Imagen 3 se encuentra actualmente en una fase de acceso anticipado a través de la plataforma ImageFX. Los creadores interesados pueden unirse a la lista de espera para tener la oportunidad de probar esta emocionante herramienta.

La revolución de la IA generativa en Google

La presentación de VEO e Imagen 3 representa un hito significativo en la apuesta de Google por la inteligencia artificial generativa. Estas herramientas son sólo el comienzo de una nueva era en la que la creación de contenido multimedia se volverá más accesible y democrática que nunca.

Gemini: el cerebro detrás de la IA generativa

Detrás de VEO e Imagen 3 se encuentra Gemini, el poderoso modelo de inteligencia artificial de Google. Gemini es el pilar fundamental de la estrategia de IA de la compañía, y su continuo desarrollo y mejora impulsará aún más las capacidades generativas en el futuro.

Gemini 1.5 Flash y Gemini 1.5 Pro

Durante el Google I/O 2024, la compañía también anunció actualizaciones significativas para Gemini 1.5 Flash y Gemini 1.5 Pro. Estas nuevas versiones ofrecen ventanas de contexto más amplias, mejoras en el rendimiento en diversos dominios y una mayor eficiencia en tareas como resúmenes, aplicaciones de chat, subtitulado y extracción de datos.

Gemini Nano y la comprensión de imágenes

Gemini Nano, anteriormente centrado en entradas de texto, ahora se ha expandido para incluir la comprensión de imágenes. Esta capacidad adicional promete brindar una experiencia de IA más completa y enriquecedora para los usuarios.

Project Astra: el futuro de los asistentes de IA

Además de las novedades en torno a VEO e Imagen 3, Google también presentó Project Astra, su visión para el futuro de los asistentes de inteligencia artificial.

0:00

/0:08

Google Project Astra

El objetivo de este ambicioso proyecto es desarrollar asistentes capaces de comprender y responder a las interacciones humanas de manera similar a como lo hacen las personas.

Capacidades avanzadas de Project Astra

Los prototipos de Project Astra se basan en Gemini y otros modelos específicos de tareas, y están diseñados para procesar información más rápidamente, codificando continuamente cuadros de video, combinando entradas de video y voz en una línea de tiempo de eventos y almacenando en caché esta información para una recuperación eficiente.

Además, estos asistentes cuentan con mejoras en el sonido, brindando una gama más amplia de entonaciones, y una mejor comprensión del contexto para responder de manera más natural y fluida en las conversaciones.

Integración futura en productos de Google

Aunque Project Astra se encuentra aún en una fase temprana, Google planea integrar algunas de sus capacidades en productos como la aplicación Gemini a finales de este año, ofreciendo una experiencia de asistente virtual más avanzada y natural.

Si te agrada nuestro contenido no olvides seguir visitando nuestro sitio Web Ellipsis Mx al igual seguirnos en nuestras redes sociales Facebook , Twitter e Instagram.

Google lanza VEO: su revolucionaria IA para generar videos a partir de texto

Luis Cortina

Una nueva era en la creación de videos

Cómo funciona VEO

Amplio abanico de estilos

Entradas de texto detalladas

Demostraciones impresionantes

Integración con otros productos de Google

Acceso anticipado y lista de espera

Imagen 3: la IA de texto a imagen de Google

Interpretación avanzada del lenguaje natural

Acceso anticipado a Imagen 3

La revolución de la IA generativa en Google

Gemini: el cerebro detrás de la IA generativa

Gemini 1.5 Flash y Gemini 1.5 Pro

Gemini Nano y la comprensión de imágenes

Project Astra: el futuro de los asistentes de IA

Capacidades avanzadas de Project Astra

Integración futura en productos de Google

Read more

Error en Google Search Console: informes de rendimiento retrasados

OPPO A3 es oficial: Características, precio y disponibilidad

Ernest Hemingway: A 63 años de su muerte, del Nobel a la depresión

Solos AirGo Vision: Los primeros lentes inteligentes con Gemini y GPT-4o, precio y disponibilidad