Veo 3,[1] también llamado V03 o simplemente Google Veo, es un modelo de inteligencia artificial desarrollado por Google DeepMind para generar vídeos cortos a partir de indicaciones de texto (y a veces imágenes),[2] que incorpora audio nativo incluyendo efectos de sonido, ambientes y diálogos sincronizados. Se presentó en Google I/O 2025 y forma parte del ecosistema Gemini,[3][4] estando disponible tanto para usuarios particulares como vía API.[5][6] Produce vídeos de unos 8 segundos con cierta fidelidad visual (720-1080p) aunque su disponibilidad geográfica aún está limitada. Entre sus ventajas están la combinación simultánea de imagen, movimiento, sonido y lenguaje natural, lo que permite que el contenido generado se aproxime bastante al realismo cinematográfico en escenas simples.[7]
Veo 3 | ||
---|---|---|
![]() | ||
Información general | ||
Tipo de programa | Inteligencia artificial | |
Autor | Google DeepMind | |
Lanzamiento inicial | Mayo de 2025 | |
Estado actual | Activo | |
Idiomas | Varios | |
Enlaces | ||
Sitio web oficial
| ||
Página web oficial