Ahora puedes darle indicaciones a la cámara del modelo de video con inteligencia artificial de Google
Google busca facilitar a los usuarios de su modelo de IA de video Veo 2 la creación de generaciones con aspecto cinematográfico y la edición de material real. Las nuevas funciones de Veo 2 se pueden previsualizar a través de la plataforma de IA Vertex de Google Cloud, junto con otras actualizaciones para mejorar el generador de texto a imagen de Google, Imagen 3, y los modelos de IA relacionados con el audio.
Las nuevas funciones de Veo 2 incluyen la restauración de imagen, que elimina automáticamente imágenes de fondo, logotipos o distracciones no deseadas de tus vídeos, según Google, y la superposición de imagen, que amplía el fotograma del vídeo original a un formato diferente. Esta última herramienta rellena el nuevo espacio con secuencias de vídeo generadas por IA que se integran con el clip original, de forma similar a la función Generative Expand de Adobe para imágenes.
La actualización también permite a los usuarios de Veo 2 seleccionar ajustes preestablecidos de técnicas cinematográficas para incluirlos junto con sus descripciones de texto al generar el metraje. Estos ajustes pueden utilizarse para guiar la composición de la toma, los ángulos de cámara y el ritmo en el resultado final. Algunos ejemplos de ajustes preestablecidos incluyen efectos de lapso de tiempo, punto de vista estilo dron y simulación de paneo de cámara en diferentes direcciones.
También se ha añadido una nueva función de interpolación que puede crear una transición de vídeo entre dos imágenes fijas, rellenando las secuencias inicial y final con nuevos fotogramas.
El modelo de video Firefly de Adobe, competidor de Adobe, tiene capacidades similares, con una función de extensión de video con IA generativa que se lanzó en Premiere Pro la semana pasada. Google también agrega marcas de agua de atribución digital SynthID a sus resultados generados por IA, de forma similar al sistema de credenciales de contenido de Adobe , pero Adobe va un paso más allá al prometer que sus herramientas son completamente seguras comercialmente porque están entrenadas con contenido con licencia y de dominio público, algo que Google no puede igualar después de absorber la web para entrenar sus modelos de IA.
Las funciones de edición de Imagen 3, el modelo de texto a imagen de Google, también se han actualizado para mejorar significativamente la eliminación automática de objetos, según Google, lo que proporciona resultados supuestamente más naturales al eliminar distracciones. Tanto Veo 2 como Imagen 3 ya se utilizan en empresas como L'Oréal y Kraft Heinz para la producción de contenido de marketing. Justin Thomas, líder de experiencia digital de Kraft Heinz, afirma que el tipo de tarea que antes nos llevaba ocho semanas ahora solo nos lleva ocho horas.
En cuanto al audio, Google lanzó su modelo de texto a música, Lyria, en una vista previa privada y desplegó una función de "Voz personalizada instantánea" para su modelo de voz sintética, Chirp 3. Google afirma que Chirp 3 ahora puede generar "voces personalizadas realistas a partir de 10 segundos de entrada de audio", y que se está lanzando una nueva función de transcripción en vista previa que puede identificar y separar a los hablantes individuales para proporcionar transcripciones más claras para llamadas donde hablan varias personas.
Estas actualizaciones son solo algunos de los anuncios relacionados con la IA que Google realizó hoy. Gemini 2.5 Flash, la última versión del modelo Flash optimizado para la eficiencia de la compañía, pronto estará disponible en Vertex AI. Google afirma que Gemini 2.5 Flash "ajusta automáticamente el tiempo de procesamiento" según la complejidad de la tarea para proporcionar resultados más rápidos para solicitudes sencillas.
Google también está actualizando esta semana sus herramientas de IA Agentic, enfocadas en empresas, para que los agentes de IA puedan comunicarse entre sí y realizar tareas en plataformas como PayPal y Salesforce. Mientras tanto, se está lanzando una nueva sección en Google Cloud Marketplace para que las empresas exploren y adquieran agentes de IA desarrollados por socios externos de Google.