Amazon se pone al día con los nuevos modelos de IA de Nova para generar voces y vídeos

Amazon está mostrando nueva tecnología de inteligencia artificial esta semana, incluida su versión de un modelo de voz más conversacional para competir mejor con cosas como Gemini Live y el modo de voz avanzado de OpenAI y una actualización de su modelo que puede generar video.

El nuevo modelo de voz de Nova Sonic gestiona el procesamiento de voz en tiempo real y la generación de voz con IA para aplicaciones conversacionales, según Amazon . Nova Sonic utiliza una arquitectura de modelo unificada que, según Amazon, es superior a otros enfoques que interconectan modelos separados para gestionar el reconocimiento de voz, la conversión de voz a texto, la generación de respuestas y, posteriormente, la conversión de texto a audio. Amazon afirma que Nova Sonic también puede detectar mejor el tono de voz y ofrecer respuestas más naturales.

Nova Sonic está disponible para probar a través de la plataforma para desarrolladores Bedrock de Amazon, y la compañía afirma que puede utilizarse para crear, por ejemplo, bots de atención al cliente o agentes de IA para viajes, educación, salud y otros sectores. Los componentes de Nova Sonic ya se utilizan en el nuevo asistente Alexa Plus de Amazon, según declaró a TechCrunch Rohit Prasad, vicepresidente sénior y científico jefe de Inteligencia Artificial (IAG) .


En cuanto a video, Amazon anunció Nova Reel 1.1 , que, según la compañía, ofrece mejoras de calidad y latencia con respecto a la versión 1.0. Además, ahora puede mantener estilos consistentes en varias escenas de seis segundos, editadas para crear un video completo de hasta dos minutos de duración.


0 comments:

Publicar un comentario