Google Gemini Live recibe una actualización importante con nuevos acentos, habla más rápida y tutoría adaptativa

Puntos clave
- Modelos más inteligentes que entienden la entonación, el ritmo y el tono
- La velocidad del habla se puede ajustar para ser más lenta o más rápida
- Gemini Live puede imitar una variedad de acentos, incluyendo vaquero y cockney
- El modo de narración entrega narrativas dramáticas y ricas en acentos
- La tutoría adaptativa ofrece aprendizaje personalizado para idiomas y literatura
- Herramientas de conversación práctica para ensayar entrevistas y conversaciones difíciles
- Un mayor control del usuario sobre la configuración de voz mejora la accesibilidad
- La actualización está disponible en dispositivos Android y iOS
Google ha lanzado su mayor actualización a Gemini Live, la interfaz de inteligencia artificial conversacional en tiempo real, en Android y iOS. La actualización agrega modelos más inteligentes que entienden mejor la entonación, el ritmo y el tono, lo que permite a los usuarios escuchar al asistente hablar más lentamente o más rápido, adoptar una variedad de acentos y entregar narrativas dramáticas. Gemini Live también ofrece tutoría adaptativa para el aprendizaje de idiomas y otras materias, así como herramientas de conversación práctica para entrevistas y conversaciones personales difíciles. Las mejoras tienen como objetivo hacer que las interacciones se sientan más naturales, expresivas y personalizadas para las necesidades individuales de aprendizaje.
Modelos de voz más inteligentes para una interacción más natural
La última versión de Google para Gemini Live introduce una nueva generación de modelos diseñados para capturar las sutilezas del habla humana. Según la publicación oficial del blog, el sistema ahora presta más atención a la entonación, el ritmo y el tono, lo que le permite responder en un tono más calmado cuando la conversación es estresante o acelerar su habla para una entrega más rápida. Los usuarios también pueden elegir que Gemini hable más lentamente, lo que les da más tiempo para procesar la información.
Características de acentos y narración
Una de las características más destacadas es la capacidad de Gemini Live para imitar una variedad de acentos, desde el vaquero hasta el cockney. Esta capacidad se muestra en una demostración donde la IA narra la historia del Imperio Romano a través de los ojos de Julio César, entregando la historia con audio dramático y acentos específicos de personajes. El modo de narración está diseñado para hacer que el contenido informativo sea más atractivo y envolvente.
Experiencias de aprendizaje y tutoría adaptativa
Google enfatiza que Gemini Live ahora está mejor equipado para proporcionar aprendizaje personalizado. Ya sea que un usuario desee mejorar un idioma extranjero o explorar una novela clásica, la IA puede ofrecer tutoría adaptativa que adapta las explicaciones al ritmo y estilo del aprendiz. La actualización también incluye escenarios de conversación práctica, como ensayos de entrevistas o discusiones familiares difíciles, que ofrecen un entorno accesible para construir confianza y refinar habilidades de comunicación.
Control del usuario y accesibilidad
La actualización da a los usuarios un mayor control sobre sus conversaciones con la IA, incluyendo opciones para ajustar la velocidad del habla y seleccionar acentos preferidos. Estos controles están diseñados para mejorar la accesibilidad para usuarios con diferentes preferencias de escucha y para hacer que la experiencia se sienta más natural y conversacional, similar a hablar con una persona real.
Lanzamiento y disponibilidad
Las nuevas características ya están disponibles en dispositivos Android y iOS, después de una promesa hecha en agosto. Google describe el lanzamiento como "la mayor actualización de Gemini Live hasta la fecha", destacando la amplitud de mejoras en dinámicas de voz, narración y apoyo educativo.