OpenAI Integra Modo de Voz Directamente en el Chat de ChatGPT

ChatGPT’s new voice integration feels like the missing piece in AI chat – I’ve tried it, and it's almost perfect

Puntos clave

  • El modo de voz ahora está integrado directamente en la ventana de chat estándar de ChatGPT.
  • Disponible para todos los usuarios en móviles y web después de una simple actualización de la aplicación.
  • La transcripción en vivo muestra la entrada hablada como texto en tiempo real.
  • Los usuarios pueden activar o desactivar la voz y cambiar a la entrada por teclado sin salir de la ventana de chat.
  • La entrada de video permite que el modelo analice el contenido visual de la cámara.
  • Mapas, informes del tiempo y otros visuales en tiempo real aparecen dentro de la conversación.
  • La generación de imágenes a través de comandos de voz funciona de manera inconsistente para algunos usuarios.
  • La actualización tiene como objetivo hacer que la interacción de voz sea una característica de fondo sin problemas.

OpenAI lanzó una actualización que incorpora la interacción de voz directamente en la interfaz estándar de ChatGPT en plataformas móviles y web. Los usuarios pueden hablar con el asistente, ver una transcripción en vivo y cambiar a la entrada por teclado sin salir de la ventana de chat.

Descripción General de la Integración

OpenAI lanzó una actualización sutil pero significativa que combina su Modo de Voz con la experiencia de chat regular de ChatGPT. En lugar de lanzar una pantalla separada o un globo flotante, la función de voz ahora aparece como un botón dentro de la ventana de conversación existente. El cambio se está implementando para todos los usuarios en la aplicación móvil y la versión web, y solo requiere una actualización de la aplicación para dispositivos móviles.

Características Principales

La interfaz de voz integrada permite a los usuarios hablar sus consultas y ver el texto aparecer en tiempo real como una transcripción. Los usuarios pueden alternar entre la entrada de voz y la entrada por teclado sin salir de la conversación, lo que facilita hacer preguntas de seguimiento o cambiar a la entrada por teclado cuando lo prefieran. Un botón "Finalizar" desactiva instantáneamente la escucha, y un botón de video habilita el modelo para analizar la entrada visual de la cámara.

Más allá de la conversación básica, la actualización agrega ayudas visuales bajo demanda. Los usuarios pueden solicitar mapas, pronósticos del tiempo y otros datos en tiempo real, que aparecen como gráficos dentro del chat. El sistema también admite la generación de imágenes basadas en comandos de voz, aunque los informes iniciales indican que esta función sometimes no produce la salida esperada.

Experiencia del Usuario

Los revisores señalan que el nuevo diseño se siente más natural que el Modo de Voz separado anterior, que requería salir de la interfaz de texto. La transcripción en vivo proporciona un registro claro de lo que se dijo, y la capacidad de interrumpir o hacer preguntas de seguimiento refleja la fluidez de un chat de texto típico. La integración también permite a los usuarios solicitar titulares de noticias, actualizaciones del tiempo o ubicaciones de mapas mientras ven enlaces clicables junto a la respuesta hablada.

Limitaciones y Comentarios

Si bien la integración de voz simplifica la interacción, algunos usuarios han encontrado problemas. La función de generación de imágenes, invocada por comandos de voz, se ha informado que se bloquea sin entregar la imagen solicitada. Además, la función de mapas muestra gráficos estáticos en lugar de una integración completa con servicios de mapas externos.

En general, la actualización es elogiada por hacer que la voz sea una opción de fondo lista por defecto que reduce la fricción de cambiar de modos, aunque se espera un pulido adicional para las capacidades visuales más avanzadas.

#OpenAI#ChatGPT#Modo de Voz#IA#Aplicación Móvil#Actualización Web#Integración de Voz#Experiencia del Usuario#Noticias de Tecnología

También disponible en: