OpenAI Integra Modo de Voz Directamente en el Chat de ChatGPT

OpenAI lanzó una actualización que incorpora la interacción de voz directamente en la interfaz estándar de ChatGPT en plataformas móviles y web. Los usuarios pueden hablar con el asistente, ver una transcripción en vivo y cambiar a la entrada por teclado sin salir de la ventana de chat.

Descripción General de la Integración

OpenAI lanzó una actualización sutil pero significativa que combina su Modo de Voz con la experiencia de chat regular de ChatGPT. En lugar de lanzar una pantalla separada o un globo flotante, la función de voz ahora aparece como un botón dentro de la ventana de conversación existente. El cambio se está implementando para todos los usuarios en la aplicación móvil y la versión web, y solo requiere una actualización de la aplicación para dispositivos móviles.

Características Principales

La interfaz de voz integrada permite a los usuarios hablar sus consultas y ver el texto aparecer en tiempo real como una transcripción. Los usuarios pueden alternar entre la entrada de voz y la entrada por teclado sin salir de la conversación, lo que facilita hacer preguntas de seguimiento o cambiar a la entrada por teclado cuando lo prefieran. Un botón "Finalizar" desactiva instantáneamente la escucha, y un botón de video habilita el modelo para analizar la entrada visual de la cámara.

Más allá de la conversación básica, la actualización agrega ayudas visuales bajo demanda. Los usuarios pueden solicitar mapas, pronósticos del tiempo y otros datos en tiempo real, que aparecen como gráficos dentro del chat. El sistema también admite la generación de imágenes basadas en comandos de voz, aunque los informes iniciales indican que esta función sometimes no produce la salida esperada.

Experiencia del Usuario

Los revisores señalan que el nuevo diseño se siente más natural que el Modo de Voz separado anterior, que requería salir de la interfaz de texto. La transcripción en vivo proporciona un registro claro de lo que se dijo, y la capacidad de interrumpir o hacer preguntas de seguimiento refleja la fluidez de un chat de texto típico. La integración también permite a los usuarios solicitar titulares de noticias, actualizaciones del tiempo o ubicaciones de mapas mientras ven enlaces clicables junto a la respuesta hablada.

Limitaciones y Comentarios

Si bien la integración de voz simplifica la interacción, algunos usuarios han encontrado problemas. La función de generación de imágenes, invocada por comandos de voz, se ha informado que se bloquea sin entregar la imagen solicitada. Además, la función de mapas muestra gráficos estáticos en lugar de una integración completa con servicios de mapas externos.

En general, la actualización es elogiada por hacer que la voz sea una opción de fondo lista por defecto que reduce la fricción de cambiar de modos, aunque se espera un pulido adicional para las capacidades visuales más avanzadas.

OpenAI Integra Modo de Voz Directamente en el Chat de ChatGPT

Puntos clave

Descripción General de la Integración

Características Principales

Experiencia del Usuario

Limitaciones y Comentarios

También disponible en: