OpenAI Integra Modo de Voz Diretamente no Chat do ChatGPT

OpenAI lançou uma atualização que incorpora a interação por voz diretamente na interface padrão do ChatGPT em plataformas móveis e web. Os usuários agora podem falar com o assistente, ver uma transcrição em tempo real e alternar para digitação sem sair da janela de chat.

Visão Geral da Integração

OpenAI lançou uma atualização sutil, mas significativa, que mescla o Modo de Voz com a experiência regular de chat do ChatGPT. Em vez de lançar uma tela separada ou um globo flutuante, a função de voz agora aparece como um botão dentro da janela de conversa existente. A mudança está sendo implementada para todos os usuários no aplicativo móvel e na versão web, exigindo apenas uma atualização de aplicativo para dispositivos móveis.

Recursos Principais

A interface de voz integrada permite que os usuários falem suas consultas e vejam o texto aparecer em tempo real como uma transcrição. Os usuários podem alternar entre voz e entrada digitada sem sair da conversa, tornando fácil fazer perguntas de follow-up ou alternar para digitação sempre que preferirem. Um botão "Fim" desativa instantaneamente a escuta, e um botão de vídeo habilita o modelo a analisar a entrada visual da câmera.

Além da conversa básica, a atualização adiciona ajudas visuais sob demanda. Os usuários podem solicitar mapas, previsões do tempo e outros dados em tempo real, que aparecem como gráficos dentro do chat. O sistema também suporta a geração de imagens com base em comandos de voz, embora relatórios iniciais indiquem que esse recurso às vezes falha em produzir a saída esperada.

Experiência do Usuário

Revisores observam que o novo design se sente mais natural do que o Modo de Voz separado anterior, que exigia sair da interface de texto. A transcrição em tempo real fornece um registro claro do que foi dito, e a capacidade de interromper ou fazer perguntas de follow-up espelha a fluidez de um chat de texto típico. A integração também permite que os usuários solicitem manchetes de notícias, atualizações de tempo ou localizações de mapas enquanto veem links clicáveis ao lado da resposta falada.

Limitações e Feedback

Embora a integração de voz simplifique a interação, alguns usuários encontraram problemas. A função de geração de imagens, invocada por comandos de voz, foi relatada como travada sem entregar a imagem solicitada. Além disso, o recurso de mapa exibe gráficos estáticos em vez de integração completa com serviços de mapas externos.

No geral, a atualização é elogiada por tornar a voz uma opção padrão, pronta para segundo plano, que reduz a fricção de alternar modos, embora se espere um polimento adicional para as capacidades visuais mais avançadas.

OpenAI Integra Modo de Voz Diretamente no Chat do ChatGPT

Pontos principais

Visão Geral da Integração

Recursos Principais

Experiência do Usuário

Limitações e Feedback

Também disponível em: