OpenAI Integra Modo de Voz Diretamente no Chat do ChatGPT

ChatGPT’s new voice integration feels like the missing piece in AI chat – I’ve tried it, and it's almost perfect

Pontos principais

  • O modo de voz agora está incorporado diretamente na janela de chat padrão do ChatGPT.
  • Disponível para todos os usuários em dispositivos móveis e web após uma simples atualização de aplicativo.
  • A transcrição em tempo real mostra a entrada falada como texto em tempo real.
  • Os usuários podem alternar a voz ligada ou desligada e voltar a digitar sem sair da janela de chat.
  • A entrada de vídeo permite que o modelo analise o conteúdo visual da câmera.
  • Mapas, relatórios de tempo e outros visuais em tempo real aparecem dentro da conversa.
  • A geração de imagens via comandos de voz funciona de forma inconsistente para alguns usuários.
  • A atualização visa tornar a interação por voz uma característica de fundo sem interrupções.

OpenAI lançou uma atualização que incorpora a interação por voz diretamente na interface padrão do ChatGPT em plataformas móveis e web. Os usuários agora podem falar com o assistente, ver uma transcrição em tempo real e alternar para digitação sem sair da janela de chat.

Visão Geral da Integração

OpenAI lançou uma atualização sutil, mas significativa, que mescla o Modo de Voz com a experiência regular de chat do ChatGPT. Em vez de lançar uma tela separada ou um globo flutuante, a função de voz agora aparece como um botão dentro da janela de conversa existente. A mudança está sendo implementada para todos os usuários no aplicativo móvel e na versão web, exigindo apenas uma atualização de aplicativo para dispositivos móveis.

Recursos Principais

A interface de voz integrada permite que os usuários falem suas consultas e vejam o texto aparecer em tempo real como uma transcrição. Os usuários podem alternar entre voz e entrada digitada sem sair da conversa, tornando fácil fazer perguntas de follow-up ou alternar para digitação sempre que preferirem. Um botão "Fim" desativa instantaneamente a escuta, e um botão de vídeo habilita o modelo a analisar a entrada visual da câmera.

Além da conversa básica, a atualização adiciona ajudas visuais sob demanda. Os usuários podem solicitar mapas, previsões do tempo e outros dados em tempo real, que aparecem como gráficos dentro do chat. O sistema também suporta a geração de imagens com base em comandos de voz, embora relatórios iniciais indiquem que esse recurso às vezes falha em produzir a saída esperada.

Experiência do Usuário

Revisores observam que o novo design se sente mais natural do que o Modo de Voz separado anterior, que exigia sair da interface de texto. A transcrição em tempo real fornece um registro claro do que foi dito, e a capacidade de interromper ou fazer perguntas de follow-up espelha a fluidez de um chat de texto típico. A integração também permite que os usuários solicitem manchetes de notícias, atualizações de tempo ou localizações de mapas enquanto veem links clicáveis ao lado da resposta falada.

Limitações e Feedback

Embora a integração de voz simplifique a interação, alguns usuários encontraram problemas. A função de geração de imagens, invocada por comandos de voz, foi relatada como travada sem entregar a imagem solicitada. Além disso, o recurso de mapa exibe gráficos estáticos em vez de integração completa com serviços de mapas externos.

No geral, a atualização é elogiada por tornar a voz uma opção padrão, pronta para segundo plano, que reduz a fricção de alternar modos, embora se espere um polimento adicional para as capacidades visuais mais avançadas.

#OpenAI#ChatGPT#Modo de Voz#IA#Aplicativo Móvel#Atualização da Web#Integração de Voz#Experiência do Usuário#Notícias de Tecnologia

Também disponível em: