Perplexity Lanza Control de Voz sin Manos para Navegador Comet

Perplexity Launches Hands‑Free Voice Control for Comet Browser

Puntos clave

  • Perplexity mejora el navegador Comet con control de voz de sesión completa.
  • La activación de escritorio utiliza Mayús + Alt + V (Windows) o Mayús + Opción + V (Mac).
  • Impulsado por el modelo gpt-realtime-1.5 de OpenAI para interacción de baja latencia.
  • El modo de voz mejora! la estabilidad de las herramientas en más del 25 por ciento.
  • Los usuarios pueden abrir sitios, desplazarse, hacer clic en enlaces y solicitar resúmenes hablando.
  • Enfoque de privacidad que procesa la voz localmente y evita el almacenamiento en la nube de los historiales de clics.
  • Lanzamiento de iOS esperado unos días después del lanzamiento de escritorio.
  • Planos futuros incluyen un asistente de aprendizaje, un administrador de contraseñas y sincronización entre dispositivos.

Perplexity ha lanzado un modo de voz mejorado para su navegador Comet, permitiendo a los usuarios de escritorio navegar por la web completamente por voz. La función, impulsada por el modelo gpt-realtime-1.5 de OpenAI, permite a los usuarios abrir sitios, desplazarse por páginas y seguir enlaces sin tocar un teclado o mouse. Un atajo de teclado simple activa el modo, y una experiencia similar está programada para iOS más adelante este mes. Perplexity enfatiza la privacidad al procesar la voz localmente cuando es posible y evitando el almacenamiento en la nube de los historiales de clics. Las actualizaciones futuras prometen un asistente de aprendizaje, un administrador de contraseñas y sincronización entre dispositivos.

Perplexity Amplía la Interacción de Voz en Navegador Comet

Perplexity anunció una actualización significativa a las capacidades de voz de su navegador Comet, llevando la experiencia más allá de una simple herramienta de consulta a una navegación de sesión completa y sin manos. Los usuarios de escritorio pueden activar el nuevo modo de inmediato, mientras que los usuarios de iOS recibirán la funcionalidad unos días después, según las listas de preventa.

El modo de voz mejorado se ejecuta en el modelo de tiempo real más reciente de OpenAI, identificado como gpt-realtime-1.5. Este modelo está diseñado para agentes de voz de baja latencia, entregando respuestas más rápidas y un ritmo más natural que admite sesiones de escucha más largas. El CEO de Perplexity, Aravind Srinivas, destacó el lanzamiento en la plataforma social X, agradeciendo al equipo multimodal de OpenAI por su colaboración.

A diferencia de la mayoría de los navegadores que tratan la voz como un "truco de fiesta" limitado a consultas de búsqueda, Comet ahora permite a los usuarios controlar virtualmente todas las acciones de navegación con comandos hablados. Los usuarios pueden abrir sitios web, desplazarse por páginas, hacer clic en enlaces y incluso solicitar resúmenes o comparaciones de contenido, todo sin un mouse o teclado. Los comandos de ejemplo incluyen "desplazarse hacia abajo", "abrir el tercer enlace", "resumir esta página" y "compararla con la pestaña de la izquierda". El atajo de activación en Windows es Mayús + Alt + V, y en macOS es Mayús + Opción + V. Un atajo comparable se introducirá para iPhone cuando se lance la versión de iOS.

Perplexity informa que el nuevo modo de voz mejora la estabilidad de las herramientas en más del 25 por ciento, reduciendo los errores cuando el navegador intenta ejecutar instrucciones habladas. Las voces en sí han sido refinadas para una articulación más clara y un ritmo más suave, mejorando la usabilidad para interacciones extendidas.

La privacidad es un componente fundamental del lanzamiento. El navegador procesa los datos de voz localmente siempre que sea posible y no almacena los historiales de clics en la nube de forma predeterminada, con el objetivo de evitar la creación de perfiles de seguimiento de anuncios. Esta postura difiere de muchos competidores que confían en el procesamiento del servidor y la recolección extensiva de datos.

Mirando hacia adelante, Perplexity planea enriquecer la experiencia de voz con un asistente de aprendizaje que se adapte a las preferencias individuales de los usuarios. El asistente podría ayudar con tareas como compras, pedir comida o encontrar vuelos en función del comportamiento pasado. Las características adicionales en desarrollo incluyen un administrador de contraseñas y sincronización entre dispositivos, aunque los usuarios de Android tendrán que esperar para que esas capacidades estén disponibles.

El lanzamiento refleja un cambio más amplio en la industria hacia la computación ambiental, donde la interacción es cada vez más impulsada por la voz y consciente del contexto. Al ofrecer una experiencia de navegación robusta, enfocada en la privacidad y sin manos, Perplexity posiciona a Comet como una herramienta de vanguardia para los usuarios que prefieren navegar por la web a través de la conversación en lugar de los clics.

#Perplexity#navegador Comet#control de voz#navegación por voz#OpenAI#inteligencia artificial en tiempo real#computación ambiental#privacidad#navegación de escritorio#iOS

También disponible en:

Perplexity Lanza Control de Voz sin Manos para Navegador Comet | AI News