Google Gemini trae la automatización de tareas a los teléfonos Samsung

Puntos clave
- Google Gemini ahora automatiza tareas en teléfonos Samsung a través de una ventana de aplicación virtual.
- El soporte inicial incluye servicios de entrega de comida y transporte compartido.
- El asistente hace preguntas clarificadoras antes de completar las acciones.
- Los usuarios pueden ver el proceso de automatización e intervenir en cualquier momento.
- Las pruebas iniciales muestran un manejo exitoso de solicitudes simples y matizadas.
- La función está actualmente en beta y se expandirá a más aplicaciones.
- La automatización tiene como objetivo reducir el esfuerzo del usuario mientras mantiene el control y la seguridad.
Google y Samsung han introducido una nueva función de Gemini que permite a los usuarios automatizar tareas en aplicaciones a través de simples instrucciones. Comenzando con servicios de entrega de comida y transporte compartido, el asistente puede navegar por las interfaces de las aplicaciones en una ventana virtual, llenar detalles y pausar antes de la confirmación final, dando a los usuarios el control sobre cada paso. Las pruebas iniciales muestran que el sistema puede manejar solicitudes como pedir un viaje al aeropuerto o un café y un croissant, haciendo preguntas clarificadoras cuando sea necesario. La implementación marca un paso significativo hacia adelante para los asistentes de inteligencia artificial en dispositivos móviles.
La automatización de tareas de Gemini llega a los dispositivos Samsung
Google y Samsung han lanzado una nueva capacidad para el modelo de inteligencia artificial de Gemini que permite la automatización de tareas directamente en los teléfonos inteligentes Samsung. La función funciona abriendo una ventana virtual de la aplicación objetivo y realizando acciones en nombre del usuario, todo impulsado por instrucciones de lenguaje natural. El soporte inicial se centra en aplicaciones de entrega de comida y transporte compartido, lo que permite a los usuarios realizar pedidos o solicitar transporte sin navegar manualmente por cada pantalla.
Durante las pruebas iniciales, el asistente respondió a una solicitud directa para pedir un Uber al aeropuerto. Primero preguntó qué aeropuerto estaba destinado, luego procedió a agregar el destino, saltar los pasos innecesarios y pausar antes de la presentación final. Esta pausa dio al usuario la oportunidad de revisar los detalles y aprobar la solicitud, asegurando la transparencia y el control.
Las instrucciones más complejas, como pedir un café y una pastelería, requirieron entrada adicional. El sistema desplazó las opciones del menú, identificó la bebida solicitada y preguntó si el croissant debía calentarse. Con la aclaración del usuario, completó los pasos de preparación del pedido, demostrando la capacidad de manejar preferencias matizadas.
El proceso de automatización es visible para el usuario, quien puede intervenir en cualquier momento para detener o ajustar el flujo de trabajo. Este nivel de observabilidad está destinado a generar confianza, ya que el asistente opera de una manera que se siente como si el teléfono se estuviera utilizando por sí mismo.
Aunque la función aún está en beta, las primeras impresiones sugieren que cumple con las promesas que han estado asociadas con los asistentes de inteligencia artificial: realizar tareas multietapa con un esfuerzo mínimo del usuario. Los desarrolladores planean ampliar el rango de aplicaciones compatibles y continuar probando la robustez del sistema en diferentes escenarios.
Implicaciones para los asistentes de inteligencia artificial móviles
La introducción de la automatización de tareas impulsada por Gemini señala un cambio hacia asistentes digitales más proactivos y capaces en plataformas móviles. Al manejar interacciones dentro de aplicaciones de terceros, la tecnología va más allá de los simples comandos de voz para una verdadera automatización de flujos de trabajo. Esto podría cambiar la forma en que los usuarios interactúan con servicios cotidianos, reduciendo la fricción y liberando tiempo para otras actividades.
Los observadores de la industria señalan que la capacidad de pausar antes de las acciones finales aborda las preocupaciones de privacidad y seguridad, dando a los usuarios la última palabra sobre las transacciones. A medida que la función madura, puede abrir la puerta a una integración más amplia con una variedad de servicios, potencialmente estableciendo un nuevo estándar para los teléfonos inteligentes mejorados con inteligencia artificial.