La aplicación Gemini de Mac de Google agrega características de agente para competir con Anthropic y OpenAI

Puntos clave
- Google lanza una aplicación de Gemini para macOS con compartir pantalla y lanzamiento de combinación de teclas.
- La aplicación solicita permisos de accesibilidad, habilitando el control del ratón, teclado y archivos.
- Un análisis sugiere que Gemini podría organizar archivos y convertir datos en documentos de Workspace.
- Las características recuerdan a Claude Cowork de Anthropic, insinuando capacidades agenticas futuras.
- OpenAI está desarrollando una superaplicación, intensificando la competencia en asistentes de escritorio de IA.
Google ha lanzado una versión de macOS de su Gemini AI, convirtiendo la herramienta de chat en un asistente práctico que puede ver la pantalla, manipular archivos y controlar el ratón y el teclado. La aplicación, aún en etapas tempranas, ofrece un acceso rápido y un modo de compartir ventanas que alimenta el contexto visual al modelo. Aunque Google no ha confirmado planes para capacidades de uso de computadora más profundas, un análisis sugiere que el software podría actuar como Claude Cowork de Anthropic, convirtiendo datos no estructurados en documentos de Google Workspace y simplificando tareas cotidianas en Macs.
Google presentó una aplicación dedicada de Gemini para macOS esta semana, expandiendo el chatbot de IA más allá de las interacciones de texto. El nuevo cliente permite a los usuarios invocar el modelo con una combinación de teclas Option-Espacio y compartir una ventana para que Gemini pueda ver lo que hay en la pantalla. Esa alimentación visual elimina la necesidad de copiar y pegar, dando al asistente el contexto que puede utilizar para realizar acciones directamente en la máquina.
Según un análisis del kit de paquete de Android de la aplicación, el software ya solicita permisos de acceso a la pantalla y accesibilidad de macOS. Esos permisos permitirían a Gemini leer la pantalla, mover el cursor, escribir en el teclado y manipular archivos. En la práctica, un usuario podría pedirle al asistente que localice un documento, lo renombre o lo mueva a un archivo de Google Docs sin abrir Finder.
El movimiento refleja la característica reciente de Claude Cowork de Anthropic, que permite a su IA controlar una computadora para completar tareas. Google no ha anunciado oficialmente un modelo de "uso de computadora" similar para Gemini, pero la evidencia sugiere que podría ser un prototipo que pronto rivalice con la oferta de Anthropic. Si la aplicación puede convertir contenido no estructurado en Docs, Sheets o Slides, daría a los usuarios de Workspace una poderosa herramienta para convertir notas, PDF o imágenes en archivos editables.
El impulso de Google llega mientras OpenAI desarrolla silenciosamente una "superaplicación" que combinaría ChatGPT, Atlas y Codex en una sola interfaz. La competencia subraya una tendencia más amplia en la industria: los asistentes de IA están pasando de la conversación pura a la interacción directa con los sistemas operativos. Al otorgar a Gemini acceso a nivel de pantalla, Google posiciona su modelo como una herramienta de productividad más práctica, potencialmente superando al cliente actual de OpenAI para macOS, que sigue limitado a chat.
Los observadores de la industria señalan que la aplicación Gemini de Mac aún está en su infancia. La mayoría de los usuarios ven una ventana de chat simple, y el lanzamiento basado en combinaciones de teclas se siente similar al cliente de escritorio de ChatGPT. Sin embargo, la capacidad subyacente de leer la pantalla y actuar sobre ella podría establecer un nuevo estándar para los asistentes de IA en computadoras personales. Si Google amplía el conjunto de características, los desarrolladores podrían aprovechar el modelo de uso de computadora Gemini 2.5 que la empresa abrió a los socios el pasado octubre.
Por ahora, Google no ha confirmado ninguna hoja de ruta para funciones agenticas más amplias. El silencio de la empresa deja a los analistas esperando para ver si la aplicación de Mac se evolucionará en un asistente de escritorio completo o permanecerá como una superposición de chat modesta. De cualquier manera, el lanzamiento señala que las principales empresas de IA están apostando por una integración más profunda con los flujos de trabajo cotidianos de los usuarios, y la plataforma Mac es el último campo de batalla.