Google Presenta Gemini 3, Su Modelo de IA Multimodal Más Inteligente

Puntos clave
- Google lanza Gemini 3, presentado como su modelo de IA más inteligente.
- Gemini 3 Pro es multimodal de forma nativa, manejando texto, imágenes y audio juntos.
- Nuevas características incluyen traducir fotos de recetas, generar tarjetas de flash y diseños visuales de estilo de revista.
- Interfaces generativas permiten a los usuarios crear salidas visuales dinámicas dentro de la aplicación Gemini.
- Técnica de divergencia de consulta mejorada mejora la comprensón de la intención de bùsqueda.
- El modelo muestra una reducción de la adulación, ofreciendo perspectivas concisas y directas.
- La característica experimental de Gemini Agent puede manejar correos electrónicos, investigar y reservar viajes.
- Disponible para todos los usuarios en la aplicación Gemini; herramientas adicionales para suscriptores de AI Pro y Ultra.
- Modo de Pensamiento Profundo proporciona un razonamiento mejorado para pruebas de seguridad.
Google anunció el lanzamiento de Gemini 3, que califica como el sistema de IA más inteligente y preciso de la empresa hasta la fecha. El modelo insignia Gemini 3 Pro, disponible en la aplicación Gemini y para suscriptores seleccionados de Bùsqueda, es multimodal de forma nativa, manejando texto, imágenes y audio juntos.
Google Introduce Gemini 3 Como Su Oferta de IA Más Avanzada
Google ha comenzado a lanzar Gemini 3, una nueva serie de modelos de IA que la empresa describe como sus "más inteligentes" y "precisos" hasta la fecha. La versión insignia, Gemini 3 Pro, se está poniendo a disposición de todos a través de la aplicación Gemini el día del lanzamiento y para suscriptores dentro de Bùsqueda. Google posicione a Gemini 3 como un salto adelante que hace que la información sea "universalmente accesible y útil" para los usuarios en todo su ecosistema.
Capacidades Multimodales Nativas
Gemini 3 Pro es "multimodal de forma nativa", lo que significa que puede procesar texto, imágenes y audio simultáneamente en lugar de manejar cada modalidad por separado. Google demostró usos prácticos como traducir fotos de recetas en un libro de cocina completo y generar tarjetas de flash interactivas desde una serie de conferencias en video. Estos ejemplos ilustran cómo el modelo puede combinar datos visuales y textuales para producir salidas más ricas y accionables.
Interfaces Generativas y Salida Visual
El nuevo modelo impulsa "interfaces generativas" que permiten a los usuarios crear formatos visuales de estilo de revista con imágenes que pueden navegar, así como diseños dinámicos adaptados a prompts específicos. Dentro de la aplicación Gemini, un espacio de trabajo integrado llamado Canvas permite a los usuarios construir programas "más completos" que aprovechan estas capacidades visuales. En el Modo de IA de Bùsqueda, Gemini 3 Pro puede presentar resultados como imágenes, tablas, cuadrículas y simulaciones, mejorando la experiencia tradicional de solo texto.
Técnicas de Bùsqueda Mejoradas y Reducción de la Adulación
Google también mejoró su técnica de "divergencia de consulta", lo que permite a Gemini 3 Pro descomponer preguntas complejas en subconsultas y comprender mejor la intención del usuario. La empresa afirma que el modelo es menos propenso a la adulación vacía y exhibe una "reducción de la adulación", brindando perspectivas concisas y directas en lugar de simplemente hacer eco de lo que los usuarios quieren escuchar.
Razonamiento Mejorado y Características Agénticas
Gemini 3 Pro trae habilidades de razonamiento más fuertes y una planificación de horizonte más larga, apoyando tareas más complejas. Una característica experimental de Gemini Agent permite que el modelo acté en nombre de los usuarios dentro de la aplicación Gemini, manejando acciones como revisar y organizar correos electrónicos o investigar y reservar viajes. Un modo "Pensamiento Profundo" mejora además el rendimiento del razonamiento para los testers de seguridad.
Disponibilidad y Niveles de Suscripción
El modelo ya está disponible dentro de la aplicación Gemini para todos los usuarios. Los suscriptores de Google AI Pro y Ultra en Estados Unidos también pueden probar Gemini Agent y acceder a Gemini 3 Pro a través del Modo de IA seleccionando la opción "Pensamiento" desde el menù desplegable del modelo. Esta implementación por niveles tiene como objetivo brindar a una audiencia amplia un acceso temprano mientras ofrece capacidades avanzadas a los suscriptores que pagan.
Posicionamiento Estratégico
Al lanzar Gemini 3, Google busca posicionarse por delante de los proveedores de IA competidores, enfatizando la precisión de los hechos, la comprensión multimodal y las herramientas prácticas y centradas en el usuario. La empresa enmarca el lanzamiento como un paso hacia hacer que la información sea más universalmente útil a lo largo de su suite de productos.