Google Lança o Gemini 3, Seu Modelo de IA Multimodal Mais Inteligente

Google is launching Gemini 3, its ‘most intelligent’ AI model yet

Pontos principais

  • Google lança o Gemini 3, considerado seu modelo de IA mais inteligente.
  • O Gemini 3 Pro é nativamente multimodal, lidando com texto, imagens e áudio juntos.
  • Novos recursos incluem traduzir fotos de receitas, gerar cartões de estudo e layouts visuais estilo revista.
  • Interfaces gerativas permitem que os usuários criem saídas visuais dinâmicas dentro do aplicativo Gemini.
  • Técnica de diversificação de consultas aprimorada melhora a compreensão da intenção de pesquisa.
  • O modelo apresenta redução da sycophancy, oferecendo insights concisos e diretos.
  • O recurso experimental Gemini Agent pode gerenciar e-mails, pesquisar e reservar viagens.
  • Disponível para todos os usuários no aplicativo Gemini; ferramentas adicionais para assinantes do AI Pro e Ultra.
  • Modo Pensamento Profundo fornece raciocínio aprimorado para testes de segurança.

Google anunciou o lançamento do Gemini 3, considerado o sistema de IA mais inteligente e factualmente preciso da empresa até o momento. O modelo Gemini 3 Pro, disponível no aplicativo Gemini e para assinantes selecionados da Pesquisa, é nativamente multimodal, lidando com texto, imagens e áudio juntos.

Google Apresenta o Gemini 3 como Sua Oferta de IA Mais Avançada

Google começou a lançar o Gemini 3, uma nova série de modelos de IA que a empresa descreve como sua "mais inteligente" e "factualmente precisa" até o momento. A versão principal, Gemini 3 Pro, está sendo disponibilizada a todos por meio do aplicativo Gemini no dia do lançamento e a assinantes dentro da Pesquisa. Google posiciona o Gemini 3 como um grande avanço que traz informações "universalmente acessíveis e úteis" para os usuários em todo o seu ecossistema.

Capacidades Multimodais Nativas

O Gemini 3 Pro é "nativamente multimodal", significando que pode processar texto, imagens e áudio simultaneamente, em vez de lidar com cada modalidade separadamente. Google demonstrou usos práticos, como traduzir fotos de receitas em um livro de receitas completo e gerar cartões de estudo interativos a partir de uma série de palestras em vídeo. Esses exemplos ilustram como o modelo pode combinar dados visuais e textuais para produzir saídas mais ricas e ações mais eficazes.

Interfaces Gerativas e Saída Visual

O novo modelo alimenta "interfaces gerativas" que permitem que os usuários criem formatos visuais, estilo revista, com imagens que podem ser navegadas, bem como layouts dinâmicos personalizados para prompts específicos. Dentro do aplicativo Gemini, um espaço de trabalho incorporado chamado Canvas permite que os usuários construam programas "com recursos completos" que aproveitem essas capacidades visuais. No Modo IA da Pesquisa, o Gemini 3 Pro pode apresentar resultados como imagens, tabelas, grade e simulações, aprimorando a experiência tradicional apenas de texto.

Técnicas de Pesquisa Aprimoradas e Redução da Sycophancy

Google também melhorou sua técnica de "diversificação de consultas", permitindo que o Gemini 3 Pro quebre perguntas complexas em subconsultas e melhor entenda a intenção do usuário. A empresa afirma que o modelo é menos propenso a elogios vazios e apresenta "redução da sycophancy", fornecendo insights concisos e diretos, em vez de apenas ecoar o que os usuários querem ouvir.

Raciocínio Aprimorado e Recursos de Agente

O Gemini 3 Pro traz capacidades de raciocínio mais fortes e planejamento de longo prazo, suportando tarefas mais complexas. Um recurso experimental chamado Gemini Agent permite que o modelo atue em nome dos usuários dentro do aplicativo Gemini, lidando com ações como revisar e organizar e-mails ou pesquisar e reservar viagens. Um modo "Pensamento Profundo" aumenta ainda mais o desempenho do raciocínio para testadores de segurança.

Disponibilidade e Níveis de Assinatura

O modelo está agora disponível dentro do aplicativo Gemini para todos os usuários. Assinantes do Google AI Pro e Ultra nos Estados Unidos também podem experimentar o Gemini Agent e acessar o Gemini 3 Pro por meio do Modo IA, selecionando a opção "Pensamento" no menu suspenso do modelo. Essa distribuição em níveis visa fornecer acesso antecipado a uma ampla audiência, enquanto oferece capacidades avançadas para assinantes pagantes.

Posicionamento Estratégico

Ao lançar o Gemini 3, Google busca se posicionar à frente de fornecedores de IA concorrentes, enfatizando a precisão factual, a compreensão multimodal e ferramentas práticas e focadas no usuário. A empresa enquadra o lançamento como um passo em direção a tornar as informações mais universalmente úteis em toda a sua suíte de produtos.

#Google#Gemini 3#IA#IA multimodal#Aplicativo Gemini#Gemini Agent#DeepMind#tecnologia de pesquisa#interfaces gerativas#Modo IA

Também disponível em: