Google Gemini 3 Pro Apresenta Desempenho Misto em Testes no Mundo Real

O modelo Gemini 3 Pro da Google introduz capacidades de raciocínio, geração visual e agência aprimoradas, mas testes práticos mostram resultados que ficam aquém das demonstrações da empresa. O novo espaço de trabalho Canvas pode combinar texto, imagens e vídeo para criar visualizações 3D interativas, enquanto a interface gerativa oferece layouts de estilo de revista para itinerários de viagem e outros tópicos. O Gemini Agent pode organizar o Gmail, definir lembretes e tentar reservas, mas ocasionalmente fornece informações incorretas sobre custos e requer múltiplas confirmações. Em comparação com outros assistentes de IA, o Gemini se destaca'na integração com o Gmail, mas é lento em velocidade e consistência, entregando uma experiência geral mista.

Novos Recursos e Promessas

A Google lançou a família Gemini 3, com o Gemini 3 Pro como o primeiro modelo disponível para os usuários. A empresa comercializa o modelo como tendo habilidades de raciocínio mais fortes, respostas mais concisas e capacidades multimodais avançadas. No aplicativo Gemini, o espaço de trabalho Canvas permite que os usuários combinem texto, imagens e vídeo, solicitando que a IA gere visualizações 3D interativas, interfaces de usuário mais ricas e simulações. A Google também promove uma interface gerativa que apresenta respostas em páginas visuais de estilo de revista e um recurso 'agente' chamado Gemini Agent que pode atuar em nome dos usuários para tarefas como organização de e-mails, criação de lembretes e reserva de reservas.

Avaliação Prática da Geração Visual

Testar as afirmações de visualização 3D revelou que o Gemini 3 Pro pode produzir modelos interativos que seguem aproximadamente o conteúdo da demonstração. Quando solicitado a ilustrar uma comparação de escala de partículas subatômicas a galáxias, o modelo gerou uma visualização rolável que listou os itens em ordem. No entanto, a qualidade da imagem foi desigual; a fita de DNA e a bola de praia apareceram mais escuras do que na demonstração da Google. Promptos mais simples, como criar um águia em estilo voxel, resultaram em modelos que faltavam detalhes como olhos e troncos de árvores adequados, enquanto outros modelos de animais pareciam primitivos com pouco detalhe.

Interface Gerativa e Layouts Interativos

O recurso de interface gerativa produziu uma página de viagem personalizada para uma viagem de três dias a Roma. O layout incluiu opções de itinerário, filtros para ritmo e preferências de jantar e a capacidade de redesenhar a página com base nas seleções do usuário. Guias interativos semelhantes foram demonstrados para tópicos como construir um computador ou configurar um aquário, indicando o potencial para conteúdo visual e personalizável além de respostas de texto simples.

Habilidades de Tratamento de Tarefas do Gemini Agent

O Gemini Agent foi avaliado para organização do Gmail e definição de lembretes. Quando instruído a organizar a caixa de entrada, o agente identificou e-mails não lidos recentes, exibiu-os em um gráfico e ofereceu botões para arquivar mensagens promocionais. Ele criou com sucesso um lembrete para o pagamento de uma conta e o colocou no Google Tasks com a data de vencimento correta. O agente também tentou navegar por uma interface de faturamento para pagar a conta, mas parou antes de inserir detalhes de pagamento devido a preocupações de segurança.

Comparação com Outros Assistentes de IA

Em comparação direta, a integração do Gemini com o Gmail provou ser mais profunda do que a da Perplexity e do ChatGPT. Embora a Perplexity pudesse listar e-mails, ela exigia comandos manuais para ações, e o ChatGPT operava em modo somente leitura, apesar de poder enviar e-mails. No entanto, o Gemini foi mais lento ao enviar e-mails do que a Perplexity. Ao tentar reservar uma reserva de restaurante, o Gemini relatou um custo inexistente, recuou atribuindo-o à taxa de serviço do restaurante e solicitou confirmação múltiplas vezes, destacando inconsistências na execução de tarefas.

Avaliação Geral

Os testes mostram que o Gemini 3 Pro entrega recursos visuais e agenciais impressionantes que alinham-se com as afirmações promocionais da Google em traços gerais, mas a execução muitas vezes deixa a desejar em detalhe, velocidade e confiabilidade. As forças do modelo residem na geração multimodal e na integração profunda com o Gmail, enquanto suas fraquezas incluem qualidade visual desigual, informações ocasionalmente incorretas sobre custos e desempenho mais lento em tarefas rotineiras. Os usuários podem encontrar as respostas baseadas em texto suficientes para consultas diárias, reservando as ferramentas visuais e agenciais avançadas para necessidades especializadas ocasionais.