Google Melhora Modo de IA com Capacidades de Pesquisa Visual

Google adds eyes to AI Mode with new visual search features

Pontos principais

  • Google adiciona pesquisa visual ao seu Modo de IA impulsionado por Gemini, mesclando Pesquisa de Imagens e Google Lens.
  • Os usuários podem enviar fotos e fazer perguntas conversacionais, recebendo imagens relacionadas e dados de produtos.
  • O sistema quebra imagens em objetos, fundo, cor e textura, executando consultas internas paralelas.
  • Os resultados são recombinações para atender à intenção do usuário, mas podem mal interpretar consultas ou favorecer visuais bem otimizados.
  • A integração com o Gráfico de Compras fornece informações de preço, revisão e disponibilidade para itens em fotos.
  • Concorrentes como o Pinterest Lens e a pesquisa visual do Bing existem, mas poucos combinam um banco de dados global de produtos com IA conversacional.
  • Riscos potenciais incluem viés, elevação de patrocínio e visibilidade reduzida para sites que carecem de presença visual.

Google expandiu seu Modo de IA impulsionado por Gemini, integrando recursos de pesquisa visual do Google Lens e sua tecnologia de Pesquisa de Imagens. Os usuários agora podem enviar fotos e fazer perguntas conversacionais sobre o conteúdo, recebendo imagens relacionadas, detalhes de produtos e informações contextuais.

Pesquisa Visual se Junta ao Modo de IA Impulsionado por Gemini

Google introduziu uma dimensão visual para seu Modo de IA impulsionado por Gemini, misturando a pesquisa tradicional baseada em texto com as capacidades do Google Lens e da Pesquisa de Imagens. O aprimoramento permite que os usuários enviem uma fotografia e façam perguntas em linguagem natural sobre ela, ou recebam coleções de imagens que se alinham com a consulta original.

Como o Motor de Pesquisa Funciona

O componente visual emprega o que Google chama de abordagem de "diversificação da pesquisa visual" em camadas sobre o método de diversificação existente usado para consultas textuais. Quando um usuário fornece uma imagem, o sistema a decompoem em elementos distintos - objetos, fundo, cor e textura - e envia múltiplas consultas internas simultaneamente. Essa consulta paralela permite que o mecanismo recupere um conjunto mais amplo de imagens relevantes, em vez de simplesmente ecoar a imagem original. Os resultados retornados são então recombinações, priorizando aqueles que melhor atendem à intenção do usuário.

Implicações para os Resultados da Pesquisa

A infraestrutura de pesquisa do Google deve decidir quais dos visuais recuperados destacar e quais suprimir. A empresa observa que o sistema pode mal interpretar a intenção, elevar conteúdo patrocinado ou favorecer grandes marcas cujos ativos visuais estão melhor otimizados para o consumo de IA. Consequentemente, sites que carecem de imagens limpas ou metadados visuais robustos correm o risco de ter visibilidade diminuída nos novos resultados centrados em visuais.

Integração com o Gráfico de Compras

No lado do comércio, a pesquisa visual aproveita o Gráfico de Compras do Google, um índice maciço que cataloga bilhões de produtos e é atualizado a cada hora. Uma foto de um par de calças jeans, por exemplo, pode mostrar preços atuais, avaliações de consumidores e disponibilidade em lojas locais em um único fluxo. Essa capacidade visa transformar prompts visuais vagos em opções de compra concretas, simplificando o caminho da descoberta à compra.

Paisagem Competitiva

O movimento da Google a junta a ferramentas de pesquisa visual existentes, como o Pinterest Lens e a pesquisa visual do Bing habilitada pelo Copilot da Microsoft. No entanto, a empresa argumenta que poucos concorrentes combinam um banco de dados global de produtos, dados de preços em tempo real e IA conversacional em uma única oferta. Ao combinar esses elementos, a Google espera que defina um novo padrão para experiências de pesquisa que são tanto sobre ver quanto ler.

Riscos e Desafios Potenciais

Apesar da promessa, a Google reconhece possíveis armadilhas. Mal interpretações da intenção do usuário, resultados visuais imprecisos ou favoráveis ao patrocínio e a promoção involuntária de itens patrocinados podem minar a confiança. Se o sistema falhar em fornecer respostas confiáveis, os usuários podem reverter para pesquisas tradicionais de palavras-chave ou se voltar para aplicativos de nicho que se especializam em domínios visuais específicos.

Olhando para o Futuro

A introdução da pesquisa visual no Modo de IA reflete uma mudança mais ampla na indústria em direção a interações mais táteis e impulsionadas por imagens. À medida que os dispositivos se tornam melhores em detectar e descrever o mundo ao seu redor, os mecanismos de pesquisa estão evoluindo para entender não apenas palavras, mas também o que os usuários veem. A infraestrutura abrangente da Google lhe dá uma vantagem significativa, mas o sucesso final do recurso dependerá de sua precisão, justiça e utilidade em consultas cotidianas.

#Google#Gemini#Modo de IA#Pesquisa Visual#Google Lens#Pesquisa de Imagens#Gráfico de Compras#Comércio Eletrônico#Inteligência Artificial#Mecanismo de Pesquisa

Também disponível em:

Google Melhora Modo de IA com Capacidades de Pesquisa Visual | AI News