Google Photos lança edição de voz e texto com IA no Android

Pontos principais
- O Google Photos agora suporta edição de fotos impulsionada por IA no Android via prompts de voz ou texto.
- O modelo Gemini impulsiona edições que variam desde ajustes de iluminação até remoção de objetos e adições criativas.
- Os usuários podem tocar em "Ajude-me a editar", receber edições sugeridas e solicitar refinamentos de follow-up.
- A funcionalidade foi lançada inicialmente em dispositivos Pixel 10 e está se expandindo para o ecossistema Android mais amplo.
- Disponível para usuários dos EUA com 18 anos ou mais em inglês, com rotulagem de credenciais de conteúdo de IA para transparência.
- A edição de IA visa tornar melhorias de fotos complexas acessíveis sem ferramentas tradicionais.
O Google introduziu uma funcionalidade de edição impulsionada por IA no Google Photos para usuários do Android. Com o modelo Gemini, a ferramenta permite que os usuários descrevam as alterações desejadas por voz ou texto, lidando com tarefas desde ajustes básicos de iluminação até remoção de objetos avançada e melhorias criativas.
Funcionalidade de Edição de IA Lançada
O Google anunciou que os usuários do Android agora podem editar fotos no Google Photos usando inteligência artificial. A nova capacidade permite que os usuários descrevam as alterações desejadas falando ou digitando prompts de linguagem natural. Ao tocar em "Ajude-me a editar", os usuários podem pedir ao AI impulsionado por Gemini para ajustar a iluminação, remover distrações, excluir objetos de fundo, restaurar imagens antigas ou mesmo adicionar elementos gerados por IA imaginativos. O sistema também oferece edições sugeridas e suporta solicitações de follow-up, permitindo o ajuste fino dos resultados.
Como Funciona a Interação
A interface aceita comandos de voz ou entrada de texto, permitindo que usuários que não estejam familiarizados com ferramentas de edição tradicionais alcancem resultados desejados rapidamente. Os usuários podem simplesmente dizer ou digitar "melhore", ou fornecer instruções mais específicas, como "clareie o céu" ou "remova a linha de energia". A IA interpreta o pedido, aplica a edição e apresenta a imagem atualizada para ajustes adicionais, se necessário.
Fundamentos Técnicos
A funcionalidade é impulsionada pelo modelo Gemini do Google, que foi introduzido inicialmente nos smartphones Pixel 10 nos Estados Unidos. Embora o motor Gemini tenha sido lançado inicialmente nesses dispositivos, o Google expandiu sua disponibilidade para o ecossistema Android mais amplo. Além das capacidades de edição, a atualização inclui suporte para Credenciais de Conteúdo C2PA, que rotulam imagens criadas ou alteradas com IA, ajudando os usuários a identificar conteúdo gerado por IA.
Lançamento e Elegibilidade
No lançamento, as ferramentas de edição de IA estão disponíveis para usuários com 18 anos ou mais localizados nos Estados Unidos e que estão usando a versão em inglês do aplicativo. A funcionalidade está sendo lançada para telefones Android além da linha Pixel 10, extendendo a funcionalidade para uma audiência mais ampla de usuários do Google Photos.
Edições Sugeridas e Solicitações de Follow-up
A IA também apresenta um conjunto de sugestões pré-geradas que os usuários podem selecionar com um toque único, fornecendo opções de melhoria rápida para problemas comuns. Após uma edição inicial, os usuários podem emitir prompts de follow-up — como "aumente o contraste um pouco mais" ou "remova a imperfeição à esquerda" — e o sistema refinará a imagem de acordo. Essa abordagem iterativa espelha um fluxo de trabalho conversacional, reduzindo a necessidade de ajustes manuais de sliders.
Implicações para os Usuários
Ao simplificar edições complexas por meio de interação conversacional, o Google visa tornar a melhoria de fotos mais acessível. A capacidade de solicitar alterações avançadas — como remoção de objetos ou adições criativas — sem navegar por menus pode encorajar o uso mais frequente de recursos de edição e ampliar a expressão criativa entre fotógrafos casuais.
Olhando para o Futuro
A integração do Gemini ao Google Photos sinaliza um impulso mais amplo para incorporar IA gerativa em serviços de consumo. Ao combinar edição de IA com metadados de credenciais de conteúdo, a empresa aborda tanto a conveniência criativa quanto a transparência sobre mídia gerada por IA. Embora o lançamento atual seja limitado aos Estados Unidos e falantes de inglês, a funcionalidade pode se expandir para regiões e idiomas adicionais à medida que a tecnologia amadurece.