OpenAI Lança GPT Image 1.5 em Meio à Competição 'Código Vermelho' com o Google

OpenAI continues on its ‘code red’ warpath with new image generation model

Pontos principais

  • OpenAI lança o GPT Image 1.5, prometendo até 4x mais velocidade na geração e melhor seguimento de instruções.
  • Novos controles de edição granulares permitem ajustes precisos de expressões faciais, iluminação e tom de cor.
  • O modelo está acessível a todos os usuários do ChatGPT e via API, expandindo o acesso além do lançamento anterior do GPT Image 1.
  • Lançamento segue um memorando interno "código vermelho" que destaca a competição com o Gemini 3 e o Nano Banana Pro do Google.
  • Uma interface de barra lateral redesenhada funciona como um estúdio criativo, oferecendo recursos de pós-produção.
  • Fidji Simo enfatiza a adição de mais elementos visuais em consultas de pesquisa e tarefas cotidianas.

OpenAI introduziu o GPT Image 1.5, uma nova versão da ferramenta de geração de imagens do ChatGPT, que promete desempenho mais rápido, melhor seguimento de instruções e controles de edição mais precisos. O modelo agora está disponível para todos os usuários do ChatGPT e via API.

Detalhes do Novo Modelo

OpenAI anunciou o lançamento do GPT Image 1.5, a última iteração do serviço de geração de imagens do ChatGPT. A atualização é descrita como entregando até 4x mais velocidade na geração de imagens, enquanto melhora a capacidade do modelo de seguir instruções detalhadas. Os usuários agora podem fazer edições precisas, como ajustar expressões faciais ou ajustar a iluminação, sem que o modelo reinterprete a imagem inteira, preservando a consistência visual nas alterações.

Paisagem Competitiva

O lançamento ocorre em meio a um memorando interno que rotulou a situação como "código vermelho", refletindo a resposta estratégica da OpenAI aos recentes avanços do Google. O Gemini 3 e o gerador de imagens Nano Banana Pro do Google lideram a lista de benchmarks do LMArena, levando a OpenAI a acelerar sua estratégia. Apesar da liderança do Google, a OpenAI também introduziu o GPT-5.2, posicionando ambos os modelos de linguagem e visual como concorrentes diretos das ofertas do Google.

Melhorias na Experiência do Usuário

O GPT Image 1.5 introduz um ponto de entrada dedicado na barra lateral do ChatGPT que funciona "mais como um estúdio criativo", de acordo com Fidji Simo, CEO de aplicações da OpenAI. A nova interface fornece aos usuários controles de pós-produção para semelhança facial, iluminação, composição e tom de cor, permitindo edições granulares que mantêm a continuidade visual. Simo destacou que as telas de visualização e edição de imagens atualizadas tornam mais fácil criar imagens que correspondam à visão do usuário ou se inspiram em prompts e filtros pré-definidos em tendência.

Contexto Estratégico

O modelo está disponível para todos os usuários do ChatGPT e via API, expandindo o acesso além do lançamento anterior do GPT Image 1, que estreou em abril. A OpenAI originalmente planejou um novo gerador de imagens para início de janeiro, mas o lançamento foi acelerado após o memorando "código vermelho". A ambição mais ampla da empresa, como delineada por Simo, é integrar mais elementos visuais em consultas de pesquisa e outras tarefas, como converter medidas ou verificar placares esportivos, para que os visuais possam contar uma história de forma mais eficaz do que as palavras sozinhas.

Perspectiva

Ao posicionar o GPT Image 1.5 como uma ferramenta de produção pronta com geração rápida e capacidades de edição refinadas, a OpenAI visa fechar a lacuna com os geradores de imagens líderes do Google, enquanto reforça seu próprio ecossistema de serviços de IA. O lançamento sinaliza uma intensificação contínua da corrida de IA, com ambas as empresas impulsionando novos modelos e recursos para capturar participação de mercado.

#OpenAI#GPT Image 1.5#ChatGPT#Google#Gemini#Nano Banana Pro#competição de IA#geração de imagens#Fidji Simo#código vermelho

Também disponível em: