O Novo Modelo de Imagem do ChatGPT da OpenAI Melhora, Mas Ainda Perde Para o Nano Banana do Google

Pontos principais
- A OpenAI lançou um novo modelo de imagem do ChatGPT (1.5) com renderização de texto mais clara.
- O modelo ainda comete erros direcionais em gráficos detalhados, como uma infográfico do ciclo da água.
- O Nano Banana do Google consistentemente produz imagens realistas de maior qualidade e mais rápido.
- Os limites de uso gratuitos na plataforma do Google duram mais do que aqueles no serviço da OpenAI.
- O ChatGPT se destaca em prompts de estilo cartoon e altamente criativos.
- A atualização parece ser uma resposta aos recentes avanços do Google na geração de imagens de IA.
A OpenAI lançou uma nova versão do seu gerador de imagens do ChatGPT, considerada uma melhoria significativa em relação às versões anteriores. Embora o modelo mostre uma renderização de texto mais clara e uma melhor manipulação de prompts de estilo cartoon, ele ainda luta com a precisão em gráficos detalhados, como uma infográfico do ciclo da água. Em comparações diretas, o modelo Nano Banana do Google consistentemente entrega imagens realistas de maior qualidade, geração mais rápida e limites de uso mais generosos.
O Modelo de Imagem Atualizado da OpenAI
A OpenAI introduziu uma nova iteração do seu gerador de imagens do ChatGPT, frequentemente referido como o modelo 1.5. A atualização traz melhorias notáveis na legibilidade do texto e na qualidade geral da imagem em comparação com as versões anteriores. Os testadores observaram que o modelo agora pode produzir elementos textuais mais claros em imagens geradas, um passo à frente da geração anterior, onde o texto era frequentemente difícil de ler.
Problemas Persistentes de Precisão
Apesar desses ganhos, o modelo ainda exibe erros em detalhes visuais precisos. Em um teste prático envolvendo uma infográfico do ciclo da água, as setas geradas apontavam na direção errada, dando a impressão de que a chuva poderia subir do chão. Embora o modelo mais recente tenha renderizado o texto de forma mais clara, os erros direcionais persistiram, indicando que o sistema ainda tem uma compreensão limitada de diagramas científicos específicos.
Desempenho em Comparações com o Nano Banana do Google
O Nano Banana do Google, parte de sua suíte Gemini, consistentemente superou o novo modelo do ChatGPT em comparações diretas. O Nano Banana produziu imagens realistas com fidelidade mais alta e o fez de forma mais rápida. Os usuários também relataram que os limites de uso gratuitos na plataforma do Google duraram mais do que aqueles no serviço da OpenAI, reduzindo as interrupções durante os testes.
Forças em Prompts Criativos e Não Realistas
O gerador de imagens do ChatGPT continua a se destacar na geração de visuais estilizados, como desenhos animados. Sua capacidade de lidar com prompts imaginativos e menos realistas permanece como uma vantagem distinta, mesmo que as capacidades de renderização realista do modelo ainda estejam atrás da oferta do Google.
Implicações para a Corrida de Imagem de IA
O lançamento do modelo de imagem atualizado do ChatGPT parece ser uma resposta aos rápidos avanços do Google em IA gerativa. Embora a OpenAI tenha fechado algumas lacunas — particularmente na clareza do texto —, a qualidade geral, a velocidade e o realismo das imagens ainda ficam aquém do desempenho do Nano Banana. Observadores sugerem que a OpenAI pode continuar a iterar rapidamente para diminuir essa diferença, mas a comparação atual destaca uma clara liderança do Google no competitivo cenário de criação de imagens impulsionada por IA.