OpenAI Lança ChatGPT Images 2.0, Aumentando Detalhes e Renderização de Texto

OpenAI Unveils ChatGPT Images 2.0, Boosting Detail and Text Rendering

Pontos principais

  • OpenAI lançou o ChatGPT Images 2.0 em 21 de abril de 2026.
  • O modelo pode gerar múltiplas imagens a partir de uma única solicitação.
  • A renderização de texto em inglês nas imagens mostra uma melhora significativa.
  • Razões de aspecto personalizadas de 3:1 a 1:3 agora são suportadas.
  • O corte de conhecimento foi estendido até dezembro de 2025 para mais dados atuais.
  • O texto não inglês permanece problemático, com saída mista e ilegível.
  • Disponível globalmente para todos os usuários do ChatGPT e Codex; nível premium oferece mais poder.

OpenAI lançou o ChatGPT Images 2.0 em 21 de abril de 2026, oferecendo aos usuários a capacidade de gerar múltiplas imagens de alta resolução a partir de uma única solicitação e renderizar texto legível dentro dessas imagens. O novo modelo aproveita o mecanismo de raciocínio do ChatGPT, suporta razões de aspecto personalizadas e estende sua base de conhecimento até dezembro de 2025. Embora a renderização de texto em inglês mostre uma melhora significativa, o sistema ainda tem dificuldades com idiomas não ingleses. A atualização está disponível para todos os usuários do ChatGPT e Codex, com um nível mais poderoso para assinantes pagos.

OpenAI anunciou o lançamento do ChatGPT Images 2.0 na terça-feira, 21 de abril de 2026, expandindo as capacidades de seu gerador de imagens impulsionado por IA. A atualização permite que uma única solicitação produza múltiplas imagens - desde guias de estudo de página completa até infográficos detalhados - enquanto também incorpora texto legível diretamente nas imagens.

Por trás dos panos, o novo modelo aproveita a camada de raciocínio do ChatGPT, permitindo que ele extraia informações recentes da internet e aplique etapas de processamento adicionais para refinar cada saída. O corte de conhecimento foi estendido até dezembro de 2025, o que significa que o sistema pode referenciar eventos e dados mais atuais do que seu antecessor.

Uma das mudanças mais notáveis é a forma como o modelo lida com o texto. Em versões anteriores, as imagens geradas por IA frequentemente apresentavam caracteres ilegíveis ou letras mal posicionadas, especialmente quando tentavam exibir palavras. O Images 2.0 produz texto em inglês mais limpo, tornando-o viável para legendas simples, rótulos e até gráficos básicos. Os testadores relataram que um infográfico do clima de São Francisco para o dia seguinte exibiu leituras de temperatura precisas ao lado de pontos de referência reconhecíveis, como o Ferry Building e o Transamerica Pyramid.

A atualização também introduz opções de razão de aspecto flexíveis. Os usuários agora podem especificar dimensões desde um formato amplo de 3:1 até um layout alto de 1:3, adaptando as imagens para se adequar a postagens de mídia social, materiais de impressão ou necessidades de design especializadas. A capacidade de ajustar o tamanho diretamente na solicitação agiliza os fluxos de trabalho para criadores que anteriormente tinham que recortar ou redimensionar o conteúdo gerado por IA.

OpenAI está tornando o novo modelo disponível globalmente para qualquer pessoa com uma conta ChatGPT ou Codex. Uma versão premium, direcionada a assinantes pagos, promete ainda mais poder, embora a versão básica já marque um passo significativo para as capacidades visuais da plataforma.

Apesar dos avanços, o desempenho do modelo em idiomas diferentes do inglês permanece irregular. Em um teste que solicitou ao sistema produzir uma colagem de fan-art chinês do ator Timothée Chalamet, a imagem resultante misturou retratos fotorealistas com um amálgama de texto estilo chinês. Quando solicitado a traduzir, o ChatGPT admitiu que muito do texto era "falso, ou texto semi-gíbrish de IA disfarçado para parecer escrita de meme-poster chinês". A resposta destacou caracteres malformados e glifos ocasionais com aparência japonesa, confirmando que a renderização de texto multilíngue ainda precisa de trabalho.

Observadores da indústria notam que novos modelos de imagem frequentemente geram picos de engajamento do usuário, especialmente quando se tornam prontos para memes. No ano passado, o lançamento do Nano Banana da Google gerou uma onda de imagens de figuras hiperrealistas que inundaram as plataformas de mídia social. Reações iniciais ao ChatGPT Images 2.0 sugerem um buzz semelhante, com usuários compartilhando caricaturas e gráficos personalizados gerados por IA em Twitter e Instagram.

A contínua ênfase da OpenAI em melhorar o texto dentro das imagens reflete uma tendência mais ampla entre os desenvolvedores de IA. A Google, por exemplo, também atualizou sua série Nano Banana para lidar melhor com elementos textuais. A competição destaca a crescente importância de texto claro e legível em visuais gerados por IA, um recurso que poderia abrir portas para materiais de marketing automatizados, conteúdo educacional e prototipagem rápida.

Embora a saída em inglês do modelo impressione, a empresa não divulgou um cronograma para resolver as limitações multilíngues. Por enquanto, criadores que buscam texto não inglês confiável podem precisar suplementar gráficos gerados por IA com edição manual ou ferramentas de tradução externas.

No geral, o ChatGPT Images 2.0 representa um salto significativo na suíte de IA visual da OpenAI, entregando geração de múltiplas imagens, dimensões personalizáveis e texto em inglês mais nítido. À medida que desenvolvedores e criadores de conteúdo experimentam com a nova ferramenta, seu impacto nos fluxos de trabalho de design e nas tendências de mídia social provavelmente se tornará mais claro nas semanas seguintes.

#OpenAI#ChatGPT#geração de imagem por IA#aprendizado de máquina#inteligência artificial#renderização de texto#IA multilíngue#tecnologia#software#modelo de imagem

Também disponível em: