OpenAI Lança Modelo de Imagem GPT-1.5 com Velocidade Aumentada e Melhor Renderização de Texto

A OpenAI lançou o Modelo de Imagem GPT-1.5, um gerador de imagens de IA aprimorado que é quatro vezes mais rápido do que seu antecessor e oferece melhoria na execução de instruções, ferramentas de edição e geração de texto legível. O novo modelo está acessível a todos os usuários do ChatGPT por meio de um espaço dedicado na barra de lado e também está disponível por meio da API.

Visão Geral do Novo Modelo

A OpenAI anunciou o lançamento do Modelo de Imagem GPT-1.5, a última versão de sua tecnologia de imagem geradora. De acordo com a empresa, o modelo entrega um aumento de velocidade quatro vezes maior em comparação com a versão anterior, enquanto também fornece aderência mais precisa às solicitações dos usuários. Um foco notável da atualização é a capacidade de gerar texto legível dentro de imagens — uma tarefa que historicamente desafiou os geradores de imagens de IA.

Recursos e Acesso do Usuário

O novo modelo introduz uma série de ferramentas de edição que permitem aos usuários adicionar objetos específicos, alterar estilos, experimentar itens de vestuário e remover elementos indesejados de visuais gerados. Essas capacidades são integradas a um novo espaço dedicado na interface do ChatGPT, localizado na barra de lado e projetado especificamente para criação visual. O modelo está disponível globalmente para todos os usuários do ChatGPT e pode ser acessado por meio da API sob o identificador GPT-Image-1.5.

Contexto da Indústria e Reações

O Modelo de Imagem GPT-1.5 chega em um momento de intensa rivalidade no espaço de IA geradora. O lançamento da OpenAI segue a introdução do Gemini 3 do Google, que inclui a ferramenta "nano banana pro" elogiada por imagens hiper-realistas e melhoria na renderização de texto. A OpenAI relatadamente iniciou um "código vermelho" interno em resposta aos avanços do Google, sublinhando a pressão competitiva.

Em paralelo, a OpenAI recentemente garantiu um acordo com a Disney para eventualmente trazer mais de 200 personagens icônicos da Disney para suas plataformas de imagem e vídeo, embora os personagens não estejam disponíveis com o novo modelo até uma data posterior. A parceria com a Disney reflete uma tendência mais ampla de empresas de entretenimento negociando termos para uso de IA de sua propriedade intelectual.

Partes interessadas na comunidade de IA expressaram reações mistas. Embora as melhorias de velocidade e qualidade sejam bem-vindas por criadores que buscam geração de imagens mais rápida e confiável, persistem preocupações sobre as implicações éticas e legais de conteúdo gerado por IA, especialmente com relação a direitos autorais e ao uso de semelhanças humanas. Os esforços contínuos da OpenAI para expandir as capacidades de seu modelo ocorrem ao lado de debates da indústria sobre licenciamento, litígio e o equilíbrio entre inovação e proteção de obras criativas.

OpenAI Lança Modelo de Imagem GPT-1.5 com Velocidade Aumentada e Melhor Renderização de Texto

Pontos principais

Visão Geral do Novo Modelo

Recursos e Acesso do Usuário

Contexto da Indústria e Reações

Também disponível em: