Relatório do Guardian Questiona a Credibilidade do Modelo GPT-5.2 da OpenAI sobre Citações de Fontes

Pontos principais
- A OpenAI comercializou o GPT-5.2 como seu modelo profissional mais avançado.
- Testes do Guardian encontraram o GPT-5.2 citando a Grokipedia para tópicos relacionados ao Irã e ao Holocausto.
- Alegações específicas ligaram o governo iraniano à MTN-Irancell e referenciaram o historiador Richard Evans.
- O modelo evitou a Grokipedia para prompts sobre viés midiático contra Donald Trump.
- A Grokipedia havia sido criticada anteriormente por citar fóruns neonazistas.
- Pesquisadores dos EUA identificaram fontes "questionáveis" e "problemáticas" na Grokipedia.
- A OpenAI disse que o GPT-5.2 busca uma ampla gama de fontes públicas e pontos de vista e aplica filtros de segurança.
A OpenAI promoveu seu modelo GPT-5.2 como a ferramenta profissional mais avançada, mas uma investigação do Guardian revelou que o sistema citou a enciclopédia gerada por AI, Grokipedia, para tópicos controversos, como o Irã e o Holocausto.
Fundo
A OpenAI descreveu seu modelo GPT-5.2 como o modelo de fronteira mais avançado para trabalho profissional. A empresa posicionou o sistema para lidar com tarefas complexas, como criação de planilhas e outras aplicações profissionais.
Descobertas do Guardian
O Guardian realizou testes que colocaram em dúvida a credibilidade do modelo. De acordo com o relatório, o GPT-5.2 citou a Grokipedia, uma enciclopédia online alimentada por xAI, ao responder a prompts sobre assuntos controversos relacionados ao Irã e ao Holocausto. Exemplos específicos incluíram alegações de que o governo iraniano estava ligado à empresa de telecomunicações MTN-Irancell e referências ao historiador britânico Richard Evans, que atuou como testemunha especial em um julgamento de difamação envolvendo o negador do Holocausto David Irving.
A investigação também observou que o GPT-5.2 não se baseou na Grokipedia para um prompt sobre viés midiático contra Donald Trump e outros tópicos controversos, indicando um uso inconsistente de fontes.
Lançamento do Modelo e Controvérsia
A OpenAI lançou o GPT-5.2 em dezembro, enfatizando seu desempenho aprimorado para uso profissional. A Grokipedia, que existia antes do lançamento do modelo, já havia atraído escrutínio por citar fóruns neonazistas. Um estudo de pesquisadores dos EUA relatou ainda que a enciclopédia gerada por AI referenciava fontes descritas como "questionáveis" e "problemáticas".
Resposta da OpenAI
Em resposta ao relatório do Guardian, a OpenAI afirmou que o GPT-5.2 busca na web uma ampla gama de fontes e pontos de vista disponíveis publicamente. A empresa acrescentou que filtros de segurança são aplicados para reduzir o risco de exibir links associados a danos de alta gravidade.
Implicações
As descobertas destacam os desafios contínuos em garantir a confiabilidade de grandes modelos de linguagem, especialmente quando eles se baseiam em conteúdo gerado por terceiros por AI. A discrepância na seleção de fontes levanta questões sobre transparência e a eficácia dos mecanismos de segurança projetados para filtrar informações prejudiciais ou não confiáveis.