Relatório do Guardian Questiona a Credibilidade do Modelo GPT-5.2 da OpenAI sobre Citações de Fontes

A OpenAI promoveu seu modelo GPT-5.2 como a ferramenta profissional mais avançada, mas uma investigação do Guardian revelou que o sistema citou a enciclopédia gerada por AI, Grokipedia, para tópicos controversos, como o Irã e o Holocausto.

Fundo

A OpenAI descreveu seu modelo GPT-5.2 como o modelo de fronteira mais avançado para trabalho profissional. A empresa posicionou o sistema para lidar com tarefas complexas, como criação de planilhas e outras aplicações profissionais.

Descobertas do Guardian

O Guardian realizou testes que colocaram em dúvida a credibilidade do modelo. De acordo com o relatório, o GPT-5.2 citou a Grokipedia, uma enciclopédia online alimentada por xAI, ao responder a prompts sobre assuntos controversos relacionados ao Irã e ao Holocausto. Exemplos específicos incluíram alegações de que o governo iraniano estava ligado à empresa de telecomunicações MTN-Irancell e referências ao historiador britânico Richard Evans, que atuou como testemunha especial em um julgamento de difamação envolvendo o negador do Holocausto David Irving.

A investigação também observou que o GPT-5.2 não se baseou na Grokipedia para um prompt sobre viés midiático contra Donald Trump e outros tópicos controversos, indicando um uso inconsistente de fontes.

Lançamento do Modelo e Controvérsia

A OpenAI lançou o GPT-5.2 em dezembro, enfatizando seu desempenho aprimorado para uso profissional. A Grokipedia, que existia antes do lançamento do modelo, já havia atraído escrutínio por citar fóruns neonazistas. Um estudo de pesquisadores dos EUA relatou ainda que a enciclopédia gerada por AI referenciava fontes descritas como "questionáveis" e "problemáticas".

Resposta da OpenAI

Em resposta ao relatório do Guardian, a OpenAI afirmou que o GPT-5.2 busca na web uma ampla gama de fontes e pontos de vista disponíveis publicamente. A empresa acrescentou que filtros de segurança são aplicados para reduzir o risco de exibir links associados a danos de alta gravidade.

Implicações

As descobertas destacam os desafios contínuos em garantir a confiabilidade de grandes modelos de linguagem, especialmente quando eles se baseiam em conteúdo gerado por terceiros por AI. A discrepância na seleção de fontes levanta questões sobre transparência e a eficácia dos mecanismos de segurança projetados para filtrar informações prejudiciais ou não confiáveis.