OpenAI Desafia Ordem Judicial para Acesso do NYT a 20 Milhões de Conversas de Usuários
Pontos principais
- OpenAI detém uma amostra de 20 milhões de conversas de dezembro de 2022 a novembro de 2024, excluindo clientes empresariais.
- Os dados estão armazenados sob uma ordem judicial e não podem ser usados além das obrigações legais.
- OpenAI ofereceu alternativas de preservação de privacidade, como buscas direcionadas e dados de uso de alto nível, que o NYT rejeitou.
- O New York Times apresentou uma moção exigindo o conjunto de dados completo em um disco rígido, citando um prazo de descoberta de 26 de fevereiro de 2026.
- OpenAI afirma que o pedido excede o escopo original, que se limitava a registros relacionados ao conteúdo do Times.
- OpenAI contestará qualquer tentativa de tornar as conversas de usuários públicas.
OpenAI anunciou que uma amostra de 20 milhões de conversas do ChatGPT de dezembro de 2022 a novembro de 2024 não inclui clientes empresariais e está armazenada sob uma ordem judicial. A empresa ofereceu ao New York Times alternativas de preservação de privacidade, como buscas direcionadas e classificações de uso de alto nível, mas o jornal rejeitou-as e apresentou uma moção exigindo o conjunto de dados completo em um disco rígido. OpenAI afirma que o pedido excede o escopo original, que se limitava a registros relacionados ao conteúdo do Times, e promete lutar contra qualquer tentativa de tornar as conversas de usuários públicas.
Fundo e Escopo de Dados
OpenAI divulgou que a amostra de 20 milhões de conversas que detém abrange de dezembro de 2022 a novembro de 2024 e expressamente exclui conversas de clientes empresariais. Os dados residem em um sistema seguro protegido por uma ordem judicial, significando que podem ser acessados apenas para obrigações legais.
Alternativas Propostas pela OpenAI
Para atender ao pedido de descoberta do New York Times, OpenAI apresentou várias opções de preservação de privacidade. Essas incluíam buscas direcionadas sobre a amostra — permitindo que o Times recuperasse apenas conversas que pudessem conter o próprio texto de artigos — e uma classificação de alto nível de como o ChatGPT foi usado na amostra. OpenAI afirmou que o jornal rejeitou essas propostas.
Exigência do New York Times e Contexto Legal
O New York Times apresentou uma moção em 30 de outubro, acusando OpenAI de desafiar acordos anteriores ao se recusar a produzir mesmo uma pequena amostra dos bilhões de saídas de modelo implicadas na litigância. A petição enfatizou que a produção imediata da amostra de log de saída é essencial para atender a um prazo de descoberta de 26 de fevereiro de 2026. O Times argumentou que a sugestão da OpenAI de executar buscas em um pequeno subconjunto é ineficiente e inadequada para análise de especialistas de funções de modelo, geração aumentada por recuperação, interação do usuário e frequência de alucinações.
Resposta da OpenAI ao Pedido Ampliado
OpenAI esclareceu que os pedidos de descoberta do Times foram inicialmente limitados a registros "relacionados ao conteúdo do Times". A empresa tem trabalhado para atender a esses pedidos, amostrando registros de conversas. Perto do final desse processo, os autores apresentaram uma moção exigindo que a amostra completa de 20 milhões de logs fosse entregue via disco rígido, um pedido que OpenAI afirma exceder o escopo original.
Proteções Legais e Ações Futuras
OpenAI enfatizou que os logs de conversas estão sob ordem judicial e que o New York Times estaria legalmente obrigado a não tornar nenhum dado público fora do processo judicial. A empresa comprometeu-se a lutar contra qualquer tentativa de tornar as conversas de usuários públicas, mantendo sua posição sobre a proteção da privacidade dos usuários enquanto cumpre com obrigações legítimas.