OpenAI Desafía Orden Judicial para que el NYT Acceda a 20 Millones de Conversaciones de Usuarios

OpenAI anunció que una muestra de 20 millones de conversaciones de ChatGPT desde diciembre de 2022 hasta noviembre de 2024 no incluye a clientes comerciales y se almacena bajo una retención legal. La empresa ofreció al New York Times alternativas de privacidad, como búsquedas dirigidas y clasificaciones de uso de alto nivel, pero el periódico las rechazó y presentó una moción exigiendo el conjunto de datos completo en un disco duro.

Antecedentes y Alcance de los Datos

OpenAI reveló que la muestra de 20 millones de chats que posee abarca desde diciembre de 2022 hasta noviembre de 2024 y excluye expresamente conversaciones de clientes comerciales. Los datos residen en un sistema seguro protegido por una retención legal, lo que significa que solo se puede acceder a ellos para cumplir con obligaciones legales.

Alternativas Propuestas por OpenAI

Para abordar la solicitud de descubrimiento del New York Times, OpenAI presentó varias opciones de privacidad. Estas incluyeron búsquedas dirigidas sobre la muestra, lo que permitiría al Times recuperar solo chats que podrían contener texto de sus propios artículos, y una clasificación de alto nivel de cómo se utilizó ChatGPT en la muestra. OpenAI afirmó que el periódico rechazó estas propuestas.

Demanda del New York Times y Contexto Legal

El New York Times presentó una moción el 30 de octubre acusando a OpenAI de desafiar acuerdos previos al negarse a producir incluso una pequeña muestra de los miles de millones de salidas de modelo implicadas en el litigio. La presentación enfatizó que la producción inmediata de la muestra de registro de salida es esencial para cumplir con una fecha límite de descubrimiento del 26 de febrero de 2026. El Times argumentó que la sugerencia de OpenAI de realizar búsquedas en un subconjunto pequeño es ineficiente y inadequada para el análisis de expertos de las funciones del modelo, la generación aumentada de recuperación, la interacción del usuario y la frecuencia de alucinaciones.

Respuesta de OpenAI a la Solicitud Ampliada

OpenAI aclaró que las solicitudes de descubrimiento del Times inicialmente se limitaban a registros "relacionados con contenido del Times". La empresa ha estado trabajando para satisfacer esas solicitudes mediante la muestra de registros de conversación. Cerca del final de ese proceso, los demandantes presentaron una moción exigiendo que se entregue la muestra completa de 20 millones de registros a través de un disco duro, una solicitud que OpenAI afirma excede el alcance original.

Protecciones Legales y Acciones Futuras

OpenAI enfatizó que los registros de chat están bajo retención legal y que el New York Times estaría legalmente obligado a no hacer pública ninguna datos fuera del proceso judicial. La empresa se comprometió a luchar contra cualquier intento de hacer que las conversaciones de los usuarios sean públicas, manteniendo su postura sobre la protección de la privacidad de los usuarios mientras cumple con obligaciones legales legítimas.