OpenAI Desafía Orden Judicial para que el NYT Acceda a 20 Millones de Conversaciones de Usuarios
Puntos clave
- OpenAI posee una muestra de 20 millones de chats desde dic 2022-nov 2024, excluyendo a clientes comerciales.
- Los datos se almacenan bajo una retención legal y no se pueden utilizar más allá de las obligaciones legales.
- OpenAI ofreció alternativas de privacidad, como búsquedas dirigidas y datos de uso de alto nivel, que el NYT rechazó.
- El New York Times presentó una moción exigiendo el conjunto de datos completo en un disco duro, citando una fecha límite de descubrimiento del 26 de feb 2026.
- OpenAI afirma que la solicitud excede el alcance original, que se limitaba a registros relacionados con contenido del Times.
- OpenAI contenderá cualquier intento de hacer que las conversaciones de los usuarios sean públicas.
OpenAI anunció que una muestra de 20 millones de conversaciones de ChatGPT desde diciembre de 2022 hasta noviembre de 2024 no incluye a clientes comerciales y se almacena bajo una retención legal. La empresa ofreció al New York Times alternativas de privacidad, como búsquedas dirigidas y clasificaciones de uso de alto nivel, pero el periódico las rechazó y presentó una moción exigiendo el conjunto de datos completo en un disco duro.
Antecedentes y Alcance de los Datos
OpenAI reveló que la muestra de 20 millones de chats que posee abarca desde diciembre de 2022 hasta noviembre de 2024 y excluye expresamente conversaciones de clientes comerciales. Los datos residen en un sistema seguro protegido por una retención legal, lo que significa que solo se puede acceder a ellos para cumplir con obligaciones legales.
Alternativas Propuestas por OpenAI
Para abordar la solicitud de descubrimiento del New York Times, OpenAI presentó varias opciones de privacidad. Estas incluyeron búsquedas dirigidas sobre la muestra, lo que permitiría al Times recuperar solo chats que podrían contener texto de sus propios artículos, y una clasificación de alto nivel de cómo se utilizó ChatGPT en la muestra. OpenAI afirmó que el periódico rechazó estas propuestas.
Demanda del New York Times y Contexto Legal
El New York Times presentó una moción el 30 de octubre acusando a OpenAI de desafiar acuerdos previos al negarse a producir incluso una pequeña muestra de los miles de millones de salidas de modelo implicadas en el litigio. La presentación enfatizó que la producción inmediata de la muestra de registro de salida es esencial para cumplir con una fecha límite de descubrimiento del 26 de febrero de 2026. El Times argumentó que la sugerencia de OpenAI de realizar búsquedas en un subconjunto pequeño es ineficiente y inadequada para el análisis de expertos de las funciones del modelo, la generación aumentada de recuperación, la interacción del usuario y la frecuencia de alucinaciones.
Respuesta de OpenAI a la Solicitud Ampliada
OpenAI aclaró que las solicitudes de descubrimiento del Times inicialmente se limitaban a registros "relacionados con contenido del Times". La empresa ha estado trabajando para satisfacer esas solicitudes mediante la muestra de registros de conversación. Cerca del final de ese proceso, los demandantes presentaron una moción exigiendo que se entregue la muestra completa de 20 millones de registros a través de un disco duro, una solicitud que OpenAI afirma excede el alcance original.
Protecciones Legales y Acciones Futuras
OpenAI enfatizó que los registros de chat están bajo retención legal y que el New York Times estaría legalmente obligado a no hacer pública ninguna datos fuera del proceso judicial. La empresa se comprometió a luchar contra cualquier intento de hacer que las conversaciones de los usuarios sean públicas, manteniendo su postura sobre la protección de la privacidad de los usuarios mientras cumple con obligaciones legales legítimas.