Reddit demanda a Perplexity y a recopiladores de datos por presunta cosecha ilegal de contenido

Puntos clave
- Reddit presenta una demanda contra Perplexity y tres empresas de recopilación de datos - SerpApi, Oxylabs y AWMProxy.
- La queja alega una evasión ilegal a gran escala de las protecciones de datos de Reddit.
- Perplexity es acusada de ser cliente de al menos uno de los recopiladores y de utilizar contenido de Reddit robado para su motor de respuestas de inteligencia artificial.
- Reddit envió una carta de cese y desistimiento a Perplexity en mayo de 2024, que la empresa afirmó respetar, pero las citas aumentaron después.
- Un contenido de Reddit solo accesible a través de Google fue reproducido por Perplexity dentro de horas, sugiriendo que los datos se recopilaron de los resultados de búsqueda de Google.
- Reddit describe las acciones de los demandados como parte de una "economía de lavado de datos" que apunta a contenido generado por usuarios valioso.
- La demanda sigue a acciones legales anteriores de Reddit contra Anthropic por alegaciones similares.
- Perplexity aún no ha sido notificada y mantiene que actúa de manera responsable en el desarrollo de inteligencia artificial.
Reddit ha presentado una demanda contra Perplexity y tres proveedores de servicios de recopilación de datos - SerpApi, Oxylabs y AWMProxy - acusándolos de una gran evasión ilegal de las protecciones de datos de la plataforma. La queja alega que Perplexity, como cliente de al menos uno de los recopiladores, utilizó contenido de Reddit robado para alimentar su motor de respuestas de inteligencia artificial a pesar de una carta de cese y desistimiento enviada en mayo de 2024.
Antecedentes
Reddit, una de las mayores colecciones de conversaciones humanas en internet, se ha convertido en una fuente codiciada de material de entrenamiento para modelos de inteligencia artificial. En respuesta a preocupaciones sobre la compensación por el uso de sus datos, Reddit introdujo cambios en la API en 2023 y desde entonces ha entrado en acuerdos de licencia con importantes empresas de inteligencia artificial, incluidas OpenAI y Google.
Alegaciones contra Perplexity y los recopiladores
La demanda afirma que Perplexity y tres proveedores de servicios de recopilación de datos - SerpApi, Oxylabs y AWMProxy - se involucraron en una "evasión ilegal a gran escala de las protecciones de datos". Reddit compara a los recopiladores con "posibles ladrones de bancos" que, incapaces de entrar en una bóveda, apuntan al camión blindado que lleva dinero. Según la queja, Perplexity es cliente de al menos uno de estos recopiladores y optó por obtener contenido de Reddit a través de ellos en lugar de negociar un acuerdo directo.
Reddit envió una carta de cese y desistimiento a Perplexity en mayo de 2024, exigiendo que la empresa detuviera la recopilación de datos de Reddit. Perplexity respondió que no utilizaba contenido de Reddit para entrenar modelos de inteligencia artificial y respetaría el archivo robots.txt de Reddit. A pesar de esa respuesta, Reddit afirma que el volumen de citas a su contenido en la plataforma de Perplexity aumentó después de que se envió la carta.
En un incidente ilustrativo, Reddit publicó un contenido que solo podía accederse a través de una búsqueda de Google. Dentro de horas, Perplexity reprodujo el contenido exacto de esa publicación, lo que llevó a Reddit a concluir que la empresa debió haber recopilado resultados de búsqueda de Google para obtener el material de Reddit y luego lo incorporó a su motor de respuestas.
Reclamaciones legales y contexto
La queja caracteriza la conducta de los demandados como parte de una economía más amplia de "lavado de datos", donde los recopiladores evaden las protecciones tecnológicas, roban datos y los venden a desarrolladores de inteligencia artificial ansiosos por contenido humano de alta calidad. El oficial jurídico principal de Reddit, Ben Lee, calificó a los demandados de "ejemplos de libro de texto" de comportamiento ilegal, señalando que ocultan sus identidades, esconden ubicaciones y disfrazan los recopiladores web para robar contenido de Reddit de los resultados de búsqueda de Google.
La acción legal de Reddit sigue a una litigación anterior, incluida una demanda contra Anthropic por presunto acceso no autorizado a la plataforma de Reddit. La empresa enfatiza que sus publicaciones generadas por usuarios son activos valiosos que deben accederse a través de acuerdos legales, no a través de operaciones de recopilación encubiertas.
Respuesta de Perplexity
Perplexity aún no ha sido notificada de la demanda. Un portavoz de la empresa, Jesse Dwyer, declaró que Perplexity no ha recibido la queja legal y reiteró el compromiso de la empresa con el "desarrollo de inteligencia artificial principista y responsable". Dwyer enfatizó que Perplexity busca proporcionar respuestas factuales con inteligencia artificial precisa mientras respeta el interés público y la apertura.
La demanda de Reddit busca detener la presunta cosecha ilegal de datos y responsabilizar a los demandados por lo que describe como un esfuerzo a gran escala para robar contenido con derechos de autor.