Fundação Wikimedia Exige que Empresas de IA Paguem por Conteúdo da Wikipédia

A Fundação Wikimedia, que opera a Wikipédia, solicitou que os principais desenvolvedores de IA cessem a extração gratuita de dados da enciclopédia e paguem para usar sua API Empresarial. A organização sem fins lucrativos argumenta que os modelos de IA precisam de informações de alta qualidade, curadas por humanos, mas o tráfego e a carga de servidor massivos causados pela extração não autorizada ameaçam a sustentabilidade da Wikipédia.

Pedido de Compensação Justa da Fundação Wikimedia

A Fundação Wikimedia, a organização sem fins lucrativos por trás da Wikipédia, anunciou que deseja que as empresas de inteligência artificial cessem a extração gratuita de conteúdo da Wikipédia e comecem a pagar para acessar sua API Empresarial. Em um post recente no blog, a fundação enfatizou que os modelos de IA dependem de informações de alta qualidade, curadas por humanos, para permanecer eficazes, e que os artigos editados por voluntários da Wikipédia fornecem exatamente esse nível de confiabilidade e fontes.

Operar a Wikipédia é caro. O site, que está entre as páginas mais visitadas do mundo, exigiu US$ 179 milhões para funcionar durante o último ano fiscal. O financiamento da Wikipédia vem principalmente de doações, e a organização não exibe anúncios. A fundação alertou que, quando os usuários recorrem a ferramentas de IA em vez de visitar a Wikipédia diretamente, eles contornam os pedidos de doação que aparecem na página inicial do site, potencialmente reduzindo a receita da organização sem fins lucrativos.

Solução Proposta de API Empresarial

A solução proposta pela Fundação Wikimedia é conceder às empresas de IA acesso ao seu conteúdo por meio de uma API Empresarial. Essa abordagem permitiria o uso em larga escala de dados da Wikipédia sem sobrecarregar os servidores do site e geraria receita para apoiar a missão da organização sem fins lucrativos. De acordo com a fundação, a API permitiria que as empresas "usem o conteúdo da Wikipédia em larga escala e de forma sustentável, sem sobrecarregar severamente os servidores da Wikipédia, e também permitiria que elas apoiassem nossa missão sem fins lucrativos".

Resposta da Indústria e Acordos Existente

A fundação entrou em contato com representantes de várias empresas de IA líderes, incluindo Google, OpenAI, Meta, Perplexity, Anthropic, Microsoft, DeepSeek e xAI. Nenhuma das empresas respondeu imediatamente aos pedidos de comentário, e um porta-voz da Fundação Wikimedia também não respondeu imediatamente. No entanto, a fundação observou que o Google entrou em um acordo comercial para acessar o conteúdo da Wikipédia em 2022, indicando que alguns arranjos já existem.

Contexto Mais Amplo de Licenciamento de Conteúdo e Processos Judiciais

O pedido da Fundação Wikimedia ocorre em meio a uma onda de ações de criadores de conteúdo online que exigem compensação pelo uso de seu trabalho por sistemas de IA. Editores como Penske, The New York Times e News Corp entraram com processos judiciais alegando violação de direitos autorais, enquanto organizações como a Associated Press e a Reuters assinaram acordos de licenciamento com empresas de IA. A escrutínio aumentado reflete preocupações crescentes sobre como os dados de treinamento de IA são obtidos e se os criadores recebem remuneração justa.

Implicações para o Futuro da IA e do Conhecimento Aberto

Se as empresas de IA escolherem pagar pelos dados da Wikipédia, o arranjo poderia estabelecer um precedente para outros provedores de conteúdo que buscam modelos sustentáveis para compartilhar seu material com desenvolvedores de IA. Isso também reforçaria o princípio de que o uso de dados em larga escala deve ser equilibrado com as realidades financeiras de manter plataformas gratuitas e impulsionadas por voluntários. Por outro lado, uma recusa das empresas de IA em pagar pode levar a Wikipédia a implementar controles de acesso mais rigorosos ou buscar mecanismos de financiamento alternativos para garantir sua viabilidade a longo prazo.