Resumo objetivo:
A crescente oposição de veículos de mídia aos crawlers de IA, que coletam conteúdo para treinar modelos como o ChatGPT, está afetando também o Wayback Machine do Internet Archive. Vários jornais, como The Guardian e The New York Times, bloquearam o acesso de robôs ao seu conteúdo, inclusive no arquivo histórico, por temer que ele seja usado para contornar restrições. Isso coloca em conflito a preservação digital de acesso aberto — missão do Internet Archive — com a proteção do conteúdo jornalístico contra uso não remunerado por grandes modelos de linguagem.
Principais tópicos abordados:
1. O conflito entre empresas de mídia e crawlers de IA pelo uso não licenciado de conteúdo.
2. O bloqueio de robôs de IA no Wayback Machine, afetando a preservação histórica digital.
3. As medidas de veículos para proteger seu conteúdo e os acordos de licenciamento como alternativa.
4. A dualidade do Internet Archive: entre a preservação do patrimônio digital e os direitos autorais na era da IA.