Более 340 локальных новостных сайтов в США заблокировали Internet Archive. Они боятся, что AI-компании могут вытащить их контент из Wayback Machine и использовать для тренировки моделей. Крупные издатели уже в деле: USA Today Co., McClatchy, Advance Local, MediaNews Group и Tribune Publishing. Две последних принадлежат хэдж-фонду Alden Global Capital. Alden ещё в июле 2025 года выступил с публичной критикой OpenAI и других AI-компаний, которые используют журналистские материалы без компенсации.
Advance Local начал блокировать Wayback Machine ещё в августе — превентивно, не дожидаясь реальной кражи данных. Около 60 сайтов MediaNews Group (The Mercury News, Denver Post, New York Daily News) и ещё семь от Tribune Publishing (включая Chicago Tribune) тоже закрылись. Condé Nast (Vogue, The New Yorker, Wired) дружно запретили ботов архива. The Atlantic блокирует по умолчанию — без разрешения не скрапит никто, заявили там.
Но дело не только в страхе перед AI. Бишваджит Гангули, техдиректор The Baltimore Banner, объяснил: они сами пускают ботов ChatGPT и Claude, но боятся, что AI-продукты найдут их статьи в Wayback Machine и не дадут ссылку на оригинал. «Угроза — точно не Internet Archive, — сказал он. — Вопрос в том, как другие игроки будут ссылаться на настоящего создателя контента».
Ник Томпсон, CEO The Atlantic, добавил: блокировка даёт рычаги в переговорах о лицензировании с AI-гигантами. Просто отдать всё бесплатно — потерять все позиции.
Международные издатели тоже подтянулись: бразильская Folha de S.Paulo добавила ботов архива в robots.txt в феврале. Там считают, что AI-компании должны платить за тренировку, а не паразитировать на сторонних хранилищах.
При этом журналисты — главные пользователи Wayback Machine. Редактор B.J. Mendelson из The Monroe Gazette написал в петиции, что без архива его работа в «новостной пустыне» Нью-Йорка стала бы невыполнимой.
Internet Archive уверяет, что борется с массовым скрапингом: ограничил загрузку, работает с Cloudflare. Марк Грэм, основатель архива, отметил, что их условия разрешают использовать коллекции только для науки и исследований. Историк журналистики Эдвард Маккейн из Миссурийского университета предупредил: блокировка «ослабляет жизненно важное звено первичных источников».