Нидерланды запускают собственную языковую модель GPT-NL. Проект строят с прицелом на суверенитет и прозрачность — полный контроль над технологией остаётся внутри страны и Европы. Никакой зависимости от провайдеров за пределами ЕС. Модель обучают с нуля, чтобы избежать мутного происхождения данных, проблем с копирайтом и случайного попадания личной информации из чужих моделей.
Датасет собирают по жёстким правилам: защита интеллектуальной собственности, удаление и анонимизация персональных данных, исключение конфиденциальной информации, вредного контента и дубликатов. Код публикуют как open source, веса модели распространяют под контролируемой лицензией — это позволяет отслеживать, кто пользуется моделью, и сообщать пользователям об обновлениях, например после запроса на удаление данных из набора.
GPT-NL строит чистую и законную цепочку поставки данных. Разработчики тесно работают с поставщиками контента и дают им право голоса через Content Board. Часть доходов возвращается создателям — ценность делят, а не забирают. Про авторов прямо сказано: «fairer innovation model».
Проект уделяет внимание энергоэффективности и ответственному использованию ресурсов. На основе научных исследований оптимизируют размер модели и процесс обучения, явно считая потребление энергии и воды.
Финансирование — €13,5 млн от Netherlands Enterprise Agency (RVO) по поручению Министерства экономики и климатической политики. Публичные деньги подчёркивают важность независимой и надёжной нидерландской модели. GPT-NL показывает: мощный ИИ и общественные ценности вполне совместимы.