США заблокировали Claude Fable 5 от Anthropic из-за jailbreak

Крупные AI-лаборатории всё скептичнее относятся к бесконечному наращиванию параметров и данных для обучения. Переломный момент — правительство США запретило Claude Fable 5 от Anthropic через три дня после релиза. Это первый в истории США запрет AI из‑за национальной безопасности: модель заблокировали, потому что один jailbreak представлял слишком большой риск.

Самые большие модели действительно лидируют в рейтингах вроде Artificial Analysis Intelligence Index. Но Z.ai выпустила GLM-5.2 (753B параметров, примерно 40B активных), который уступает GPT-5.5 всего 4 балла, а Fable 5 — 9 баллов. При этом Opus 4.8 и GPT-5.5 — проприетарные модели, их размер оценивают в 1–2 триллиона параметров. Если открытая модель под лицензией MIT может почти догнать закрытую, которая в полтора‑два раза больше, значит, плато интеллекта реально.

Огромные модели часто просто не умеют говорить «я не знаю». DeepSeek V4 Pro (1.6T параметров, 49B активных, 44 балла в AA Intelligence Index) показывает чудовищные 94% галлюцинаций на бенчмарке AA-Omniscience. Когда модель не могла ответить, она лишь в 6% случаев признавалась в этом — остальное время уверенно галлюцинировала. Для сравнения: у GLM-5.2 28% галлюцинаций, у Opus 4.8 — 36%, у Fable 5 — 48%, у GPT-5.5 — 86%.

Пример с относительно сложным вопросом по Python с архитектурной ошибкой: DeepSeek V4 Pro потратил почти в 10 раз больше токенов на рассуждение и выдал уверенно неверный ответ. GLM-5.2 за 12 секунд и около 800 токенов распознал, что однонитевая задача не может выполнять мультиплексированный I/O без системного поллинга. GPT-5.5 и DeepSeek V4 Pro — лидеры по галлюцинациям, несмотря на гигантский размер. Они просто не научились распознавать логические противоречия.

Масштабирование вслепую опасно. DeepSeek V4 Pro потратил три с половиной минуты на вычисления в цикле рассуждений, чтобы сгенерировать красивую, но неверную структуру. Модель вдвое меньше нашла парадокс почти мгновенно. Умнее всего — решать трилемму: сырая способность, калибровка неопределённости (уровень галлюцинаций) и вычислительная эффективность. Дальнейшее наращивание размера моделей не только выходит на плато, но и ухудшает качество — и для индустрии, и для пользователей, которые не должны выбирать модель только по объёму параметров.