Google выпустила Gemma 4 12B для ноутбуков с аудио, видео и сниженной задержкой

Gemma 4 12B — новая модель от Google. Она сочетает возможности мультимодального агентного ИИ с размером, подходящим для ноутбука. Это промежуточное решение между компактной E4B и более мощной 26B Mixture of Experts (MoE). Модель умещается в 16 ГБ памяти — то есть может работать на обычном потребительском железе.

Главная фишка — архитектура без отдельных мультимодальных энкодеров. Визуальная и аудиоинформация поступают напрямую в LLM-ядро. Это первая среднеразмерная модель Google с нативной поддержкой аудиовходов.

По тестам Gemma 4 12B почти догоняет старшую 26B MoE, но требует меньше чем вдвое меньше памяти. Это даёт возможность запускать многошаговые рассуждения и агентные сценарии прямо на локальной машине. Модель выходит под лицензией Apache 2.0 — открыто и для разработчиков, и для коммерции.

Ещё одна деталь — встроенные Multi-Token Prediction (MTP) drafters. Они предсказывают сразу несколько токенов за раз, снижая задержку. Это важно для работы в реальном времени на ограниченном железе.

Экосистема Gemma 4 уже перешагнула отметку в 150 миллионов загрузок. Сообщество успело собрать на этих моделях всё: от носимых роботизированных рук до корпоративных систем ИИ-безопасности. Теперь к ним добавляется ещё один вариант — лёгкий, быстрый и готовый к работе прямо на ноутбуке.