Cohere выпустила открытую MoE-модель North Mini Code для кода

Cohere выпустила открытую модель North Mini Code. Это mixture-of-experts (MoE) модель — первая агентная coding-модель компании и первый представитель нового поколения. У неё 30B параметров всего, но активны только 3B. То есть работает эффективно и не требует мощного железа. Лицензия — Apache 2.0. Контекст — 256K, генерация — до 64K.

Модель заточена под код, агентную разработку и терминальные задачи. На бенчмарках показывает сильные результаты для своего размера. Например, на Artificial Analysis Coding Index у неё 33.4 балла — конкурентная позиция среди аналогичных моделей.

Cohere сравнила North Mini Code с Devstral Small 2. В их тестах новая модель выдаёт до 2.8x больше токенов в секунду при одинаковой нагрузке. То есть почти в три раза быстрее выполняет работу. Ещё у North Mini Code на 30% лучше inter-token latency — токены генерируются ровнее и быстрее подряд. По времени до первого токена (TTFT) Devstral Small 2 чуть впереди, но разница небольшая.

Это первая открытая модель Cohere для разработчиков. Она предназначена для агентных сценариев: понимать и координировать суб-агентов, анализировать архитектуру системы, проводить code review. Можно развернуть on-prem или локально.

Веса лежат на Hugging Face. Для инференса есть Cohere Model Vault (управляемая среда) и OpenCode. Можно попробовать бесплатно через OpenCode или по Cohere API key. Компания ждёт фидбек от сообщества — обещают, что он повлияет на дорожную карту.

North Mini Code — первый, но не последний в новой линейке. Cohere пишет, что продолжит наращивать возможности с учётом мнения пользователей. Модель совместима с большинством кодинг-агентов, но специально обучали для OpenCode.