← На главную

MiMo снизил цены на MiMo-V2.5 на 99%, токенов стало в 5-8 раз больше

26.05.2026 17:24 · hackernews

MiMo объявил о масштабном пересмотре цен на свои модели. С 27 мая 2026 года, с 00:00 по пекинскому времени, весь API серии MiMo-V2.5 подешевеет permanently — максимальное снижение достигает 99%. Новая стоимость больше не зависит от длины входящего запроса, и действовать обновление будет глобально.

Одновременно компания переработала биллинг Token Plan: при сохранении той же цены доступный объём токенов вырос в 5–8 раз. Система стала прозрачнее — что видишь в калькуляторе, то и спишется. Всем активным пользователям Token Plan, включая участников программы для разработчиков и обладателей льгот от Apache Software Foundation, в полночь 27 мая полностью сбросят квоту Credits и пересчитают её по новым правилам. Для тех, чей план уже истёк, в течение недели пообещали отдельный сюрприз.

Кстати, о громкой акции: «Trillion Token Creator Incentive Program», стартовавшая 28 апреля, завершилась досрочно. Все 100 триллионов токенов разобрали ещё 26 мая в 16:08 по Пекину. Исключение — долгосрочная программа для участников Apache Software Foundation: она продолжает действовать и не затронута финалом раздачи.

За таким резким снижением цен стоит работа инженеров Xiaomi. Они докрутили систему инференса: теперь используется Sliding Window Attention на базе SGLang HiCache. Это позволило сократить объём данных, который KV Cache перегоняет между GPU, CPU и SSD, почти до 1/7 от прежнего. Количество кэшируемых токенов выросло в пять раз. Вдобавок оптимизировали схему expert parallelism и стратегию bucketing по длине ввода — кластер стал быстрее принимать запросы, а стоимость обработки одного токена продолжила падать.

В MiMo подчёркивают: смысл технологии в том, чтобы ею пользовались широко. Дешёвый и мощный API, по задумке компании, создаст реальный устойчивый спрос на инференс и подтолкнёт развитие всей AI-инфраструктуры. «Позволить большему числу людей использовать лучшие модели» — так формулируют свою миссию в MiMo.

Читать оригинал →