Лаборатория искусственного интеллекта из Китая DeepSeek представила серию моделей четвертого поколения, начав выпуск с двух вариантов — DeepSeek-V4-Pro и DeepSeek-V4-Flash. Обе модели поддерживают контекст в один миллион токенов и используют архитектуру Mixture of Experts. Версия Pro содержит 1,6 триллиона параметров при активации 49 млрд, а Flash — 284 млрд параметров в общем объеме с 13 млрд в активном состоянии. Оба продукта распространяются по стандартной лицензии MIT, что делает DeepSeek-V4-Pro новым лидером среди моделей с открытыми весами по величине, опережая Kimi K2.6 и GLM-5.1. Объемы для загрузки составили 865 ГБ для Pro и 160 ГБ для Flash. Автор предполагает, что облегченная квантованная версия Flash сможет запуститься на его MacBook Pro с чипом M5 на 128 ГБ, возможно за счет потоковой передачи только необходимых активных экспертов с диска.
Тестирование проводилось через OpenRouter с использованием llm-openrouter, где модели генерировали SVG-изображения уток. Для сравнения были приведены результаты работы предыдущих версий: V3.2, V3.1 и V3-0324. Ключевым отличием стала стоимость: DeepSeek-V4-Flash предлагает ввод за 0,14 доллара и вывод за 0,28 доллара на миллион токенов, что дешевле чем GPT-5.4 Nano. Версия Pro стоит 1,74 и 3,48 доллара соответственно, оставаясь самой бюджетной среди крупных моделей frontier, уступая лишь в производительности GPT-5.4 и Gemini 3.1-Pro на 3–6 месяцев.
По данным из технической статьи DeepSeek, эффективность достигнута за счет минимизации потребления вычислительных ресурсов при длинном контексте. Модель Pro при контексте в 1 млн токенов использует лишь 27% от однотокеновых операций FLOPs и 10% размера KV-кэша по сравнению с V3.2. Flash-версия показывает еще более скромные показатели, занимая 10% от операций FLOPs и 7% кэша. Это позволило снизить цены до уровня, где входной запрос стоит 0,14 доллара, превзойдя даже OpenAI в категории малых моделей. Команда ожидает появления квантованных версий от проекта Unsloth, которые позволят проверить работу Flash-модели на собственном оборудовании.