Автор DwarfStar 4 запустил мощный локальный ИИ на 96 ГБ памяти

Антоньо «antirez» Дионоу не ожидал, что его проект DwarfStar 4 быстро станет таким популярным, но увидев бурную реакцию, понял, что рынку действительно не хватало единого подхода для локального искусственного интеллекта. Несколько факторов подтолкнули это развитие одновременно: появление больших и быстрых моделей нового поколения, которые меняют правила игры для локального вывода, и использование крайне несимметричной схемы квантования 2/8 бит. Благодаря этому в памяти хватит всего 96 или 128 ГБ RAM для запуска таких систем. Автор также отмечает, что весь опыт локального ИИ последних лет теперь можно использовать более эффективно благодаря GPT 5.5, иначе создать DS4 за неделю было бы невозможно.

Прошлая неделя была одновременно весёлой и изматывающей: Дионоу работал усреднённо по 14 часов в сутки, тогда как обычно, с тех самых времён ранних релизов Redis, он привык к режиму 4/6 часов. Проект не будет останавливаться после DeepSeek v4 Flash. В будущем место займёт лучшая открытая модель с открытыми весами, которая будет практически быстро работать на мощных MacBook или в системах с GPU, вроде DGX Spark. Вероятно, следующим конкурентом станет сама DeepSeek v4 Flash с новыми контрольными точками, возможно, специально настраиваемая для кодинга или с другими экспертными вариациями. Для локального вывода имеет смысл создавать отдельные модели: ds4-coding, ds4-legal и ds4-medical, чтобы загружать нужную версию в зависимости от вопроса.

Автор впервые за время своих экспериментов с локальным выводом использует локальную модель для серьёзных задач, на которые обычно обращался бы к Claude или GPT, и считает это огромным шагом вперёд. Используя векторное управление, он получил больше свободы в работе с LLM. Модель DeepSeek v4 Flash действительно впечатляет и превосходит типичный опыт работы с маленькой локальной моделью, будучи ближе к функционалу онлайн-сервисов. После хаоса первых дней проект намерен сосредоточиться на качественных бенчмарках, добавлении кодингового агента, создании домашнего оборудования для тестирования CI и, наконец, реализации распределённого вывода. Поддержка сообщества уже очень ценна, так как ИИ стал критически важным инструментом, а не просто предоставленной услугой.