DeepSeek-V4-Pro-DSpark добавляет ускорение вывода к одной из самых заметных открытых моделей

В свежей подборке по открытому ИИ — два сигнала с Hugging Face: DeepSeek выпустила DeepSeek-V4-Pro-DSpark как ускоряющий модуль для уже заметной линейки открытых моделей, а LiquidAI показала LFM2.5-230M — очень компактную модель для запуска прямо на устройстве. Вместе это хорошо показывает, куда сейчас движется экосистема: не только к более сильным моделям, но и к более дешёвому, быстрому и локальному применению.

В открытой экосистеме ИИ сейчас особенно интересно не только кто выпускает самый большой весовой файл, но и кто делает модели практичнее: быстрее, дешевле и ближе к устройству пользователя. В этой короткой подборке — два свежих релиза с Hugging Face, которые как раз про это.

deepseek-ai/DeepSeek-V4-Pro-DSpark

DeepSeek-V4-Pro-DSpark — это не новая базовая модель с нуля, а релиз, который добавляет модуль спекулятивного декодирования к уже существующей DeepSeek-V4-Pro. Проще говоря, команда делает ставку не только на качество самой модели, но и на то, чтобы она отвечала быстрее и обходилась дешевле в работе. На странице модели указано 249 отметок «нравится» на Hugging Face, что для настолько свежего релиза выглядит сильным сигналом интереса сообщества.

Почему это важно: рынок открытых моделей всё чаще упирается не только в возможности, но и в стоимость запуска. Если сильную модель можно заметно ускорить без полной пересборки всей линейки, это сразу делает её привлекательнее для команд, которые хотят внедрять открытые модели в рабочие инструменты, программирование и агентные сценарии без лишних задержек.

Источник: Hugging Face

LiquidAI/LFM2.5-230M

LFM2.5-230M — очень компактная гибридная текстовая модель на 230 миллионов параметров, которую LiquidAI продвигает как вариант для запуска прямо на устройстве. В описании сделан акцент на работу в широком диапазоне железа — от недорогих центральных процессоров до графических ускорителей — а также на сценарии с агентами, вызовом инструментов и извлечением данных. На странице модели сейчас 168 отметок «нравится».

Практический смысл здесь в том, что разговор о локальных моделях постепенно перестаёт быть историей только про мощные рабочие станции. Если столь маленькие модели начинают целиться в полезные прикладные задачи, это усиливает весь сегмент локального ИИ на телефонах, встраиваемых устройствах и недорогих персональных машинах, где важны не рекорды, а скорость, цена и приватность.

Источник: Hugging Face

Комментарии (1)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Вера Багова

2 hours ago

Хочется увидеть не среднее ускорение, а разбивку по длине ответа, размеру пакета и доле неверных предсказаний при спекулятивном декодировании. Без такой таблицы непонятно, где DeepSeek-V4-Pro-DSpark реально ускоряет вывод, а где просто красиво выглядит на коротком показе.

DeepSeek-V4-Pro-DSpark добавляет ускорение вывода к одной из самых заметных открытых моделей

deepseek-ai/DeepSeek-V4-Pro-DSpark

LiquidAI/LFM2.5-230M

Похожие статьи

Комментарии (1)