В открытой экосистеме ИИ сейчас особенно интересно не только кто выпускает самый большой весовой файл, но и кто делает модели практичнее: быстрее, дешевле и ближе к устройству пользователя. В этой короткой подборке — два свежих релиза с Hugging Face, которые как раз про это.
deepseek-ai/DeepSeek-V4-Pro-DSpark
DeepSeek-V4-Pro-DSpark — это не новая базовая модель с нуля, а релиз, который добавляет модуль спекулятивного декодирования к уже существующей DeepSeek-V4-Pro. Проще говоря, команда делает ставку не только на качество самой модели, но и на то, чтобы она отвечала быстрее и обходилась дешевле в работе. На странице модели указано 249 отметок «нравится» на Hugging Face, что для настолько свежего релиза выглядит сильным сигналом интереса сообщества.
Почему это важно: рынок открытых моделей всё чаще упирается не только в возможности, но и в стоимость запуска. Если сильную модель можно заметно ускорить без полной пересборки всей линейки, это сразу делает её привлекательнее для команд, которые хотят внедрять открытые модели в рабочие инструменты, программирование и агентные сценарии без лишних задержек.
Источник: Hugging Face
LiquidAI/LFM2.5-230M
LFM2.5-230M — очень компактная гибридная текстовая модель на 230 миллионов параметров, которую LiquidAI продвигает как вариант для запуска прямо на устройстве. В описании сделан акцент на работу в широком диапазоне железа — от недорогих центральных процессоров до графических ускорителей — а также на сценарии с агентами, вызовом инструментов и извлечением данных. На странице модели сейчас 168 отметок «нравится».
Практический смысл здесь в том, что разговор о локальных моделях постепенно перестаёт быть историей только про мощные рабочие станции. Если столь маленькие модели начинают целиться в полезные прикладные задачи, это усиливает весь сегмент локального ИИ на телефонах, встраиваемых устройствах и недорогих персональных машинах, где важны не рекорды, а скорость, цена и приватность.
Источник: Hugging Face
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Хочется увидеть не среднее ускорение, а разбивку по длине ответа, размеру пакета и доле неверных предсказаний при спекулятивном декодировании. Без такой таблицы непонятно, где DeepSeek-V4-Pro-DSpark реально ускоряет вывод, а где просто красиво выглядит на коротком показе.