На этот раз новость про модели важна не одной цифрой, а всей структурой выпуска. H Company не просто обновила Holo3, а разложила компьютерного агента на несколько рабочих форматов: под разную цену, задержку, приватность и железо. Ниже — все ключевые части релиза Holo3.1, которые стоит держать в поле зрения.
Holo3.1-35B-A3B
Старшая модель в новой линейке остаётся ставкой на максимум качества. По данным H Company, на тесте AndroidWorld версия 35B-A3B поднялась с 67% до 79,3%, а сама Holo3.1 в их собственном контуре Holotab показала больше чем 25-процентный прирост относительно Holo3. Для рынка это важно как сигнал, что компьютерные агенты начинают расти не только в лабораторных сценариях, но и в средах, ближе к реальному использованию.
Источник: Hugging Face
Holo3.1-9B
Версия 9B выглядит как попытка найти более практичный баланс между качеством и задержкой. Компания пишет, что малые модели 4B и 9B на AndroidWorld выросли с 58% до 72%, то есть H Company пытается сделать не только сильный флагман, но и более доступный рабочий вариант для команд, которым важна не только точность, но и стоимость запуска.
Источник: Hugging Face
Holo3.1-4B
Модель 4B адресует тот же практический вопрос, что и 9B: можно ли получить управляемого компьютерного агента без тяжёлой вычислительной цены. В контексте локального и частного запуска это одна из самых важных частей релиза, потому что именно такой размер чаще всего определяет, пойдёт ли технология в пилоты и внутренние инструменты, а не останется красивой витриной.
Источник: Hugging Face
Holo3.1-0.8B
Самая маленькая модель в семействе — это отдельный сюжет про рынок. H Company прямо позиционирует 0,8B как вариант для сверхлёгких локальных агентов, а значит ставка делается уже не только на сильные серверы, но и на сценарии, где важны приватность, компактность и быстрый отклик на стороне пользователя.
Источник: Hugging Face
Квантованные сборки FP8
FP8 — один из первых признаков, что релиз задумывался под реальное внедрение, а не только под публикацию графиков. Компания пишет, что это одна из стартовых квантованных сборок для локального запуска, причём вместе с NVFP4 она держит тот же результат на OSWorld и отстаёт от полной версии модели примерно на два пункта. Это важный компромисс: заметное ускорение без тяжёлой потери качества.
Источник: Hugging Face
Квантованные сборки NVFP4
NVFP4 выглядит самой прикладной частью релиза для тех, кто гонится за скоростью. На DGX Spark эта сборка, по словам H Company, даёт суммарную пропускную способность в 1,41 раза выше, чем FP8, и в 1,74 раза выше, чем у полной версии модели. Вдобавок компания пишет о почти двукратном ускорении полного шага агента — в среднем с 6,8 секунды до 3,3 секунды.
Источник: Hugging Face
Квантованные сборки Q4 GGUF
Q4 GGUF важна тем, что целится уже в потребительское железо и локальный запуск на обычных персональных компьютерах. Если эта часть релиза реально окажется удобной в работе, Holo3.1 может стать не просто моделью для демонстраций компьютерного управления, а более широким входом в частных и корпоративных агентных сценариях, где данные не хочется выносить наружу.
Источник: Hugging Face
Главный вывод из релиза Holo3.1 в том, что рынок компьютерных агентов постепенно выходит из режима «одна большая модель в облаке». Здесь важнее всего не один рекорд, а сама архитектура выпуска: четыре размера моделей и несколько квантованных форматов под локальный запуск. Для команд, которым нужны приватность, гибкость развертывания и контроль над затратами, это может оказаться важнее ещё одного громкого облачного анонса.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Здесь продуктовый сигнал не только в росте качества 35B-A3B, а в самой линейке от 0,8B до 35B: команда продаёт не одну модель, а выбор режима внедрения под приватность, задержку и бюджет. Если пользователи начнут осознанно расходиться по этим сценариям, у H Company появится не просто интерес к релизу, а более сильное удержание за счёт точного попадания в реальные рабочие контуры.