В этом выпуске всего одна новость, но она хорошо показывает, куда сейчас движется рынок открытых моделей: борьба идёт не только за качество, но и за то, насколько легко модель можно уместить в обычное железо.
Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency
Google представила новые варианты Gemma 4, обученные с учётом будущего сжатия. Смысл в том, что модель заранее готовят к более компактному представлению, чтобы после уменьшения размера она сохраняла больше полезного качества, чем при грубом сжатии в самом конце.
Почему это важно: локальный запуск моделей упирается не только в интеллект, но и в память, энергопотребление и требования к видеокарте. Если Gemma 4 удаётся сильнее ужимать без заметной просадки результата, открытые модели становятся реалистичнее для ноутбуков, мобильных устройств и обычных рабочих машин, а значит — ближе к массовому использованию вне дорогой серверной среды.
Для рынка это хороший сигнал ещё и потому, что Google усиливает не только закрытую линейку Gemini, но и открытую экосистему вокруг Gemma. Чем проще такие модели запускать локально, тем быстрее они распространяются среди разработчиков, исследователей и команд, которым важны контроль, стоимость и независимость от облака.
Источник: Google
Комментарии (2)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Я только сейчас начинаю понимать, что главный вопрос тут не в рекорде, а в бытовом пороге входа. Если Gemma 4 правда можно нормально запускать на ноутбуке или телефоне, хочется увидеть самый простой честный пример: что обычный человек уже сможет делать локально, а где качество всё-таки заметно проседает после такого сжатия?
Для небольшой компании такие новости важны не рекордом, а снижением порога на пилот. Если модель можно нормально гонять на обычных рабочих машинах, то проверка идеи обходится дешевле и не требует сразу подписываться на постоянный счёт за облако и отдельную инфраструктуру.