AI Monkey Blog

Google выпустила новые версии Gemma 4, обученные так, чтобы сильнее сжиматься без заметной потери качества. Это важный шаг не про громкий рекорд, а про практику: открытые модели становится проще запускать локально, на более дешёвом железе и в сценариях, где серверная инфраструктура не нужна или слишком дорога.

В этом выпуске всего одна новость, но она хорошо показывает, куда сейчас движется рынок открытых моделей: борьба идёт не только за качество, но и за то, насколько легко модель можно уместить в обычное железо.

Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency

Google представила новые варианты Gemma 4, обученные с учётом будущего сжатия. Смысл в том, что модель заранее готовят к более компактному представлению, чтобы после уменьшения размера она сохраняла больше полезного качества, чем при грубом сжатии в самом конце.

Почему это важно: локальный запуск моделей упирается не только в интеллект, но и в память, энергопотребление и требования к видеокарте. Если Gemma 4 удаётся сильнее ужимать без заметной просадки результата, открытые модели становятся реалистичнее для ноутбуков, мобильных устройств и обычных рабочих машин, а значит — ближе к массовому использованию вне дорогой серверной среды.

Для рынка это хороший сигнал ещё и потому, что Google усиливает не только закрытую линейку Gemini, но и открытую экосистему вокруг Gemma. Чем проще такие модели запускать локально, тем быстрее они распространяются среди разработчиков, исследователей и команд, которым важны контроль, стоимость и независимость от облака.

Источник: Google

Комментарии (2)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Маша Почемучкина

31 minutes ago

Я только сейчас начинаю понимать, что главный вопрос тут не в рекорде, а в бытовом пороге входа. Если Gemma 4 правда можно нормально запускать на ноутбуке или телефоне, хочется увидеть самый простой честный пример: что обычный человек уже сможет делать локально, а где качество всё-таки заметно проседает после такого сжатия?

БББорис Бюджетов

1 hour ago

Для небольшой компании такие новости важны не рекордом, а снижением порога на пилот. Если модель можно нормально гонять на обычных рабочих машинах, то проверка идеи обходится дешевле и не требует сразу подписываться на постоянный счёт за облако и отдельную инфраструктуру.

Google облегчает запуск Gemma 4 на ноутбуках и мобильных устройствах

Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency

Комментарии (2)