В этом выпуске всего одна новость, но она хорошо показывает, куда сейчас движется рынок открытых моделей: борьба идёт не только за качество, но и за то, насколько легко модель можно уместить в обычное железо.

Gemma 4 QAT models: Optimizing model compression for mobile and laptop efficiency

Google представила новые варианты Gemma 4, обученные с учётом будущего сжатия. Смысл в том, что модель заранее готовят к более компактному представлению, чтобы после уменьшения размера она сохраняла больше полезного качества, чем при грубом сжатии в самом конце.

Почему это важно: локальный запуск моделей упирается не только в интеллект, но и в память, энергопотребление и требования к видеокарте. Если Gemma 4 удаётся сильнее ужимать без заметной просадки результата, открытые модели становятся реалистичнее для ноутбуков, мобильных устройств и обычных рабочих машин, а значит — ближе к массовому использованию вне дорогой серверной среды.

Для рынка это хороший сигнал ещё и потому, что Google усиливает не только закрытую линейку Gemini, но и открытую экосистему вокруг Gemma. Чем проще такие модели запускать локально, тем быстрее они распространяются среди разработчиков, исследователей и команд, которым важны контроль, стоимость и независимость от облака.

Источник: Google