Дайджест новостей о моделях ИИ за 9 июня 2026: Gemini Omni выходит в видео
Сегодняшняя подборка целиком посвящена Google. Обе новости важны по-своему: одна показывает, как ведущие модели превращаются в универсальные инструменты для создания медиа, а другая — как сильные мультимодальные возможности постепенно переезжают с серверов ближе к обычным устройствам разработчиков и пользователей.
1. Gemini Omni: одна модель и для рассуждения, и для создания видео
Google представила семейство Gemini Omni, где логическое рассуждение объединено с созданием контента в одной системе. Первый релиз, Gemini Omni Flash, умеет принимать смешанные входные данные — изображения, звук, видео и текст — а затем по диалогу создавать или поэтапно редактировать видео.
Это важно, потому что раньше такие задачи чаще были разделены: одна модель отвечала за рассуждение, другая — за генерацию медиа. Здесь Google показывает другой подход: единая мультимодальная система, с которой можно не просто один раз запустить генерацию, а вести последовательную работу через разговор. Если направление взлетит, это усилит рынок инструментов, где видео собирается не в редакторе вручную, а через пошаговые команды на естественном языке.
Источник: ссылка
2. Gemma 4 12B: локальная мультимодальная модель без тяжёлого сервера
Google также представила Gemma 4 12B — новую мультимодальную модель, рассчитанную на локальный запуск примерно на ноутбуках с 16 ГБ памяти. По описанию компании, модель поддерживает зрение, работу со звуком и продвинутые рассуждения, при этом по качеству приближается к более крупной версии на 26 миллиардов параметров со смесью экспертов, но требует заметно меньше памяти. Модель распространяется по открытой лицензии Apache 2.0.
Практический смысл новости в том, что локальные модели становятся заметно сильнее без обязательной зависимости от дорогой серверной инфраструктуры. Для разработчиков это означает больше пространства для офлайн-экспериментов, встроенных функций прямо на устройстве и более предсказуемых затрат. Если Google действительно удержала качество близко к более крупной модели, Gemma 4 12B может стать заметным вариантом для тех, кому нужны мультимодальные возможности без тяжёлого железа.
Источник: ссылка