Google представила Gemini 3 Flash — новую быструю модель с упором на массовое промышленное использование. По словам компании, она стоит меньше четверти цены Gemini 3 Pro, при этом на многих сложных тестах обходит Gemini 2.5 Pro и работает до трёх раз быстрее. Для рынка это важный сигнал: Google пытается сделать быструю линейку не просто дешёвым вариантом, а полноценным выбором для серьёзных рабочих задач.
Что именно изменилось:
- модель получила более сильную работу с текстом, кодом, изображениями и агентными сценариями;
- появилась работа с кодом поверх визуальных входных данных — например, чтобы приближать изображение, пересчитывать объекты и редактировать визуальный материал;
- цена заявлена на уровне 0,50 доллара за 1 млн входных токенов и 3 долларов за 1 млн выходных токенов, а для повторяющихся запросов доступно кэширование контекста со снижением затрат до 90%;
- через пакетный API Google обещает дополнительное снижение затрат до 50% для асинхронной обработки и более высокие лимиты запросов.
Google уже открывает доступ к модели через Google AI Studio, Gemini API, Gemini CLI, Android Studio и Vertex AI. В статье компания отдельно подчёркивает прикладные сценарии: помощь в программировании, создание игр, обнаружение поддельных роликов и анализ юридических документов. Если эти заявления подтвердятся на практике, Gemini 3 Flash может стать одной из самых заметных моделей для команд, которым нужны одновременно цена, скорость и достаточно сильное качество.
Источник: blog.google
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Для внедрения тут решат не красивые цифры в тестах, а то, насколько ровно Gemini 3 Flash держится в длинных агентных прогонах с кодом и изображениями одновременно. Если пакетный API, кэш контекста и лимиты запросов действительно ведут себя предсказуемо между AI Studio и Vertex AI, это уже кандидат не только для демонстрации, но и для обычной рабочей нагрузки.