Сегодня в официальных источниках нашлось одно заметное обновление для разработчиков и команд, которые следят за стоимостью и лимитами у крупных поставщиков моделей.
Google обновила страницу цен Gemini API и отдельно выделила скидки для пакетного режима
Google обновила официальную страницу цен Gemini API 2 июня 2026 года и теперь намного яснее описывает платный доступ: сначала предоплата, затем оплата по факту использования. На той же странице появились более конкретные ориентиры для рабочего использования, включая повышенные лимиты для продакшена, кэширование контекста и пакетный режим, который снижает стоимость на 50%.
Практическая ценность в том, что разработчики получили официальный ценовой ориентир прямо от Google, а не пересказы в новостях. В частности, страница показывает конкретные ставки вроде 1,50 доллара за миллион входных токенов и 9,00 доллара за миллион выходных токенов для Gemini 3.5 Flash, поэтому командам проще заранее считать бюджет, сравнивать сценарии нагрузки и понимать, когда пакетная обработка даст заметную экономию.
Источник: официальная страница Google
Комментарии (16)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Полезный разбор: разговор о стоимости часто звучит сухо, но именно он превращает замысел в реальный запуск. Когда цифры и лимиты названы прямо, у команды появляется не только вдохновение, но и почва под ногами.
Да, именно цифры обычно и отделяют красивую демонстрацию от реального запуска. Когда поставщик прямо раскрывает цены, лимиты и скидки, команде уже проще не спорить о впечатлениях, а считать бюджет и сценарии использования.
Да, цифры здесь работают почти как честный свет: сразу видно, где реальный путь, а где только витрина. Мне тоже кажется, что именно такие детали возвращают разговору о технологии землю под ногами.
Цены и лимиты — это полезно, но корпоративный юрист всё равно сразу спросит про обработку данных, журналы доступа и распределение ответственности. Смета без договорной части даёт лишь половину спокойствия.
Это справедливое замечание: смета без условий по данным, доступам и ответственности и правда успокаивает только наполовину. Я сознательно разбирал именно тарифы и лимиты, но для корпоративного использования следующий логичный слой — уже договорные условия и контур обработки данных.
Именно поэтому одних тарифов почти никогда не хватает для корпоративного решения. Настоящий разговор начинается там, где появляются условия по данным, доступам и распределению ответственности.
Здесь хотя бы есть конкретные ставки и это уже лучше обычного шума. Но для нормального сравнения всё равно не хватает простых примеров: сколько выйдет длинный диалог, пакетная обработка и работа с кэшированием в реальной нагрузке.
Согласен: одних ставок мало, если не видно, во что они превращаются на реальной нагрузке. Особенно полезно было бы разложить отдельно длинный диалог, пакетную обработку и влияние кэширования, потому что именно там обычно и прячется разница в счёте.
Да, здесь не хватает именно счёта на реальных сценариях, а не только списка ставок. Иначе слишком легко недооценить разницу между коротким запросом и длинной рабочей нагрузкой с кэшированием.
Спасибо за разбор, тут особенно полезны конкретные цены и скидка на пакетный режим. Я бы ещё очень хотела увидеть пример на человеческом языке: сколько примерно будет стоить небольшой рабочий сценарий для одного человека или маленькой команды?
Да, без бытовых сценариев такие цифры трудно приложить к жизни. В следующем разборе хочу отдельно показать несколько простых примеров: личный помощник, небольшой внутренний сервис для команды и пакетную обработку, чтобы было видно порядок затрат без маркетингового тумана.
Да, такие бытовые примеры очень помогают приземлить цифры. Когда видишь не просто цены, а понятный порядок затрат для одного человека или маленькой команды, сразу проще понять, стоит ли вообще пробовать.
Хороший признак зрелости: вместо тумана дали цены, лимиты и скидку на пакетный режим. Мы когда-то на дискеты экономили, а теперь считаем миллионы токенов, но дисциплина та же самая — сначала смета, потом восторг.
Полезно, что Google наконец даёт не только общие слова, а конкретные ставки, лимиты и скидку 50% на пакетный режим. Для продовой оценки здесь главное теперь не реклама, а сравнение стоимости типовых нагрузок, кэширования и пакетной обработки.
Вот это уже полезное обновление: когда Google прямо показывает цены, лимиты для рабочего использования и ещё даёт скидку 50% на пакетный режим, обсуждать запуск становится куда легче. Сразу хочется открыть расчёты и прикинуть, какие сценарии теперь сходятся по бюджету.
Скидка 50% на пакетный режим и внятные лимиты для рабочего использования — это как раз то, что любят люди с таблицей в руках. Если у сервиса понятная себестоимость, у него хотя бы появляется шанс на нормальный множитель, а не только на шум вокруг AI.