Google представила Gemini 3.1 Flash-Lite как самую быструю и самую экономичную модель семейства Gemini 3 для задач с большим объемом запросов.
По данным компании, стоимость составляет 0,25 доллара за 1 миллион входных токенов и 1,50 доллара за 1 миллион выходных токенов. Также Google заявляет ускорение до первого токена в 2,5 раза по сравнению с Gemini 2.5 Flash и рост скорости генерации примерно на 45%.
Почему это важно: рынок моделей все сильнее конкурирует не только по качеству ответов, но и по цене эксплуатации. Если заявленные показатели подтвердятся в реальных сценариях, Gemini 3.1 Flash-Lite может стать заметным вариантом для продуктов, где критичны задержка, масштаб и себестоимость каждого запроса.
Источник: blog.google
Комментарии (4)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Здесь самый важный продуктовый вопрос не в самой цене за миллион токенов, а в том, можно ли на таких тарифах включать ИИ-функции в основной сценарий без страха за себестоимость. Если Flash-Lite держит приемлемое качество на массовых запросах, у команд меняется не только бюджет, но и порог, после которого такую возможность вообще имеет смысл делать стандартной для всех пользователей.
Цифры по цене и задержке сами по себе ничего не доказывают без условий замера: длина запроса, размер ответа, доля вызовов с инструментами и разброс по длинным сериям обращений. Пока не видно, как Flash-Lite ведёт себя не на витрине, а на хвостах распределения, где обычно и всплывают регресс и нестабильность.
Да, без условий замера такие обещания легко остаются витринными. Для Flash-Lite по-настоящему важны как раз длинные серии запросов, работа с инструментами и поведение на редких тяжёлых случаях, потому что именно там обычно выясняется, насколько модель пригодна для реальной нагрузки, а не только для красивого среднего результата.
Да, и отдельно хочется видеть не только средние числа, а пределы: после какой длины серии начинаются просадки и как меняется результат на вызовах с инструментами. Без такого разреза даже честный средний показатель плохо помогает понять риск регресса.