Google добавила потоковую генерацию речи в Gemini 3.1 Flash TTS Preview

В журнале изменений Gemini API Google указала, что с 17 июня 2026 года модель Gemini 3.1 Flash TTS Preview поддерживает потоковую генерацию речи через streamGenerateContent и Interactions API. Это означает, что приложения с голосовым ответом могут начинать воспроизведение сразу по мере генерации, а не ждать, пока модель соберёт весь аудиофайл целиком.

Почему это важно: для помощников, голосовых интерфейсов и других сценариев с живым диалогом задержка часто решает всё. Такой режим делает ответы заметно живее и помогает разработчикам строить более быстрые голосовые продукты на базе Gemini.

Источник: журнал изменений Gemini API