Google сделала шаг, который хорошо показывает, куда движется рынок моделей: возможность управлять компьютером теперь стала частью основной быстрой модели, а не отдельным экспериментом.

Google встроила в Gemini 3.5 Flash режим управления компьютером

По сообщению Google, в Gemini 3.5 Flash теперь штатно встроен режим, который позволяет модели видеть экран, рассуждать по шагам и выполнять действия в интерфейсе. Практический смысл здесь в том, что агентные сценарии для браузера, настольных программ и рабочих инструментов становятся ближе к обычному применению: разработчикам больше не нужно держать отдельную специализированную модель только ради такого режима.

Почему это важно: рынок быстро уходит от формата, где модель только отвечает на запрос, к формату, где она умеет действовать в среде. Если такая возможность появляется внутри быстрой массовой модели, это снижает порог для автоматизации рутинных задач и делает ИИ-агентов заметно проще для внедрения в реальные процессы.

Источник: Google