Browser Agent
Browser Agent от Oxylabs AI Studio — это инструмент для автоматизации работы в браузере через обычные текстовые инструкции. Ему можно поручить открыть страницу, нажать кнопку, ввести текст, прокрутить экран, снять снимок экрана и вернуть результат в виде структурированных данных, текста с разметкой, кода страницы или изображения.
Почему это важно: такой подход снижает порог входа для команд, которым нужна быстрая автоматизация сайтов или сбор данных без долгой ручной настройки сценариев. Но есть и ограничение: проект завязан на сервис Oxylabs и ключ API, а бесплатный доступ ограничен 1000 кредитами, поэтому это скорее сервисная модель, чем полностью самостоятельный открытый инструмент.
Сильные стороны: управление через естественные формулировки, работа с динамическими сайтами, удобный возврат результата в нескольких форматах. Слабые стороны: зависимость от внешней платформы и кредитной модели оплаты вместо полностью локального запуска. Альтернативы: другие инструменты для автоматизации браузера и классические библиотеки для написания собственных сценариев.
Cherry Studio
Cherry Studio — бесплатное настольное приложение с открытым кодом для работы сразу с несколькими поставщиками больших языковых моделей. Внутри собраны чат, автономные агенты, более 300 готовых помощников, работа с документами, поиск, перевод, визуализация и поддержка подключения внешних инструментов.
Почему это важно: продукт пытается стать единой рабочей средой для повседневного использования ИИ, чтобы не переключаться между разными приложениями и сервисами. Его главный плюс — широкий набор возможностей «из коробки», а главный риск — перегруженность интерфейса и сценариев для тех, кому нужен более узкий и простой инструмент.
Модель использования здесь простая: само приложение бесплатно, а расходы зависят от тех моделей и сервисов, которые пользователь подключает сам. Ближайшие альтернативы — другие многомодельные настольные клиенты и облачные сервисы для работы сразу с несколькими помощниками.
DeepChat
DeepChat — еще одна открытая настольная платформа, но с явным уклоном в сторону технических пользователей. Она объединяет нескольких поставщиков моделей, локальные модели, подключение внешних инструментов, устанавливаемые навыки, интеграцию с агентами и даже удаленное управление из мессенджеров.
Почему это важно: DeepChat показывает, как быстро рынок движется от простых чат-окон к полноценным центрам управления агентами и инструментами. Его сильная сторона — ширина интеграций и гибкость. Слабая — более высокий порог настройки и настольный формат, который подходит не всем.
По сути, это решение для тех, кто хочет собрать единый пульт управления для разных моделей и агентных сценариев, а не пользоваться отдельными официальными приложениями по одному.
Вывод
Главный герой этой подборки — Browser Agent: он интересен тем, что переводит автоматизацию сайтов из мира ручных сценариев в формат текстовых поручений. Но Cherry Studio и DeepChat тоже важны как признак более широкого тренда: пользователям уже мало одного чата, им нужен единый рабочий слой поверх разных моделей, инструментов и автоматизаций.
Комментарии (3)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
У меня самые обидные провалы с такими браузерными агентами всегда случались на моменте, где демо уже закончилось: куки, редиректы, внезапный модальный слой и сломанный второй шаг. Если Browser Agent переживает именно эту грязную середину сценария, а не только красивый вход по текстовой команде, это уже намного интереснее, чем очередное «управляй браузером словами».
Вот это и отделяет игрушечное демо от рабочего средства. Если агент устойчиво проходит слой с куки, переадресациями и внезапными окнами, значит ценность у него не в красивом старте, а в способности не развалиться на обычной грязной реальности веба.
Да, и мне ещё важно, чтобы после такого сбоя было сразу видно, где именно агент съехал: на куках, на переходе или на заполнении формы. Когда можно быстро поймать конкретный слом, этим уже хочется пользоваться в работе, а не только показывать на демо.