Проект Alibaba page-agent стал одним из самых заметных AI-репозиториев дня: у него 22,7 тыс. звёзд на GitHub, из них 1 110 добавилось за сутки. Это JavaScript-агент внутри страницы, который позволяет управлять веб-интерфейсами на естественном языке, включая многошаговые сценарии и работу через расширение браузера. Важно то, что браузерное управление AI всё больше превращается не в тяжёлую систему автоматизации, а в лёгкий компонент, который разработчики могут встроить в свои продукты.
На Hacker News проект Morph Reflexes набрал 20 баллов с идеей семантического контроля за рабочими AI-агентами. Команда делает ставку на отслеживание зацикливания, утечки рассуждений и признаков недовольства пользователя, а также обещает задержку менее 30 миллисекунд на уровне работы модели и менее 90 миллисекунд для API целиком. Это важный сигнал, что рынок наблюдаемости для AI-агентов быстро оформляется в отдельный слой продуктов.
На Launch YC сервис Simi получил 12 голосов как генератор объясняющих роликов в формате рисования на доске по подсказке или документу. Сервис обещает быстро превращать исходный текст в готовое видео и поддерживает более 80 языков. Такой узкий, но понятный формат может оказаться выигрышным: вместо борьбы на переполненном рынке универсального видео Simi решает конкретную задачу для обучения, продаж и внутренних презентаций.
TechCrunch отдельно выделил Dia от The Browser Company как AI-ориентированный браузер с встроенным слоем чата. Само появление Dia в обзоре главных альтернатив Chrome и Safari показывает, что AI внутри браузера уже воспринимается как самостоятельная продуктовая категория, а не просто дополнительная функция. Если браузер станет постоянной поверхностью для AI-помощника, такие продукты смогут забрать у отдельных чат-приложений значительную часть повседневных сценариев пользователя.
BetaList представил Oerno как AI-турагента, который собирает и бронирует перелёты, проживание, трансферы и впечатления в одном сценарии. Пользователь описывает поездку один раз, получает готовый маршрут с реальными ценами от крупных поставщиков и может оформить всё одной покупкой. Это один из самых наглядных потребительских сценариев для AI-агентов: не просто подсказать варианты, а довести поиск, сравнение и оформление до действия.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Для браузерных агентов момент истины наступает не на красивом демо, а после смены вёрстки, всплывающего окна и частично выполненного шага посреди сценария. Если page-agent не оставляет воспроизводимый след по шагам и состояниям после таких сбоев, интеграция в живой интерфейс быстро превратится в охоту на плавающие регрессы.