На свежих страницах Y Combinator хорошо видно, как рынок агентных продуктов взрослеет. Внимание смещается от общего восторга вокруг ИИ-агентов к более приземлённым вопросам: как их быстро собирать, как делать их дешевле и точнее после первого запуска, как ловить сбои до жалоб пользователей и как вообще понять, что ваш сервис удобен не только людям, но и программным исполнителям.
Okibi — конструктор ИИ-агентов на естественном языке
Okibi предлагает веб-приложение, где агент собирается не через ручную настройку сложной цепочки, а через обычное текстовое описание задачи. Сервис сам подставляет вызовы инструментов, работу с браузером, участие человека в нужных шагах и первичную проверку качества. На странице запуска у проекта 154 голоса, а команда пишет, что уже работает с 15 компаниями из Y Combinator — это сильный сигнал, что боль настоящая, а не придуманная под демо. Если продукт действительно удержит простоту при росте сложности сценариев, он может стать удобным входом для стартапов, которым нужны агенты без собственной тяжёлой платформенной команды.
Источник: Y Combinator
Osmosis — слой реального обучения для ИИ-агентов
Osmosis делает ставку на то, что агент должен учиться не где-то потом, а прямо по ходу работы. Команда описывает систему как небольшое добавление в существующую инфраструктуру агента: она сохраняет прошлые взаимодействия, ищет похожие случаи, подсказывает план действий и затем оценивает результат, чтобы следующий проход был лучше. На запуске у проекта тоже 154 голоса, а сама подача опирается на очень конкретные обещания по цене и скорости: выше точность первого прохода, меньше шагов и более дешёвое выполнение по сравнению с базовыми сценариями без такого слоя памяти. Если эти цифры держатся вне демонстрации, Osmosis попадает в одну из самых дорогих проблем агентного рынка — повторение одних и тех же ошибок при каждом новом запуске.
Источник: Y Combinator
Sentrial — мониторинг сбоев ИИ-агентов до жалоб пользователей
Sentrial пришла на Hacker News с очень прикладным обещанием: ловить зацикливание, галлюцинации, неправильное использование инструментов, неверно понятые намерения и просадку качества до того, как это заметит клиент. Тяга к такому слою понятна: когда агенты выходят из лаборатории в продукт, обычных журналов событий уже недостаточно, потому что команде нужен не просто след выполнения, а внятная диагностика того, где именно система начала принимать плохие решения. В обсуждении запуск набрал 31 балл и 14 комментариев — не взрывной шум, но вполне здоровый сигнал для инфраструктурного инструмента, который продаёт не эффектность, а снижение риска.
Источник: Hacker News
Armature — аналитика того, насколько продукт удобен для агентов
Armature смотрит на проблему с необычной стороны: не просто помогает запускать агентов, а измеряет, как сами агенты «видят» ваш продукт через программные интерфейсы и командные инструменты. На странице запуска у сервиса 25 голосов, и это скорее ранний, но содержательный сигнал: рынок начинает задумываться не только о том, что агент умеет, но и о том, насколько среда вокруг него вообще пригодна для работы. Такой подход может оказаться важным для компаний, которые хотят оптимизировать не человеческий путь пользователя, а путь ИИ-исполнителя — где тот спотыкается, где теряет шаги и какие действия в интерфейсе или инфраструктуре делают автоматизацию хрупкой.
Источник: Y Combinator
Если смотреть на эти четыре запуска вместе, вырисовывается важный сдвиг: следующая волна агентных стартапов пытается зарабатывать не на самом слове «агент», а на инструментах, которые делают агентов управляемыми, дешевле в эксплуатации и полезнее в реальной работе. Это уже не витрина с обещаниями, а борьба за инженерную инфраструктуру вокруг нового класса программных работников.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Вот тут я невольно улыбаюсь: каждые десять лет индустрия обещает убрать ручную сборку, а потом выясняется, что настоящая магия не в кнопке, а в том, как аккуратно встроены человек, инструменты и проверка результата. Если Okibi действительно сделал этот скучный слой незаметным, это уже не фокус, а взрослая инженерия.