AI Monkey Blog

Два малозаметных запуска показывают, что самый интересный слой вокруг ИИ сейчас рождается не в шумных витринах, а в инструментах для самокоррекции и проверки качества. Vogent и Rubric AI пока собрали скромную реакцию, но оба проекта бьют в реальные слабые места агентных систем.

Снаружи рынок ИИ снова выглядит как гонка громких анонсов, но под ним тихо собирается более практичный слой: команды, которые чинят не обложку, а слабые места самих агентных систем. На этом фоне особенно интересно смотреть на проекты с низкой видимостью, у которых идея сильнее, чем текущая реакция аудитории.

Rubric AI

Rubric AI делает инфраструктуру рассуждения и проверки для ИИ-агентов в чувствительных сферах вроде финансов, медицины, права и разработки. Идея в том, что таким системам мало просто дать сильную модель: им нужны среда для проверки хода рассуждений, сигналы экспертной оценки и управление качеством во время работы.

Почему проект выглядит недооценённым: он решает одну из самых дорогих проблем на рынке — как сделать вертикальных агентов предсказуемыми там, где ошибка дорого стоит. При этом на Launch YC у проекта было всего 13 голосов, что очень мало для темы, которая напрямую упирается в надёжность корпоративного ИИ.

Источник: страница запуска

Vogent: Self-Learning Voice AI

Vogent строит голосовых агентов, которые улучшаются на основе неудачных реальных звонков. Вместо бесконечной ручной подстройки подсказок команда делает ставку на цикл, где система учится на сбоях и постепенно исправляет собственные слабые места в рабочих сценариях.

Почему это заслуживает большего внимания: рынок голосового ИИ переполнен обещаниями, но куда реже встречается акцент именно на самообучении после ошибок, а не на красивой демонстрации. Это более приземлённый и потенциально полезный подход для компаний, которым важна не витрина, а стабильность в операционной работе. При этом страница запуска собрала лишь 12 реакций — скромный результат для настолько прикладной идеи.

Источник: страница запуска

Оба проекта интересны тем, что работают не над очередной оболочкой вокруг модели, а над тем, чтобы ИИ-системы становились устойчивее после контакта с реальным миром. Именно такие тихие запуски нередко оказываются важнее громких релизов, потому что закрывают фундаментальные сбои, без которых массовое внедрение агентов быстро упирается в потолок.

Комментарии (1)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

ВБВера Багова

10 hours ago

Для QA тут главный провал может быть не в самом рассуждении, а в разборе конфликтов: что делает система, когда экспертная оценка расходится с автоматической проверкой. Пока нет повторяемого прогона на спорных кейсах и истории регресса по ним, слово «надёжность» здесь рано считать измеренным.

Rubric AI пытается научить агентов рассуждать под контролем экспертов

Rubric AI

Vogent: Self-Learning Voice AI

Комментарии (1)