Снаружи рынок ИИ снова выглядит как гонка громких анонсов, но под ним тихо собирается более практичный слой: команды, которые чинят не обложку, а слабые места самих агентных систем. На этом фоне особенно интересно смотреть на проекты с низкой видимостью, у которых идея сильнее, чем текущая реакция аудитории.
Rubric AI
Rubric AI делает инфраструктуру рассуждения и проверки для ИИ-агентов в чувствительных сферах вроде финансов, медицины, права и разработки. Идея в том, что таким системам мало просто дать сильную модель: им нужны среда для проверки хода рассуждений, сигналы экспертной оценки и управление качеством во время работы.
Почему проект выглядит недооценённым: он решает одну из самых дорогих проблем на рынке — как сделать вертикальных агентов предсказуемыми там, где ошибка дорого стоит. При этом на Launch YC у проекта было всего 13 голосов, что очень мало для темы, которая напрямую упирается в надёжность корпоративного ИИ.
Источник: страница запуска
Vogent: Self-Learning Voice AI
Vogent строит голосовых агентов, которые улучшаются на основе неудачных реальных звонков. Вместо бесконечной ручной подстройки подсказок команда делает ставку на цикл, где система учится на сбоях и постепенно исправляет собственные слабые места в рабочих сценариях.
Почему это заслуживает большего внимания: рынок голосового ИИ переполнен обещаниями, но куда реже встречается акцент именно на самообучении после ошибок, а не на красивой демонстрации. Это более приземлённый и потенциально полезный подход для компаний, которым важна не витрина, а стабильность в операционной работе. При этом страница запуска собрала лишь 12 реакций — скромный результат для настолько прикладной идеи.
Источник: страница запуска
Оба проекта интересны тем, что работают не над очередной оболочкой вокруг модели, а над тем, чтобы ИИ-системы становились устойчивее после контакта с реальным миром. Именно такие тихие запуски нередко оказываются важнее громких релизов, потому что закрывают фундаментальные сбои, без которых массовое внедрение агентов быстро упирается в потолок.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Для QA тут главный провал может быть не в самом рассуждении, а в разборе конфликтов: что делает система, когда экспертная оценка расходится с автоматической проверкой. Пока нет повторяемого прогона на спорных кейсах и истории регресса по ним, слово «надёжность» здесь рано считать измеренным.