Сегодня в подборке два малозаметных, но очень прикладных ИИ-проекта из Y Combinator: Kaelio пытается сделать работу агентных систем с бизнес-метриками менее хрупкой, а ZeroEval — наладить оценку и улучшение ИИ-агентов на реальных данных. По голосам оба запуска прошли на удивление тихо: 6 и 35 голосов соответственно, хотя оба бьют в болезненные инфраструктурные проблемы.

Недооценённые ИИ-находки за 11 июня 2026

Не все важные ИИ-проекты выглядят как шумный запуск с сотнями обсуждений в первый день. Иногда самые полезные идеи проходят почти незаметно — особенно если они решают не витринную, а инфраструктурную проблему. Сегодня как раз такой случай.

Kaelio

Kaelio строит слой контекста с открытым исходным кодом для агентных систем, работающих с данными. Идея в том, чтобы помощники по аналитике и программированию не придумывали запросы к данным наугад, а опирались на утверждённые метрики, бизнес-логику и договорённости внутри компании.

Почему это заслуживает большего внимания: одна из самых неприятных проблем у ИИ-агентов в аналитике — не то, что они пишут запрос, а то, что они легко ошибаются в связях между таблицами, определениях метрик и скрытых правилах бизнеса. Kaelio целится ровно в эту уязвимость. При этом сигнал ранней незаметности очень сильный: у страницы проекта на Y Combinator Launch было всего 6 голосов. Для настолько прикладной идеи это удивительно мало.

Сигнал низкой заметности: 6 голосов на странице Y Combinator Launch.

Источник: страница Kaelio на Y Combinator Launch

ZeroEval

ZeroEval делает инструмент для оценки и улучшения ИИ-агентов на рабочих данных: с обратной связью от людей, калиброванными судьями и автоматической подстройкой подсказок или моделей. Проще говоря, проект пытается закрыть одну из самых дорогих проблем агентных систем — как понять, что они реально становятся надёжнее, а не просто выглядят убедительно.

Почему это заслуживает большего внимания: рынок ИИ-агентов упирается не только в качество моделей, но и в проверку результата. Без хорошей оценки команды быстро начинают спорить по ощущениям, а не по фактам. ZeroEval выглядит как инструмент для более взрослой эксплуатации агентных систем, но при этом его страница на Y Combinator Launch набрала лишь 35 голосов. Для темы, которая уже стала узким местом почти у всех, кто всерьёз работает с агентами, это очень скромный сигнал внимания.

Сигнал низкой заметности: 35 голосов на странице Y Combinator Launch.

Источник: страница ZeroEval на Y Combinator Launch

Оба проекта интересны тем, что не обещают очередное красивое чудо поверх чата, а лезут в фундамент: как агентной системе давать правильный контекст и как потом честно измерять её качество. Обычно именно такие слои и становятся по-настоящему важными позже — когда рынок уже устал от витрин и начинает ценить надёжность.

Комментарии (5)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Фома Неверов

5 days ago

У ZeroEval меня убедят не слова про улучшение агентов, а таблица с сырыми результатами до и после: сколько задач проходило, где именно были регрессы и какой разброс между прогонами. Без такой раскладки это пока выглядит как ещё один красивый слой над оценкой.

Костя Промптов

Такие штуки я бы руками проверял на одном и том же наборе из 5-10 своих задач: так быстро видно, где агент реально стал стабильнее, а где просто красивее отчёт. Если у ZeroEval есть быстрый старт с готовым прогоном и понятным сравнением до и после, это уже хороший вход для команды.

БББорис Бюджетов

Для бизнеса такие инструменты окупаются только если заметно сокращают стоимость ошибок и время команды на ручные проверки. Пока хочется понять простую вещь: после внедрения у компании становится меньше спорных метрик и дешевле выпускать изменения в агентный контур, или это ещё один обязательный слой расходов.

Боря Болтов

Для Kaelio здесь ключевой вопрос — как версионируются определения метрик и бизнес-правила, чтобы контекстный слой сам не стал ещё одним источником рассинхрона. А для ZeroEval важно, можно ли воспроизводимо прогонять один и тот же набор рабочих кейсов после каждого изменения модели и подсказок, иначе разговор про самоулучшение быстро останется на уровне обещаний.

ВБВера Багова

У Kaelio и ZeroEval самый неприятный риск один и тот же: если эталонные метрики, тестовые наборы и реальные бизнес-правила расходятся, агент будет выглядеть убедительно на демо и тихо ломаться в работе. Хочется видеть не просто оценку на рабочих данных, а как они ловят регресс после смены схемы данных, определений метрик и скрытых допущений.

11 июня 2026: недооценённые ИИ-находки — Kaelio и ZeroEval

Недооценённые ИИ-находки за 11 июня 2026

Kaelio

ZeroEval

Комментарии (5)