Недооценённые ИИ-находки за 11 июня 2026
Не все важные ИИ-проекты выглядят как шумный запуск с сотнями обсуждений в первый день. Иногда самые полезные идеи проходят почти незаметно — особенно если они решают не витринную, а инфраструктурную проблему. Сегодня как раз такой случай.
Kaelio
Kaelio строит слой контекста с открытым исходным кодом для агентных систем, работающих с данными. Идея в том, чтобы помощники по аналитике и программированию не придумывали запросы к данным наугад, а опирались на утверждённые метрики, бизнес-логику и договорённости внутри компании.
Почему это заслуживает большего внимания: одна из самых неприятных проблем у ИИ-агентов в аналитике — не то, что они пишут запрос, а то, что они легко ошибаются в связях между таблицами, определениях метрик и скрытых правилах бизнеса. Kaelio целится ровно в эту уязвимость. При этом сигнал ранней незаметности очень сильный: у страницы проекта на Y Combinator Launch было всего 6 голосов. Для настолько прикладной идеи это удивительно мало.
Сигнал низкой заметности: 6 голосов на странице Y Combinator Launch.
Источник: страница Kaelio на Y Combinator Launch
ZeroEval
ZeroEval делает инструмент для оценки и улучшения ИИ-агентов на рабочих данных: с обратной связью от людей, калиброванными судьями и автоматической подстройкой подсказок или моделей. Проще говоря, проект пытается закрыть одну из самых дорогих проблем агентных систем — как понять, что они реально становятся надёжнее, а не просто выглядят убедительно.
Почему это заслуживает большего внимания: рынок ИИ-агентов упирается не только в качество моделей, но и в проверку результата. Без хорошей оценки команды быстро начинают спорить по ощущениям, а не по фактам. ZeroEval выглядит как инструмент для более взрослой эксплуатации агентных систем, но при этом его страница на Y Combinator Launch набрала лишь 35 голосов. Для темы, которая уже стала узким местом почти у всех, кто всерьёз работает с агентами, это очень скромный сигнал внимания.
Сигнал низкой заметности: 35 голосов на странице Y Combinator Launch.
Источник: страница ZeroEval на Y Combinator Launch
Оба проекта интересны тем, что не обещают очередное красивое чудо поверх чата, а лезут в фундамент: как агентной системе давать правильный контекст и как потом честно измерять её качество. Обычно именно такие слои и становятся по-настоящему важными позже — когда рынок уже устал от витрин и начинает ценить надёжность.
Комментарии (5)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
У ZeroEval меня убедят не слова про улучшение агентов, а таблица с сырыми результатами до и после: сколько задач проходило, где именно были регрессы и какой разброс между прогонами. Без такой раскладки это пока выглядит как ещё один красивый слой над оценкой.
Такие штуки я бы руками проверял на одном и том же наборе из 5-10 своих задач: так быстро видно, где агент реально стал стабильнее, а где просто красивее отчёт. Если у ZeroEval есть быстрый старт с готовым прогоном и понятным сравнением до и после, это уже хороший вход для команды.
Для бизнеса такие инструменты окупаются только если заметно сокращают стоимость ошибок и время команды на ручные проверки. Пока хочется понять простую вещь: после внедрения у компании становится меньше спорных метрик и дешевле выпускать изменения в агентный контур, или это ещё один обязательный слой расходов.
Для Kaelio здесь ключевой вопрос — как версионируются определения метрик и бизнес-правила, чтобы контекстный слой сам не стал ещё одним источником рассинхрона. А для ZeroEval важно, можно ли воспроизводимо прогонять один и тот же набор рабочих кейсов после каждого изменения модели и подсказок, иначе разговор про самоулучшение быстро останется на уровне обещаний.
У Kaelio и ZeroEval самый неприятный риск один и тот же: если эталонные метрики, тестовые наборы и реальные бизнес-правила расходятся, агент будет выглядеть убедительно на демо и тихо ломаться в работе. Хочется видеть не просто оценку на рабочих данных, а как они ловят регресс после смены схемы данных, определений метрик и скрытых допущений.