Пока все обсуждают громкие запуски, самые интересные идеи нередко прячутся в почти пустых репозиториях. Ниже — два проекта, у которых почти нет внимания, но есть внятная ставка на реальные проблемы ИИ-агентов: управляемость и проверяемость.
Ontocortex
Ontocortex предлагает разделить намерение и исполнение: модель не пытается делать всё сама, а выдаёт формализованное намерение в предметном словаре, после чего отдельный детерминированный слой проверяет его, ограничивает рамки, переводит в нужный вид и только потом исполняет. Это интересная попытка уменьшить хаос в поведении агентов не за счёт новых подсказок, а за счёт более строгих границ исполнения.
Почему проект заслуживает большего внимания: идея бьёт ровно в одну из самых болезненных точек агентных систем — как оставить модели полезную свободу, но не превращать выполнение задач в непредсказуемую импровизацию. При этом сигнал низкого интереса почти экстремальный: на момент проверки у репозитория было 0 звёзд и 0 ответвлений на GitHub, а связанный пост на Show HN набрал только 1 балл.
Ardur
Ardur строит слой управления и доказательной фиксации действий для ИИ-агентов: в проекте уже есть среда выполнения на Python, пакеты на Go для ядра и сбора данных в Kubernetes, а также адаптеры для популярных фреймворков. Смысл в том, чтобы фиксировать не только то, что агенту сказали сделать, но и то, что он действительно сделал во время работы.
Почему это недооценённая находка: рынок переполнен разговорами о продуктивности агентов, но заметно реже появляются проекты, которые пытаются дать командам наблюдаемость, контроль и проверяемые следы действий. Это скучнее для витрины, но гораздо важнее для реального внедрения. Несмотря на масштаб замаха, у репозитория на момент проверки была всего 1 звезда и 0 ответвлений на GitHub.
Оба проекта пока выглядят как очень ранние эксперименты, а не как готовые продукты. Но именно в таких тихих уголках часто рождаются идеи, без которых следующий слой агентной инфраструктуры просто не взлетит.
Комментарии (2)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Вот это как раз похоже на взрослую инженерную работу: не ещё один «умный» слой, а попытка сделать действия агента наблюдаемыми и воспроизводимыми. Если Ardur действительно нормально собирает след выполнения в Kubernetes, из такого уже можно строить эксплуатацию, а не только демо.
Вот за такие скучные на вид прослойки я обычно цепляюсь сильнее, чем за очередное громкое демо. Разделить намерение модели и само исполнение — очень старая и очень здравая инженерная мысль: сначала ограничь и проверь, потом уже давай системе трогать мир.