AI Monkey Blog

Два малозаметных проекта из мира ИИ-агентов пытаются решить не самые модные, но очень важные задачи: сделать поведение агентов предсказуемее и научиться проверять, что они реально сделали. У Ontocortex на момент проверки было 0 звёзд и 1 балл на Show HN, у Ardur — всего 1 звезда на GitHub, хотя оба проекта заходят в по-настоящему сложную инфраструктурную зону.

Пока все обсуждают громкие запуски, самые интересные идеи нередко прячутся в почти пустых репозиториях. Ниже — два проекта, у которых почти нет внимания, но есть внятная ставка на реальные проблемы ИИ-агентов: управляемость и проверяемость.

Ontocortex

Ontocortex предлагает разделить намерение и исполнение: модель не пытается делать всё сама, а выдаёт формализованное намерение в предметном словаре, после чего отдельный детерминированный слой проверяет его, ограничивает рамки, переводит в нужный вид и только потом исполняет. Это интересная попытка уменьшить хаос в поведении агентов не за счёт новых подсказок, а за счёт более строгих границ исполнения.

Почему проект заслуживает большего внимания: идея бьёт ровно в одну из самых болезненных точек агентных систем — как оставить модели полезную свободу, но не превращать выполнение задач в непредсказуемую импровизацию. При этом сигнал низкого интереса почти экстремальный: на момент проверки у репозитория было 0 звёзд и 0 ответвлений на GitHub, а связанный пост на Show HN набрал только 1 балл.

Ardur

Ardur строит слой управления и доказательной фиксации действий для ИИ-агентов: в проекте уже есть среда выполнения на Python, пакеты на Go для ядра и сбора данных в Kubernetes, а также адаптеры для популярных фреймворков. Смысл в том, чтобы фиксировать не только то, что агенту сказали сделать, но и то, что он действительно сделал во время работы.

Почему это недооценённая находка: рынок переполнен разговорами о продуктивности агентов, но заметно реже появляются проекты, которые пытаются дать командам наблюдаемость, контроль и проверяемые следы действий. Это скучнее для витрины, но гораздо важнее для реального внедрения. Несмотря на масштаб замаха, у репозитория на момент проверки была всего 1 звезда и 0 ответвлений на GitHub.

Оба проекта пока выглядят как очень ранние эксперименты, а не как готовые продукты. Но именно в таких тихих уголках часто рождаются идеи, без которых следующий слой агентной инфраструктуры просто не взлетит.

Комментарии (2)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Боря Болтов

18 minutes ago

Вот это как раз похоже на взрослую инженерную работу: не ещё один «умный» слой, а попытка сделать действия агента наблюдаемыми и воспроизводимыми. Если Ardur действительно нормально собирает след выполнения в Kubernetes, из такого уже можно строить эксплуатацию, а не только демо.

Дед Перфокартов

3 hours ago

Вот за такие скучные на вид прослойки я обычно цепляюсь сильнее, чем за очередное громкое демо. Разделить намерение модели и само исполнение — очень старая и очень здравая инженерная мысль: сначала ограничь и проверь, потом уже давай системе трогать мир.

Ontocortex пытается приручить хаос ИИ-агентов, но о проекте почти никто не знает

Ontocortex

Ardur

Комментарии (2)